autoresearch

🔥 GitHub 热门 AI 开源项目

AI Agent 自主运行 LLM 训练研究 · Karpathy 出品

🤖 AI Agent
🧠 深度学习
⚡ 单GPU
🔬 自动研究

📌项目简介

autoresearch 是 AI 大神 Andrej Karpathy（前 Tesla AI 总监、OpenAI 创始成员）开源的颠覆性项目——让 AI Agent 在单张 GPU 上自主运行深度学习实验，自动修改代码、训练模型、评估结果，通宵跑完 100+ 实验，早上起来收报告。这不是科幻，是现在就能用的真实工具。

⚙️安装要求和过程

环境要求

单张 NVIDIA GPU（测试过 H100）、Python 3.10+、uv 包管理器

快速安装（4步搞定）

# 1. 安装 uv（如果还没有）
curl -LsSf https://astral.sh/uv/install.sh | sh

# 2. 安装依赖
uv sync

# 3. 下载训练数据 + 训练 BPE 分词器（一次性，约2分钟）
uv run prepare.py

# 4. 手动跑一次训练实验（约5分钟）
uv run train.py

启动 AI Agent 自主研究

在仓库目录下启动 Claude Code / Codex 等 AI Agent（关闭所有权限确认），然后发送提示：

Hi have a look at program.md and let's kick off a new experiment!
let's do the setup first.

低配设备适配

没有 H100？社区已有 macOS、MLX、Windows RTX 等 Fork，MacBook 也能跑！

⭐核心功能

🤖

AI Agent 自主研究

Agent 自动修改 train.py，训练5分钟，检查 val_bpb 是否下降，保留或丢弃改动，不断迭代。你只需要睡前启动，早上收实验日志。

⏱️

固定时间预算（公平对比）

每次实验固定5分钟（wall clock），不管 Agent 怎么改模型架构、batch size，所有实验都可直接对比。约12次实验/小时，通宵可跑100+次。

📁

极简设计（只改一个文件）

整个仓库只有3个核心文件：prepare.py（固定）、train.py（Agent 修改）、program.md（人类修改）。diff 清晰可审查，不会失控。

🔌

支持任意 AI Agent

Claude Code、OpenAI Codex、Gemini CLI、OpenClaw……任何能读写文件的 AI Agent 都能用。program.md 本质上是一个超轻量级的”技能提示词”。

🌍

活跃社区 Fork（多平台支持）

macOS（M系列芯片）、Windows（RTX显卡）、MLX框架均有社区 Fork，低配设备也能体验 AI 自主研究。

🚀典型使用场景

🌙 场景一：夜间自动实验

下班前启动 Agent，让它通宵自主实验。第二天早上，你会收到一份完整的实验日志，记录每次改动、训练曲线和验证集效果。相当于白得一个不知疲倦的研究生。

🔬 场景二：快速模型架构探索

想尝试不同的注意力机制、优化器组合或模型深度？让 Agent 在固定时间预算内自动探索各种组合，快速找到最优配置，省去大量手工调参时间。

📚 场景三：学习深度学习最佳实践

即使是深度学习初学者，也可以阅读 Agent 的修改记录和实验日志，从中学习哪些改动有效、哪些无效，快速积累建模经验。

💡推荐理由

📦下载地址

GitHub 仓库：https://github.com/karpathy/autoresearch

社区 Fork（macOS）：https://github.com/miolini/autoresearch-macos

社区 Fork（Windows RTX）：https://github.com/jsegov/autoresearch-win-rtx

Karpathy 推文介绍：https://x.com/karpathy/status/2029701092347630069

🔔 关注我们，每周分享最新 AI 开源项目！

GitHub 热门 AI 项目持续更新中…

标签： autoresearch

【开源推荐】autoresearch：86K+ Stars！Karpathy开源AI自主研究工具，让Agent通宵帮你优化LLM训练