标签: autoresearch

  • 【开源推荐】autoresearch:86K+ Stars!Karpathy开源AI自主研究工具,让Agent通宵帮你优化LLM训练

    【开源推荐】autoresearch:86K+ Stars!Karpathy开源AI自主研究工具,让Agent通宵帮你优化LLM训练

    🔥 GitHub 热门 AI 开源项目

    autoresearch

    AI Agent 自主运行 LLM 训练研究 · Karpathy 出品

    🤖 AI Agent
    🧠 深度学习
    ⚡ 单GPU
    🔬 自动研究

    📌项目简介

    autoresearch 是 AI 大神 Andrej Karpathy(前 Tesla AI 总监、OpenAI 创始成员)开源的颠覆性项目——让 AI Agent 在单张 GPU 上自主运行深度学习实验,自动修改代码、训练模型、评估结果,通宵跑完 100+ 实验,早上起来收报告。这不是科幻,是现在就能用的真实工具。

    ⚙️安装要求和过程

    1

    环境要求

    单张 NVIDIA GPU(测试过 H100)、Python 3.10+、uv 包管理器

    2

    快速安装(4步搞定)

    # 1. 安装 uv(如果还没有)
    curl -LsSf https://astral.sh/uv/install.sh | sh
    
    # 2. 安装依赖
    uv sync
    
    # 3. 下载训练数据 + 训练 BPE 分词器(一次性,约2分钟)
    uv run prepare.py
    
    # 4. 手动跑一次训练实验(约5分钟)
    uv run train.py

    3

    启动 AI Agent 自主研究

    在仓库目录下启动 Claude Code / Codex 等 AI Agent(关闭所有权限确认),然后发送提示:

    Hi have a look at program.md and let's kick off a new experiment!
    let's do the setup first.

    4

    低配设备适配

    没有 H100?社区已有 macOSMLXWindows RTX 等 Fork,MacBook 也能跑!

    核心功能

    🤖

    AI Agent 自主研究

    Agent 自动修改 train.py,训练5分钟,检查 val_bpb 是否下降,保留或丢弃改动,不断迭代。你只需要睡前启动,早上收实验日志。

    ⏱️

    固定时间预算(公平对比)

    每次实验固定5分钟(wall clock),不管 Agent 怎么改模型架构、batch size,所有实验都可直接对比。约12次实验/小时,通宵可跑100+次。

    📁

    极简设计(只改一个文件)

    整个仓库只有3个核心文件:prepare.py(固定)、train.py(Agent 修改)、program.md(人类修改)。diff 清晰可审查,不会失控。

    🔌

    支持任意 AI Agent

    Claude Code、OpenAI Codex、Gemini CLI、OpenClaw……任何能读写文件的 AI Agent 都能用。program.md 本质上是一个超轻量级的”技能提示词”。

    🌍

    活跃社区 Fork(多平台支持)

    macOS(M系列芯片)、Windows(RTX显卡)、MLX框架均有社区 Fork,低配设备也能体验 AI 自主研究。

    🚀典型使用场景

    🌙 场景一:夜间自动实验

    下班前启动 Agent,让它通宵自主实验。第二天早上,你会收到一份完整的实验日志,记录每次改动、训练曲线和验证集效果。相当于白得一个不知疲倦的研究生。

    🔬 场景二:快速模型架构探索

    想尝试不同的注意力机制、优化器组合或模型深度?让 Agent 在固定时间预算内自动探索各种组合,快速找到最优配置,省去大量手工调参时间。

    📚 场景三:学习深度学习最佳实践

    即使是深度学习初学者,也可以阅读 Agent 的修改记录和实验日志,从中学习哪些改动有效、哪些无效,快速积累建模经验。

    💡推荐理由

    Karpathy 出品,必属精品。autoresearch 最震撼的地方在于它把”AI 做 AI 研究”从科幻变成了现实——而且代码极简,整个训练代码只有一个 train.py,清晰到可以作为学习材料。

    固定5分钟时间预算的设计非常巧妙:不管怎么改模型,每次实验成本相同,结果可直接对比。这让 Agent 的”研究”变得可解释、可复现,而不是黑盒魔法。

    ⚠️ 注意:目前官方版本需要 NVIDIA GPU,低配设备建议使用社区 Fork。但无论如何,这个项目代表的”AI 自主研究”方向,值得每个 AI 从业者关注和思考。

    📦下载地址

    🔔 关注我们,每周分享最新 AI 开源项目!

    GitHub 热门 AI 项目持续更新中…