标签: Andrej Karpathy

  • 卡帕西去了Anthropic,AI顶尖人才争夺战彻底打响了

    5月19日晚上11点,Andrej Karpathy在X上发了一条短得不能再短的帖子:”我已加入Anthropic。”

    这条消息瞬间在AI圈炸开了锅。要知道,这可是OpenAI的联合创始人、特斯拉前AI总监、深度学习领域最具影响力的人物之一。他的每一次职业变动,都牵动着整个行业的神经。

    他到底什么来头

    1986年出生于捷克斯洛伐克的Karpathy,履历表亮得晃眼——多伦多大学双学位、不列颠哥伦比亚大学硕士、斯坦福博士(师从李飞飞),期间还和李飞飞一起创立了斯坦福第一门深度学习课程CS231n。

    博士毕业后他加入OpenAI成为创始成员,2017年被马斯克挖去特斯拉,一手搭建了FSD和Autopilot的神经网络方案,把特斯拉的自动驾驶从雷达方案硬生生推成了纯视觉路线。2022年离开特斯拉后,他短暂回归OpenAI参与改进GPT-4,2024年又出来创业做了Eureka Labs,主打AI教育。

    今年初他随口造了个词叫”vibe coding”(氛围编程),结果火遍全球,连他自己后来都改口叫”agentic engineering”了。

    “未来几年大语言模型的技术进展将会相当具有突破性。”——Andrej Karpathy

    去了Anthropic做什么

    根据Anthropic的官方说明,Karpathy加入后将进入公司最核心的预训练团队,向该团队负责人Nicholas Joseph汇报。等等,Nicholas Joseph是谁?巧了,他也是OpenAI的前核心成员。

    更有意思的是,Karpathy的具体工作是——帮助组建一支新团队,专注于用Claude本身来加速预训练研究。说白了就是”用AI来造AI”,这让他在Anthropic的工作形成了一个有趣的闭环。

    Anthropic内部已经有人在表达兴奋了——”Claude Code之父”Boris Cherny公开表示非常欢迎Karpathy的加入。

    为什么是现在

    这个时间节点颇为微妙。Anthropic正在筹备新一轮融资,估值可能冲到9000亿美元,而OpenAI那边刚摆平了马斯克的诉讼,正在为IPO铺路。

    Karpathy的加盟,被外界解读为Anthropic在人才争夺战中的一次重大胜利。有网友把这个事件比作”杜兰特加入73胜的勇士队”,还有人说这是”马拉多纳本人来了”。

    从更大的视角看,顶尖AI人才的流动方向,往往预示着接下来几年哪家公司的技术会走得更快。Karpathy选择Anthropic而不是回OpenAI,这个信号本身就很值得玩味。


    顺便说一句,Karpathy在官宣帖文中还提到,他依然对教育事业充满热情,计划在适当的时候重新投入教育相关工作。Eureka Labs会不会在将来以某种形式和Anthropic产生联动,这是一个值得持续观察的看点。

  • Karpathy投奔Anthropic,OpenAI重组冲刺IPO:这一周AI圈发生了什么

    这一周 AI 圈的热闹程度,差不多赶得上去年的同一时期。Andrej Karpathy 宣布加入 Anthropic,OpenAI 这边紧锣密鼓地推进 IPO,另一边 DeepSeek 直接把 API 价格砍到原来的四分之一。三件事摆在一起看,你会发现 AI 行业的竞争节奏已经完全变了。

    Karpathy 的”二次出走”

    5月19日,Karpathy 在社交媒体上发了短短一行字:”Personal update: I’ve joined Anthropic.” 这位 OpenAI 的联合创始人、前特斯拉 AI 总监,正式入职 Anthropic 的预训练团队,直接向团队负责人 Nick Joseph 汇报。

    说”二次出走”是因为 Karpathy 的职业生涯一直在几个顶级 AI 实验室之间游走。他最早是 OpenAI 的创始成员之一,后来去了特斯拉带队 Autopilot,离开特斯拉后又回到了 OpenAI。现在他选择 Anthropic,而不是回 OpenAI,这个信号值得玩味。

    Andrej Karpathy 是以个人贡献者身份加入的,不是来当管理者的。他要组建一个”用 Claude 本身来加速预训练研究”的小组——意思是让 AI 帮忙做 AI 研究,这个思路很 Anthropic。

    Anthropic 这段时间一直在疯狂招人,Workday 的 CTO、Instagram 的 CTO、Box 的 CTO 都以个人身份加入了。但 Karpathy 无疑是其中名头最响的一个。他加入的预训练团队,恰恰是大模型”底座”最核心的地方。

    OpenAI 的 IPO 冲刺与内部大重组

    就在 Karpathy 官宣的同一周,OpenAI 内部发生了一次大规模重组。联合创始人兼总裁 Greg Brockman 正式接管全部产品战略,取代因病休假的 AGI 部署负责人 Fidji Simo。Brockman 在全员备忘录里说得很直白:要建设”一个统一的 Agent 平台”。

    视频生成产品 Sora 同日关停,理由是算力消耗与营收严重不匹配。产品负责人 Kevin Weil 和技术负责人 Bill Peebles 随之离开。这些人事变动的背后,是 OpenAI 正在为 IPO 做最后准备。

    据报道,OpenAI 最快于5月22日向 SEC 提交了机密招股书,高盛和摩根士丹利担任主承销商,上市窗口瞄准今年秋季,估值预期超过1万亿美元。如果成功,这将是 AI 时代最具标志性的上市事件。

    OpenAI重组与IPO规划
    OpenAI 产品线重组示意图(来源:新浪财经)

    但财务数据也同步披露了出来:Q1 营收57亿美元,调整后经营利润率为负122%。也就是说每赚1美元要亏1.22美元。用户增长也在放缓,ChatGPT 周活9.05亿,低于2月峰值9.2亿。IPO 之前,OpenAI 需要给资本市场讲一个更动人的盈利故事。

    好消息是,马斯克对 OpenAI 的诉讼在同一周被加州联邦陪审团驳回,理由是全部索赔已过诉讼时效。IPO 路上一块巨大的法律绊脚石,就这样消失了。

    DeepSeek 的”永久降价”到底意味着什么

    5月22日,DeepSeek 官方宣布:V4-Pro 模型的2.5折优惠在5月31日到期后,将直接锁定为原价的四分之一,不再恢复原价。调整后输入价0.435美元/百万 token,输出0.87美元/百万 token。

    这个定价是什么概念?比 GPT-5.5 便宜约98%。而且 DeepSeek V4-Pro 总参数1.6万亿,每次推理激活490亿参数,是目前参数量最大的开放权重模型。用华为昇腾芯片跑推理,成本结构和英伟达路线完全不同,这就是降价的底气。

    DeepSeek 这一招”永久降价”,本质上是用价格战倒逼整个行业重新审视推理成本。如果你用极低的价格提供顶尖水平的模型能力,竞争对手要么跟进,要么失去价格敏感的开发者和企业用户。

    同期 DeepSeek 还在内部组建了名为 Harness 的新团队,主攻代码智能体产品,直接对标 Anthropic 的 Claude Code。V4-Pro 全部运行在华为昇腾芯片上,这种”芯片+模型+应用”的全栈打法,是目前美国实验室做不到的。

    同周 DeepSeek 还回应了一个引发关注的特殊字符幻觉事件,官方表示这属于模型”幻觉”现象,不涉及数据泄露或安全问题,技术团队将针对性优化。


    三件事放在一起看

    Karpathy 加入 Anthropic,说明顶级研究者认为 Anthropic 的技术路线更有前途。OpenAI 推进 IPO,说明资本市场对 AI 的期待已经到了必须兑现的时刻。DeepSeek 永久降价,说明中国 AI 实验室正在用成本优势重构全球竞争格局。

    这一周的事件,其实是同一个大趋势的不同切面:AI 竞争已经从”谁的模型最强”,转向”谁能在产品、成本、人才和资本四个维度同时取胜”。目前来看,还没有任何一家实验室能在这四个维度上同时领先。

  • Anthropic拿到300亿美元,估值飙到9000亿

    Anthropic拿到300亿美元,估值飙到9000亿

    这周AI圈最炸的新闻,是Anthropic正在敲定一笔最高300亿美元的融资,估值直接干到9000亿美元以上。完成后,它将正式把OpenAI从”全球最有价值AI公司”的宝座上拉下来——要知道OpenAI今年3月的估值才8520亿美元。

    更夸张的是,这家公司今年2月的估值还只有3800亿美元。不到4个月,估值直接翻倍。背后支撑这个数字是真金白银的营收:Anthropic预计2026年Q2营收达到109亿美元,比Q1的48亿美元增长了130%。换句话说,它第一次实现了季度运营盈利。

    Anthropic Q2 2026营收预计109亿美元,较Q1增长130%,首次实现季度运营盈利。投资机构看好其18个月内年营收突破500亿美元。

    谁在投?

    这一轮由红杉、Dragoneer、Greenoaks、Altimeter联合领投。这些名字在硅谷创投圈都是顶级玩家,他们下注的逻辑很简单:Anthropic的Claude模型在企业市场打得OpenAI有点招架不住,而且Anthropic的安全叙事在监管趋严的大环境下反而成了竞争优势。

    还有一个细节值得玩味:SpaceX的IPO招股书里披露,Anthropic将向SpaceX支付每月12.5亿美元的GPU算力费用,2029年5月前总计450亿美元。马斯克一边公开怼Anthropic,一边自己的公司收着Anthropic的算力支票,这个画面有点意思。

    卡帕西加入了

    融资消息之外,另一个信号是Andrej Karpathy宣布加入Anthropic,负责重建预训练研究团队。作为OpenAI联合创始人、前特斯拉自动驾驶负责人,Karpathy在AI研究圈的分量不用多说。他的去向本身就是对Anthropic研究方向的背书。


    教皇也来站台

    更有意思的是,教皇良十四世发布了首份AI通谕《Magnifica Humanitas(壮丽的人类)》,主题是在AI时代保护人类个体尊严。这份通谕由Anthropic联合创始人Christopher Olah共同发布。教皇选择跟Anthropic合作而不是谷歌或OpenAI,释放的信号很明确:梵蒂冈认可Anthropic的AI安全理念。

    这件事的象征意义大于实际影响,但对于一家AI公司来说,被天主教会选为AI伦理的对话伙伴,在品牌层面是相当大的加分项。

    OpenAI这边在干嘛

    就在Anthropic融资消息刷屏的同时,OpenAI向SEC提交了保密的IPO申请(S-1文件),计划在2026年Q4到2027年初上市。两家公司的路径开始分化:Anthropic在一级市场拿钱拿到手软,OpenAI则准备去公开市场接受考验。

    不过OpenAI也不是没有动作。据报道,五角大楼正在测试OpenAI和谷歌的模型,考虑把它们加入到涉密工作流中。此前Anthropic因为是国防部首选AI供应商,但今年初Anthropic因为伦理原因拒绝了一份国防部合同,于是五角大楼开始找备选方案。

  • andrej-karpathy/skills:144.5k Stars!基于Karpathy编程哲学的Claude Code技能集合,让AI帮你避开编程陷阱

    andrej-karpathy/skills:144.5k Stars!基于Karpathy编程哲学的Claude Code技能集合,让AI帮你避开编程陷阱

    🎯 项目简介

    andrej-karpathy/skills 是一个基于Andrej Karpathy(前OpenAI创始成员、特斯拉AI前主管)总结的LLM编程陷阱而创建的Claude Code技能集合,拥有超过14.4万Stars,帮助AI编程助手避免常见错误,提升代码质量。


    💻 安装要求和过程

    环境要求

    • Claude Code 或兼容的AI编程助手
    • 支持技能导入功能

    快速安装

    # 克隆仓库
    git clone https://github.com/multica-ai/andrej-karpathy-skills.git
    
    # 进入目录
    cd andrej-karpathy-skills
    
    # 将 CLAUDE.md 文件复制到你的项目根目录
    # Claude Code 会自动读取该文件作为行为规则

    ✨ 核心功能

    1. 🎯 避免LLM编程陷阱:基于Karpathy总结的常见错误模式,帮助AI生成更可靠的代码
    2. 📝 最佳实践集成:内置经过验证的编程模式和架构决策
    3. 🔧 Claude Code优化:专门为Claude Code调优的技能集合
    4. 🚀 提升代码质量:减少调试时间,提高代码可维护性
    5. 📚 持续更新:跟随LLM能力演进,持续添加新的最佳实践

    🎨 典型使用场景

    场景1:AI辅助代码审查

    在代码审查阶段,让Claude Code加载这些技能,自动识别代码中的潜在问题,如性能陷阱、安全漏洞、反模式等。

    场景2:学习LLM编程

    对于刚开始使用AI辅助编程的开发者,这个项目是一个完美的”避坑指南”,帮助你理解LLM在编程时的常见失误。

    场景3:团队标准化

    在团队中统一配置这些技能,确保所有成员在使用AI编程助手时遵循相同的最佳实践。


    💡 推荐理由

    Andrej Karpathy作为深度学习领域的先驱,其编程哲学和对LLM的理解非常深刻。这个项目将他的经验转化为可执行的技能,让每个开发者都能受益于顶级专家的见解。

    特别适合:

    • 频繁使用Claude Code或其他AI编程助手的开发者
    • 希望提升AI生成代码质量的团队
    • 对LLM编程能力边界感兴趣的研究者

    这个项目最打动我的是其实用性——不是空洞的理论,而是可以直接提升日常编程效率的实战技巧。144k+的Stars数也证明了社区对这类实用资源的渴求。


    📥 下载地址


    如果你正在使用Claude Code或其他AI编程助手,强烈建议试试这个技能集合。它可能会改变你对AI辅助编程的认知!

  • Andrej Karpathy官宣加入Anthropic,OpenAI联合创始人为何选择竞对

    5月19日,AI圈被一条推文炸开了锅——Andrej Karpathy在X上官宣了自己加入Anthropic的消息。这位OpenAI的联合创始人、特斯拉前AI负责人,选择在这时候加入Claude的缔造者,让不少人感到意外。

    「我认为LLM前沿领域接下来的几年会特别关键。我很兴奋能加入这里的团队,重新回到研发一线。」——Andrej Karpathy

    他到底是谁

    karpathy在AI圈子里的分量,不需要太多介绍。他是OpenAI的创始成员之一,早年深耕深度学习和计算机视觉,2017年被马斯克挖去特斯拉,一手搭建了FSD(全自动驾驶)和Autopilot的核心团队。2022年离开特斯拉后,他短暂回归OpenAI一年,2024年又出来创立了Eureka Labs,想用AI助手做教育。

    他还有一门非常出名的在线课程《Neural Networks: Zero to Hero》,教学生从零开始用代码实现神经网络,在YouTube上有一大批忠实观众。可以说,他是少数几个既能搞懂大模型理论、又能真正把大规模训练跑起来的人。

    Andrej Karpathy
    Andrej Karpathy(图源:San Francisco Chronicle / Getty Images)

    在Anthropic做什么

    Karpathy本周正式入职Anthropic,在Nick Joseph的带领下专注于预训练(pre-training)方向。预训练是构建前沿模型最烧钱、最吃算力的阶段,直接决定了Claude的核心知识和能力上限。

    Anthropic方面还透露,Karpathy会着手组建一个专门的团队,研究方向是用Claude来加速预训练研究本身。这个思路很清晰——用AI来研究AI,用更强的模型来帮自己训练下一代模型,形成研发飞轮。


    为什么是现在

    Anthropic在这个时间点挖来Karpathy,信号很明确:他们相信AI辅助的研发,而不仅仅是堆算力,才是接下来和OpenAI、Google竞争的关键。能同时懂LLM理论和大尺度训练实践的研究者,圈子里掰着手指头数得过来,Karpathy是一个。

    至于他创立的Eureka Labs,目前还没有进一步的消息。Karpathy在自己的帖子里也提到,他对教育的热情不会消失,未来会找时间继续这件事。

    • OpenAI联合创始人身份,深度参与GPT早期研发
    • 特斯拉FSD团队缔造者,大规模AI落地经验
    • 顶级AI教育者,Zero to Hero课程影响数十万开发者
    • 唯一同时深度参与过OpenAI和特斯拉AI全栈的领军人物

    同一天,Anthropic还宣布了另一位重磅人才的加入:网络安全老将Chris Rohlf加入了前沿红队(frontier red team)。Rohlf在Yahoo的”The Paranoids”安全团队成名,后来在Meta待了六年,职业生涯跨度超过20年。他在X上写道:「我们有一个真正的机会,用AI大幅改善网络安全」,并认为此刻加入Anthropic是正确的选择。

    两则人事消息同一天公布,怎么看都像是Anthropic在Google I/O期间的一次精准人才公关。不管是巧合还是刻意为之,Anthropic正在用行动告诉外界:他们不仅在模型能力上追,在人才吸引上也一点不虚。