博客

  • Anthropic要盈利了,AI烧钱的时代真的结束了?

    这话还得从Anthropic最新泄露的财务数据说起。2026年第二季度,这家公司的营收预计冲到109亿美元——什么概念?比去年同期的几亿美元翻了不知道多少倍,而且这季度还要首次实现运营盈利,大概5.59亿美元。

    Anthropic CEO Dario Amodei
    Anthropic CEO Dario Amodei(图源:CNBC)

    钱从哪来?

    核心答案就两个字:Claude。准确说,是Claude Code——他们的编程助手产品。这款东西的年化营收已经跑到25亿美元了,而且第一季度营收同比增幅是80倍,你没看错,80倍。

    企业和开发者对Claude的需求暴涨,直接导致Anthropic的基础设施绷不住了。公司自己在4月承认,算力”不可避免的紧张”,然后赶紧签了一堆算力采购协议。其中最夸张的是跟SpaceX签的那个——租下SpaceX在孟菲斯的Colossus 1数据中心全部算力,每个月付12.5亿美元,合同签到2029年5月,总金额450亿美元。

    450亿美元,这是目前AI行业公开的最大算力采购合同,没有之一。

    估值竞赛:Anthropic vs OpenAI

    Anthropic现在正在谈新一轮融资,投后估值预计9000亿美元。而它的老对手OpenAI最新私募估值大概是8500亿美元。这两家原本是一家人——Anthropic是2021年从OpenAI出走的高管和研究人员创立的,原因是对OpenAI的发展方向不满。

    现在两家还在赛跑另一个东西:IPO。Anthropic之前说考虑2026年上市,OpenAI更激进,据说这周就要秘密提交IPO招股书,目标9月公开上市,估值可能超过1万亿美元。

    一个有趣的转折

    Anthropic之前因为拒绝向美国军方开放所有合法用途的模型访问权限,被美国国防部拉黑了。结果4月他们推出了一个具备高级网络安全能力的Claude Mythos Preview模型,然后国防部那边又说”有可能”合作了。特朗普4月还公开表示支持,这事儿就这么戏剧性地反转了。


    回头看,Anthropic这个故事最有意思的地方在于:它证明了一件事,做AI基础模型不一定非要一直烧钱,只要产品找对了方向,企业级市场是愿意买单的。Claude Code这25亿美元的年化营收就是最好的证据。

    当然,代价是每个月要付SpaceX 12.5亿美元的算力账单。这生意到底划不划算,可能得等IPO之后看财报才知道。

  • 三部门发文规范AI智能体:70%普及率目标背后的信号

    AI智能体有了”游戏规则”

    既要求智能体的安全规范,又推动智能体创新发展。近日,国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》,这份文件给正在狂飙的AI Agent行业,立了一套清晰的游戏规则。

    智能体是啥?文件给了一个清晰的定义:具备自主感知、记忆、决策、交互与执行能力的智能系统。随着大模型等新一代人工智能技术迅猛发展,智能体正加速与网络空间、物理世界深度融合,深刻改变人类生产生活方式和社会治理模式。

    这份《意见》其实在回答一个核心问题:当AI开始替人做决策、执行任务,边界到底在哪里?

    四大举措,既划红线又给空间

    《意见》明确智能体发展要坚持安全可控、规范有序、创新驱动、应用牵引四大基本原则,并提出了4个方面的重要举措:

    一是夯实发展基础。完善技术底座,构建标准协议。这意味着国家层面会推动智能体相关的技术标准、通信协议、评价体系等基础设施的建设。

    二是守牢安全底线。明确产品准则,防范安全风险,完善治理体系,强化行业自律。智能体如果乱用、滥用,风险不小——比如自主决策导致经济损失、隐私泄露、甚至物理世界的伤害(如果是机器人智能体)。

    三是强化应用牵引。围绕科学研究、产业发展、提振消费、民生福祉、社会治理等方向,提出19个典型应用场景。国家不仅在管,更在推——给智能体找真实场景、落地产值。

    四是建设创新生态。促进产业合作,强化应用推广。智能体不是一家公司在做的,需要整个产业链协同。

    权限边界:谁来决策?

    对于智能体接管工作后的权限和边界,《意见》提出了一个很关键的要求:在遵守法律法规、尊重社会公德和伦理规范前提下,厘清三类决策方式的合理边界及所需权限:

    • 仅限用户本人决策——涉及重大利益、人身安全的,必须人来做最终决定
    • 需由用户授权决策——AI可以建议、可以执行,但关键节点要让人确认
    • 智能体自主决策——低风险、高频、规则清晰的,可以让AI自己跑

    这个划分其实非常务实。智能体不是要完全取代人,而是要在合适的边界内,最大化释放自动化价值。


    70%普及率目标,智能体要进千家万户

    《意见》支持落实新一代智能终端、智能体等应用普及率超70%的阶段性目标。这个数字很有意思——70%的普及率,意味着智能体要从”科技圈炒作概念”,变成”普通人也天天在用”的真实基础设施。

    对比一下:智能手机在中国的普及率大概是80%左右。也就是说,国家把智能体的战略地位,放到了和智能手机类似的量级。

    要达到70%普及率,光靠ToB的企业市场肯定不够,必须进入ToC消费场景——比如手机里的AI助手、家里的智能管家、车里的智能座舱、甚至是穿戴设备上的AI Agent。

    三部门联合发文,释放的信号非常明确:智能体不是”野生的”、不是”法外之地”,但国家也不想一管就死。规范和创新,要并举。

    对行业意味着什么?

    这份文件对AI智能体行业的影响,可能比很多人想象的更深远:

    对大模型公司来说,光有模型能力不够了,得想清楚智能体的安全边界怎么设计、用户授权机制怎么做、决策日志怎么留痕。

    对应用开发来说,19个典型应用场景相当于国家帮你想好了”往哪发力”——科研、产业、消费、民生、治理,都是真金白银的投入方向。

    对投资人来说,70%普及率目标是一个清晰的市场信号——智能体不是短期风口,而是中长期的国家战略方向。

    过去两年,AI行业讨论最多的是”谁的模型更聪明”。但智能体这个赛道,比的不是Benchmark分数,而是谁更懂场景、谁更安全可信、谁能让用户放心把任务交出去。

    这份《意见》,算是给这个竞争维度,正式按下了加速键。

  • Google I/O 2026:Agent时代正式开启,OpenAI最大对手回来了

    Google I/O 2026:从聊天机器人到数字分身

    过去几年Google I/O的主角,通常是某个模型、某个参数量、某个Benchmark。但今年不一样。整场两个多小时发布会,Google其实只反复讲了一件事:Agent。

    不是聊天机器人,不是”帮你回答问题”的AI,而是真正开始替用户持续执行任务的AI Agent。Google想做的,是把Gemini从一个App,彻底变成Google所有入口背后的操作系统。

    Google I/O 2026发布会
    Google I/O 2026全面押注AI Agent(图源:谷歌)

    Gemini Spark:你的24小时数字分身

    这次发布会上,Google几乎把整个产品体系全部Agent化了。最核心的新产品,是Gemini Spark。你可以把它理解成Google版”全天候数字分身”。它运行在Google Cloud虚拟机上,7×24小时在线。即便你关掉电脑、合上手机,它依然会在后台继续工作。

    Google现场演示了一个典型场景:用户正在组织社区派对,Spark会自动汇总邮件回复、统计每个人带什么东西、追踪谁还没确认、生成提醒邮件、同步Google Sheets,再自动做一份Google Slides宣传页,整个过程几乎不需要用户手动操作。

    Gemini Spark本质上正在把Agent从”问答工具”,变成”长期运行的执行系统”。过去的大模型,更像即时响应;现在的Agent,则开始拥有持续状态、任务记忆和跨应用执行能力。

    Gemini 3.5 Flash:把Agent成本打下来

    Agent最大的难点,从来都不只是能力,而是成本。因为Agent实在太烧Token了。Google披露的数据非常夸张:目前Google自家产品每月处理的Token,已经达到3200万亿个,同比增长7倍。

    于是,Gemini 3.5 Flash出现了。这可能是今年Google最关键的模型。因为它不再单纯强调”最强”,而是开始强调”最适合跑Agent”。Pichai现场直接算了一笔账:如果一家头部企业每天处理1万亿Token,把80%的工作负载从其它前沿模型迁移到Gemini 3.5 Flash,一年能省超过10亿美元。

    性能接近顶级前沿模型,输出速度快4倍,而成本只有同类模型的一半甚至更低。Google现在反复强调一句话:”你不需要再在质量和速度之间二选一。”因为Agent时代,比拼的已经不是一次回答,而是持续运行能力。

    Antigravity 2.0:93个Agent协作搭建操作系统

    如果说Flash负责”让Agent更便宜”,那Antigravity 2.0负责的,就是”让Agent真正开始干活”。它原本只是个AI Coding工具,现在Google直接把它升级成了多Agent协作平台。

    开发者可以同时调度多个Agent:一个写代码,一个生成设计素材,一个规划产品架构,一个测试漏洞,一个修Bug。Google现场甚至演示了一个极其夸张的案例:93个Agent并行协作,从零开始搭建一个可运行的操作系统。

    整个过程持续12小时,处理26亿Token,最终居然真的跑起来了,甚至还能运行Doom。而整个API成本不到1000美元。Google显然是在正面硬刚Claude Code和Codex。

    搜索彻底变了:从链接到执行结果

    Google这次还对搜索动了最大的一刀。Pichai说,这是Google搜索框25年来最大升级。因为搜索不再只是”搜答案”,而是开始”生成执行结果”。

    比如用户问:”黑洞如何影响时空?”以前搜索会给你十条蓝链,现在Google直接生成一个交互式可视化界面,你甚至可以拖动参数、实时观察变化。搜索开始变成实时生成式UI。

    Google还把Agent正式塞进搜索。用户未来可以创建Information Agent,让它24小时后台监控信息,比如跟踪股票、监控租房、盯球鞋发售、观察行业动态、追踪价格变化。Agent会自己搜、自己总结、自己更新。


    Google最恐怖的其实是生态

    但整场发布会真正最危险的地方,其实不是模型,而是Google的生态。因为OpenAI现在最强的,是模型能力;但Google最强的,是入口。

    搜索、Chrome、Android、YouTube、Gmail、Maps、Workspace……这些产品加起来,本身就是全球最大的互联网流量系统之一。而现在,Google正在把Gemini嵌入所有入口。

    这意味着,别人还在想办法”获取用户”,Google已经开始直接给几十亿用户发Agent。这是完全不同的战争维度。

    甚至连智能眼镜,Google也重新杀回来了。今年发布的Android XR眼镜,可以直接通过Gemini完成导航、下单、消息总结,用户甚至不用掏手机。

    Google正在试图让Gemini变成未来所有设备背后的默认智能层。搜索是入口,Chrome是入口,手机是入口,眼镜也是入口。Gemini则开始变成背后的统一大脑。

    AI行业开始进入”运营时代”

    今年Google I/O还有个特别明显的信号:AI行业正在从”模型竞赛”,进入”运营竞赛”。过去两年,行业核心是”谁更聪明”;现在开始变成谁更稳定、谁更便宜、谁更能规模化、谁更能真正接管工作流。

    Google今年资本支出预计高达1800亿~1900亿美元,第八代TPU开始拆成训练芯片和推理芯片。Google甚至公开强调:”我们要把最强AI,变成最便宜的AI。”这已经不是单纯的技术竞争,而是一次基础设施战争。


    过去几年,大家一直在讨论:AI到底什么时候能真正”替人做事”。Google这次给出的答案是:现在。而且它不准备只做一个聊天机器人。它想做的是,一个全天候运行、跨应用协作、持续执行任务、存在于所有入口里的超级Agent系统。

    Google迟到了。但现在,它终于开始全面开卷Agent。

  • Google DeepMind搞了个AI科研搭档,科学家要失业了?

    Google DeepMind搞了个”AI科研搭档”

    科学家做研究,最花时间的是啥?不是做实验,是”想假设”和”查文献”。一个靠谱的假设,往往要读几百篇论文、反复试错几个月甚至几年。Google DeepMind最近发布了一个叫Co-Scientist的多智能体系统,目标是让AI来干这件事。

    这个系统基于Gemini构建,但跟普通的聊天机器人不一样。它不是你问它答,而是真的在”做科研”——生成假设、跟自己”讨论”、再去文献里找证据验证,然后反复迭代,直到假设站得住脚。

    普通LLM的问题在于:它不确定时会瞎编,而且不会主动承认”这个结论有矛盾”。Co-Scientist的核心是,它能在多个专业智能体之间制造”争论”,让它们在讨论中发现逻辑漏洞,然后自己去文献里找证据修补。

    三个步骤,模拟科学家的思考过程

    Co-Scientist的运作分三个阶段:生成、讨论、验证。

    生成阶段,系统会根据你给的研究方向,产生一批可能的假设。这些假设不是随机生成的,而是基于已有的科学文献和数据库。

    讨论阶段最有意思。系统里有好几个”智能体”,每个扮演不同的角色——有的负责挑刺,有的负责找支持证据,有的负责检查逻辑一致性。它们会互相”吵架”,直到对某个假设达成一致意见。

    验证阶段,系统会去查文献,看看这个假设跟已知的研究是否矛盾,有没有实验数据支持。如果有矛盾,它会回过头去修正假设,然后重新走一遍流程。

    已经在用的场景

    Google已经在跟Google Cloud和Google Labs合作,让研究人员试用这个系统。目前的反馈是,它在”假设筛选”这个环节特别有用——人类科学家往往靠直觉和经验来判断一个假设值不值得深究,但直觉会出错,经验有盲区。Co-Scientist能把这些假设结构化地过一遍,帮人更快地找到值得深挖的方向。

    特别值得关注的是,Google正在把它应用到ALS(肌萎缩侧索硬化症)的疗法开发,还有衰老研究。这两个领域都有一个共同点:数据极其复杂,变量极多,人类研究者很难把所有线索串起来。AI的优势正好在这里——它能同时处理海量文献,发现人眼看不到的模式。

    下一步是跟实验自动化打通

    现在的Co-Scientist还停留在”纸上谈兵”阶段——它能生成和验证假设,但验证完了,还得人类去做实验。Google的下一步计划,是把这个系统跟实验自动化系统整合起来,让AI生成的假设能直接在实验室里被验证。

    如果这一步实现了,科研的效率提升会是数量级的。现在从一个假设到发表论文,往往要几年。如果假设生成、验证、实验、数据分析全都能由AI加速,可能几个月就能走完。

    当然,这里有个绕不开的问题:AI生成的假设,如果连人类都理解不了为啥它对,那还敢不敢照着做实验?这个问题,可能比技术本身更难回答。


  • Anthropic拿到300亿美元,估值冲破9000亿

    Anthropic拿到300亿美元,估值冲破9000亿

    今天AI圈被一条消息刷屏了——Anthropic正在完成一轮300亿美元的融资,估值超过9000亿美元。要知道,就在今年2月,Anthropic的估值还是3800亿美元。不到三个月,直接翻倍。

    这轮融资由红杉、Dragoneer、Greenoaks和Altimeter联合领投,预计本周内就能完成交割。如果按上限估值落地,Anthropic将首次超过OpenAI在2026年3月创下的8520亿美元估值,成为AI赛道新的估值王者。

    Anthropic的估值暴涨不是靠”讲故事”。他们刚刚披露,2026年第二季度营收预计达到109亿美元,相比第一季度的48亿美元增长了130%,而且首次实现季度运营盈利。投资者看中的不是概念,是真金白银的营收增长。

    钱从哪里来,花到哪里去

    你可能好奇,Anthropic哪来这么多钱烧?答案在SpaceX的IPO招股书里。Anthropic跟SpaceX签了一份算力合同,每月支付12.5亿美元,一直持续到2029年5月,总价值450亿美元。

    光是给SpaceX的算力费,一年就是150亿美元。加上训练模型、养团队、建数据中心,300亿美元其实撑不了太久。但投资者愿意买单,是因为他们相信Anthropic能在18个月内把年营收做到500亿美元以上。

    有意思的是,Anthropic还在跟微软谈,打算用微软定制的Maia 200 AI芯片来跑Claude。加上已经合作的英伟达、AWS Trainium、谷歌TPU、SpaceX算力,Anthropic成了行业里第一个实现多芯片供应商布局的前沿AI实验室。

    教皇也来站台

    今天还有一个挺有意思的新闻。教皇良十四世发布了一份关于AI的通谕《Magnifica Humanitas(卓越人性)》,发布仪式上站在他旁边的,是Anthropic的联合创始人Christopher Olah。

    这份通谕的核心是说”人工智能时代要保护人的尊严”。选在《新事(Rerum Novarum)》发布135周年的日子签署,故意把AI类比为”第二次工业革命”。梵蒂冈没有选谷歌或者OpenAI,而是跟Anthropic同台,这个信号挺明确的——在AI安全这件事上,梵蒂冈把Anthropic视为最可信的合作伙伴。

    OpenAI那边也没闲着

    这边Anthropic融资如火如荼,OpenAI也没闲着。他们已经准备向美国SEC提交保密的S-1文件,预计2026年第四季度或者2027年初正式上市。

    两大AI实验室,一个刚拿完钱、估值冲上云端,一个准备上市、接受公开市场检验。2026年的AI赛道,已经从”谁能做出更好的模型”变成了”谁能先把AI变成一门赚钱的生意”。

    从目前的财务数据看,Anthropic暂时领先半个身位。但OpenAI有微软背书、有GPT的生态粘性,上市之后的融资能力不容小觑。这场仗,才刚刚开始。


  • agent-skills:45.4k Stars!Google工程师开源的AI编码生产级技能库,让AI输出工业级代码

    agent-skills:45.4k Stars!Google工程师开源的AI编码生产级技能库,让AI输出工业级代码

    agent-skills

    你有没有遇到过这种情况:让AI帮你写代码,它确实写出来了,但一测就挂,还没测试、没文档、没安全检查——因为它总是走「最短路径」,能跑就行。

    Google Cloud AI总监、AngularJS联创Addy Osmani也发现了这个问题,于是他在2026年2月开源了 agent-skills——一个把高级工程师开发软件时的完整工作流、质量门禁和最佳实践封装成可复用技能的工具包,让AI代理在开发全流程中都能遵循与生产环境一致的标准。

    📊 项目数据

    GitHub Stars:45.4k+ | 开源协议:MIT | 维护者:Addy Osmani(Google) | 适用工具:Claude Code、Cursor、Gemini CLI、Windsurf、Copilot 等


    📌 项目简介

    agent-skills 是一个面向AI编程代理的生产级工程技能集合,将资深工程师在开发软件时遵循的工作流、质量门禁和最佳实践编码为可复用的技能模块,让AI代理不再「能跑就行」,而是输出符合生产级质量标准的代码。项目覆盖从需求定义、计划拆解、迭代开发、测试验证、代码审查到上线部署的完整开发生命周期,并预置了可自动触发的专项技能。


    ⚙️ 安装要求与过程

    环境要求

    • 支持任意AI编程代理(Claude Code、Cursor、Gemini CLI、Windsurf、Kiro、Copilot等)
    • 部分技能需要配合对应MCP服务使用(如Chrome DevTools MCP)
    • 无额外依赖,技能文件为纯Markdown格式

    快速安装(以Claude Code为例)

    方式一:从市场安装(推荐)

    # 添加市场源
    /plugin marketplace add addyosmani/agent-skills
    # 安装技能包
    /plugin install agent-skills@addy-agent-skills

    方式二:本地克隆安装

    git clone https://github.com/addyosmani/agent-skills.git
    claude –plugin-dir /path/to/agent-skills

    其他工具(Cursor、Gemini CLI、Windsurf等)详见项目 docs/ 目录下的对应配置指南。


    ✨ 核心功能

    1
    23个细分技能模块,覆盖开发全生命周期

    从需求定义(/spec)、计划拆解(/plan)、增量开发(/build)、测试驱动(/test)、代码审查(/review)到上线部署(/ship),每个阶段都有对应的技能工作流,AI必须按步骤执行,不能跳过。

    2
    反合理化机制,防止AI走捷径

    每个技能都内置「常见借口反驳表」——比如AI想说「我之后再补测试」,技能会直接反驳并强制要求先写测试。验证要求明确到必须提供证据(测试通过截图、构建输出等),不允许「看起来没问题」这种模糊判断。

    3
    自动触发 + 斜杠命令双模式

    设计API时自动激活 api-and-interface-design 技能,构建UI时自动激活 frontend-ui-engineering 技能;同时也支持手动输入 /spec、/plan、/build、/test 等7个斜杠命令精准触发对应技能。

    4
    预配置专家代理角色,多维度审查

    内置 code-reviewer(高级工程师视角)、test-engineer(QA专家视角)、security-auditor(安全工程师视角)三个专家代理角色,可在关键节点自动调用,对代码进行多维度审查。


    🚀 典型使用场景

    场景一:让AI严格按照TDD流程开发新功能

    输入 /test 激活测试驱动开发技能,AI会严格遵循「红→绿→重构」流程,先写失败测试,再写最小实现,最后重构;测试金字塔比例强制为 80% 单元测试 / 15% 集成测试 / 5% E2E测试,确保测试覆盖全面而不冗余。

    场景二:上线前全自动代码审查与安全加固

    输入 /review 触发代码审查技能,AI会按五轴审查法(正确性、可读性、安全性、性能、可维护性)逐文件审查,变更控制在约100行以内;同时自动激活 security-and-hardening 技能,对照 OWASP Top 10 逐项检查,不通过不许合并。


    💡 推荐理由

    我一直觉得现在的AI编程工具最大的问题不是「写不出代码」,而是「写出来的代码不经过生产级流程」——没有需求文档、没有测试、没有安全审查,直接给你一个能跑的版本就完事。agent-skills 的本质,就是把 Google 级别的工程成熟度「编译」成了AI可以理解和执行的技能工作流。

    最让我印象深刻的是它的「反合理化机制」——AI 想偷懒的时候,技能会直接「怼回去」,要求提供证据而不是口头保证。这比任何 Prompt 技巧都更有效,因为它是在流程层面强制质量,而不是靠 AI 的「自觉」。

    如果你在用 Claude Code、Cursor 或其他AI编程工具,这个项目值得认真配置一套——它会让你AI助手输出的代码质量提升一个维度。


    📥 下载地址

    🌐 官方网站:https://github.com/addyosmani/agent-skills

    📦 GitHub仓库:https://github.com/addyosmani/agent-skills

    📚 配置文档:https://github.com/addyosmani/agent-skills/tree/main/docs

    💬 技能市场:https://agentskill.work/zh/skills/addyosmani/agent-skills

    📄 开源协议:MIT License(可自由使用、修改和分发)


    💡 小编注:

    这个项目背后的理念其实很深刻——AI编程工具的能力上限不仅仅取决于模型本身,更取决于我们给它的「工程上下文」。agent-skills 做的,就是把这些上下文系统化、可复用化。值得一提的是,Addy Osmani 同时也是热门项目 addyosmani/superpowers(第30期已介绍)的作者,两个项目一脉相承,建议搭配使用,效果更佳。

  • Anthropic悄悄收购Stainless:AI工具链的暗战

    “加入Anthropic是自然决定,因为团队能在更早认可这项技术价值的公司体系内继续推进工作。”——Alex Rattray(Stainless创始人)

    一笔不太起眼的收购,暗藏大算盘

    5月19日,Anthropic宣布收购软件基础设施初创公司Stainless。交易金额没有正式公布,但业内消息称超过2.8亿欧元(约合22.18亿元人民币)。

    Stainless这家公司,名字听着像做不锈钢的,其实是搞开发者接口(Developer Interfaces)的。它最核心的能力,是能把API规格说明自动转换成可部署的工具,支持Python、TypeScript、Kotlin、Go、Java等多种编程语言。说白了,就是帮开发者省掉大量手动维护SDK(软件开发工具包)的时间。

    Anthropic收购Stainless
    Anthropic宣布收购Stainless

    为什么这笔收购让谷歌和OpenAI很不舒服?

    Stainless之前可不是Anthropic独占的。它的托管服务,OpenAI、谷歌这些重量级AI实验室都在用。现在收购一完成,这块能力就进了Anthropic的”自留地”,外面的竞争对手用不了了。

    更直接的是,Stainless已经确认关闭全部托管产品,包括那个知名的SDK自动生成工具。现有客户虽然还能继续用已经生成的代码库,但后续拿不到官方更新和技术支持了。

    对AI智能体(Agent)开发来说,SDK和接口适配是很关键的一环。Anthropic这一步,相当于把”连接层”能力提前锁定了。模型再强,如果开发工具链被对手卡住,生态扩展也会受限。反过来,Anthropic现在既能给自己的产品做更快的接口迭代,也能在外部软件协同上掌握更多主动权。

    AI工具链的竞争才刚刚开始

    这笔收购透露出一个信号:AI公司的竞争,已经从单纯的”模型能力”延伸到”开发工具生态”。谁能帮开发者更高效地构建AI应用,谁就能占据更有利的位置。

    Stainless的技术还有一个很实用的特点——当API发生变化时,它能自动更新代码。对需要频繁迭代的AI产品来说,这种自动化能力可以大幅降低维护成本,加快集成速度。


    Anthropic最近动作不少。前有卡帕西加盟,后有Stainless收购,看得出来是在为下一阶段的竞争做全方位布局。而对OpenAI和谷歌来说,失去这样一个关键工具合作伙伴,短期内可能得自己补上这块短板了。

    • Stainless核心能力:自动化创建和维护SDK,支持多编程语言
    • 战略意义:锁定AI智能体开发的关键连接层能力
    • 直接影响:OpenAI、谷歌等无法继续共享Stainless托管服务
    • 行业趋势:AI竞争从模型能力延伸到开发工具生态
  • 卡帕西跳槽了:从OpenAI创始人到Anthropic新兵

    “当前大语言模型的发展正处于决定性阶段,我期待通过重返一线研发工作,参与到模型的前沿探索中。”——安德烈·卡帕西

    从OpenAI创始人到Anthropic新兵

    5月20日,人工智能领域传来重磅消息:安德烈·卡帕西(Andrej Karpathy)正式宣布加入Anthropic。这位OpenAI的创始成员、前特斯拉AI总监,将在Anthropic的预训练团队担任要职,负责Claude大模型的”基本功”训练。

    预训练团队听起来很技术,但其实决定了AI模型的”底子”——它学了多少知识、理解能力有多强,都在这个阶段定型。卡帕西要做的,是组建一支新团队,尝试用Claude自己的能力来加速预训练研究。这可是当前AI圈最前沿的方向,各家都在抢着推进AI开发自动化。

    OpenAI联合创始人卡帕西加盟Anthropic
    卡帕西在社交媒体宣布加盟Anthropic

    为什么他的加入这么受关注?

    卡帕西不是普通的研究员。他在学术界、工业界,甚至教育领域都有不小的影响力。早年是OpenAI的核心创始成员,后来去了特斯拉,带队搞出了Autopilot的计算机视觉核心技术。马斯克当年为了挖他,可是费了不少功夫——法庭公开的邮件里,马斯克直言卡帕西是全球计算机视觉领域”排名第二的人物”,仅次于伊利亚·苏茨克维。

    2022年离开特斯拉后,卡帕西没急着回大模型前线,反而在YouTube和社交平台上做起了技术普及者,积累了大量粉丝。他提出的”vibe coding”概念,最近在开发者圈子里很火。他还公开分享过自己对前沿模型做极限压力测试的心得。

    这次加盟Anthropic,算是他重返大模型研发一线。他自己说,虽然回到了研发岗位,但教育事业还是会继续,计划未来再回去搞教学。

    一场关于人才的暗战

    卡帕西的跳槽,背后其实是一场AI巨头之间的人才博弈。就在本周一,旷日持久的”马斯克诉奥特曼案”刚刚结案,萨姆·奥特曼胜诉。这个案子里,卡帕西的动向曾多次被当作关键证据提及。

    2017年,马斯克同时担任OpenAI和特斯拉的董事,利用这个身份把卡帕西从OpenAI挖到了特斯拉,让他带队做Autopilot计算机视觉。2022年离开特斯拉后,卡帕西短暂回归过OpenAI,随后创办了AI教育公司Eureka Labs,一直到这次加入Anthropic。


    对Anthropic来说,拿下卡帕西绝对是一步好棋。最近Anthropic势头很猛,融资、产品、口碑都在上涨,这次又捞到这么重量级的研究员,无疑进一步巩固了它在AI人才战中的领先地位。

    而对OpenAI来说,失去这样一位创始级别的人物,多少有点尴尬。不过AI圈的人才流动向来频繁,接下来会不会有反向操作,值得继续看下去。

  • 法拉利用IBM的AI打造F1超级粉丝,赛车运动进入数字时代

    两年前,IBM意识到它的体育合作伙伴阵容中有一个明显的缺憾:一级方程式赛车(F1)。F1已经成为全球最受欢迎的运动之一,尤其是在美国——Netflix的《极速求生》记录了F1车手的工作生活,把他们变成了主流名人。这项以技术为中心的运动也成了AWS、Oracle和Anthropic等科技公司的热门选择,它们与车队合作以获得赞助曝光,并提供数据分析和AI工具来带来竞争优势。

    法拉利F1赛车
    法拉利F1赛车在赛道上飞驰 | 图片来源:TechCrunch

    IBM为什么选了法拉利

    所以,当IBM寻找下一个重大体育合作伙伴时,它选了F1以及其中最标志性的车队之一——法拉利HP车队,这并不让人意外。

    “他们是历史上获胜最多的车队。”IBM体育与娱乐合作副总裁Kameryn Stanhouse告诉TechCrunch。

    不过,这次合作的核心在于其他车队也开始与科技巨头合作的原因:获得更复杂的技术解决方案,帮助他们最大化利用人工智能。Stanhouse说,体育最大的优点之一,就是有那么多数据可用,可以用来帮助人们适应AI。

    “他们实际上看到了AI如何为他们服务,”她谈到AI在体育叙事中的使用时说。


    讲故事才是核心

    IBM与法拉利的合作围绕讲故事这个理念展开,通过 overhauling 驱动法拉利车迷App的技术来增强粉丝参与度。为了帮助实现这一目标,法拉利聘请了Stefano Pallard担任新设立的”车迷发展负责人”角色。他说,车队想要解决的挑战不仅仅是触达车迷,而是”让每个人感觉我们都了解他们”。

    “这从获取赛道数据开始,把它变成容易跟随且吸引人的内容,”他告诉TechCrunch。

    每场比赛期间,车队每秒处理数百万个数据点,捕捉车手和赛车的每一个动作。把这些变成车迷可以参与的内容,只是先进的企业AI如何帮助企业更好地与消费者互动的一种方式。


    独立App策略,不走社交平台

    在11支车队中,法拉利是少数几支( alongside McLaren和Williams)拥有独立车迷App策略的车队之一,而不是依赖社交媒体或官方F1平台。这显示出这项运动正开始慢慢利用其不断增长的全球车迷群体。

    法拉利App的一些改动很简单,比如提供意大利语版本。尽管法拉利是意大利公司,许多车迷也是意大利人,但直到IBM合作之前,他们的车迷App都没有意大利语版本。

    Stanhouse说, old 的法拉利车迷App是个人们去查比赛详情然后就离开的地方。这个新App有游戏,车迷可以在App里和别人玩;有新的AI撰写的比赛总结;更多关于车队和车手的幕后故事;一个做预测的地方;还有一个AI伙伴让车迷提问。

    “有两个车手,但你知道换一个轮胎需要24个人同时工作两秒钟吗?”Stanhouse说,并补充说讲故事帮助车迷感觉与车队更亲近。


    全年参与,不只是比赛日

    与IBM打造的其他体育App不同,Stanhouse说法拉利App的主要焦点是讲故事,因为它希望车迷全年都保持参与,而不是一年只有几周,像大师赛那样的锦标赛。Stanhouse说,自IBM介入以来,App的参与度数据一直呈上升趋势,她举了一个例子:比赛周末的参与度增加了62%。

    Pallard说,车队随后使用AI分析App中的参与信号,比如人们喜欢读什么内容,以及车迷发送消息的情绪。

    “这帮助我们理解什么最能引起Tifosi(法拉利车迷的昵称)的共鸣,它直接告知我们如何塑造我们的叙事,以及如何传递内容,”他说。

    车队希望更深入地研究个性化,创造更多沉浸式车迷体验。


    新车迷更年轻、更多元

    App开发者还考虑到了法拉利的车迷群体——它比五年前更加多元化。F1去年发布的数据显示,75%的新车迷是女性,其中许多是Z世代。对女性来说,一个特别的吸引点是F1学院——一个全女性赛车系列赛,旨在培养下一代女性车手。但这些新车迷,就像老车迷一样,都在追求一件事——更多。

    “他们要求更多数据、更多洞察、更多功能,我们必须能够交付这些,”Pallard说。”与IBM一起,未来五年的愿景是让每个车迷都感觉这个体验是为他们打造的,无论他们已经和我们在一起30年还是30天。这就是你如何建立持久的忠诚度。”

    通过IBM的AI技术,法拉利正在重新定义什么是真正的车迷体验。这不只是看比赛,而是让每个车迷都感觉自己是车队的一部分。

  • 我试了亚马逊的Bee可穿戴设备,既好奇又有点发毛

    最近我有机会测试了一款来自Bee的AI可穿戴设备。这家公司去年被亚马逊收购,之后更新了一些新功能。跟其他AI可穿戴设备一样,Bee被设计成一种个人助手:它能记录、转录并总结你一整天的对话,提供一种持续的笔记功能——如果你健忘,或者只是想让生活更有条理,这玩意儿还挺有用。如果你把它和日历同步,它还能给你发提醒,告诉你今天该干啥。

    Bee可穿戴设备
    Bee可穿戴设备实拍图 | 图片来源:TechCrunch

    这东西到底怎么用

    TechCrunch之前写过Bee,它的工作原理挺简单:用户开机,戴在手腕上,跟Bee手机App同步,输入一些基本个人信息。Bee有个内置录音器,点一下设备上的按钮就能开关录音。录音的时候,绿灯会闪;不录的时候,绿灯就灭了。一段对话录完之后,App会自动生成一个容易阅读的摘要,还有整段对话的转录文本。

    至于这整个概念有多让人兴奋(或者不兴奋),可能因人而异。对我来说,问题是我有点隐私情结。在这个普通人被四面八方的数字监控包围的世界里,我很珍惜任何不被录音的机会。所以,想到要24/7在手腕上绑个偷听的 gadget,我并不觉得多吸引人。


    工作场景倒是真有点用

    即便如此,我也得承认——在合适的场景下——Bee确实有潜力帮你整理生活。它在职业场合的表现还不错。如果你一整天都是会,而且很难记住所有细节,Bee可以当个还算称职的助手。

    这周我有一次商务电话,得到对方同意后开了录音。事后,App很忠实地把对话总结了一遍,还贴心地把每段谈话都分开了,这样我后来复习的时候,不用重新听完整段对话。这确实有用,不过得说明一下:这跟Otter、Granola这些其他转录服务提供的功能相比,也没啥质的区别——它们也都提供转录和自动生成的摘要。

    你能想象这么个场景:一个专业人士整天在各种会议之间跑,这设备能帮上忙。你可以让Bee跑一整天,然后回头看对话摘要,找那些你没听清的地方。

    Bee在总结对话方面做得还不错,但这玩意儿给出的实际转录文本可能有点乱。之前的评测者也注意到,你通常得手动输入其他说话人的名字,因为Bee不总是知道谁在说话。在我的对话中,我注意到它还漏了一些段落——倒不是啥大事,但确实不是完整记录。


    私人生活?算了吧

    我还带着Bee去了每周一次的和朋友看电影之夜,让它跑了一整晚。考虑到我们看的是《水库的狗》,我有点担心这可穿戴设备会把所有 vulgar 的杀戮场面当成真实发生的流血事件,然后触发某种内部警报。不过,Bee基本搞明白了怎么回事。这设备判断出我们在看电影,而且在之后的事件摘要里,把这段对话标记为”塔伦蒂诺电影场景分析”。

    虽然Bee作为专业工具显示出早期潜力,但我不希望这东西记录我的私人生活。奇怪的是,Bee的市场定位主要是个人使用产品。要对此感到舒服,你得舒服于让Bee访问你线下和数字生活的大部分内容。

    确实,要想工作得好,Bee需要大量的手机权限——包括访问你的位置、照片、电话联系人、日历和手机通知。你也可以跟它分享健康数据——如果你出于某种原因,想让它知道你的睡眠模式或者静息心率的话。


    隐私问题怎么解

    Bee收集的这大量数据存储在云端——再一次,对于数字隐私爱好者来说,这带来了自己的问题。在给科技YouTuber Becca Farsace的消息中,Bee apparently 展示了一个完全在本地运行的设备演示。如果这家公司能造出这样的设备,我会彻底服气——甚至可能考虑买一个。话又说回来,亚马逊还没对这些计划提供任何更新。

    至于Bee的数字隐私保护,公司说它提供加密来保护用户数据——无论是静态还是传输中。在隐私政策中,公司声明它”实施了技术和组织安全措施,旨在保护公司处理的任何个人信息的安全”。Bee还声称它接受”严格的第三方安全审计”,并采用持续的安全监控。这些听起来都不错,不过值得指出的是,亚马逊——像许多大型科技公司一样——偶尔也会遇到一两个数据安全问题(对于一个管理如此多全球云环境的公司来说,这不 exactly 让人惊讶,但仍然是个问题)。

    简短来说,Bee是个挺有意思的硬件产品,假以时日并加以调整,未来在专业应用方面可能有些前景。不过,作为你私人生活的数字助手,对某些用户来说,它可能有点太侵入性了。