标签: AI技术

  • Anthropic要盈利了:Claude营收翻倍,AI烧钱时代正在松动

    Anthropic要盈利了:Claude营收翻倍,AI烧钱时代正在松动

    《华尔街日报》捅出了一个挺炸的消息:Anthropic告诉投资人,今年第二季度营收将比去年第四季度翻倍,冲到约109亿美元,而且有望首次实现运营盈利。整个AI圈都侧目。

    这家公司过去一年确实势头不错。职场人对Claude的偏好在上升,不少专业用户把ChatGPT换成了Claude,理由是后者”更不容易胡说八道”。Anthropic也在一边拓客,不久前刚宣布了面向中小企业的新服务,还给律师事务所推了专用工具。

    Anthropic如果真能在第二季度实现运营盈利,即便只是单季转正,也是一个很强的信号。它意味着大模型公司不一定永远活在亏损里。

    盈利背后的算力账单

    别急着下结论说Anthropic已经跑通了商业模式。报道同时提到,因为接下来要付的算力账单太贵,今年剩下几个季度未必能守住盈利。训练和下一代模型推理都要烧钱,这不是什么秘密。

    有意思的是,这条消息和OpenAI可能很快提交IPO申请的新闻撞在了同一天。两家公司的节奏越来越像在互相看清对方底牌——Anthropic亮出盈利预期,OpenAI则在筹备上市。

    两个巨头的暗中较劲

    OpenAI有微软撑腰,Anthropic的投资方则包括谷歌、亚马逊等。盈利这件事,对Anthropic来说不只是财务数字,也是向投资人证明自己能够独立造血、不完全依赖持续融资的关键一步。

    至于全年能否维持盈利,报道给出的判断是比较谨慎的。大模型公司的成本结构里,算力支出是最重的一块,而且往往集中在某几个季度——比如新模型训练完成、大规模推理服务上线的那个节点。


    总的来说,这条消息释放的信号比数字本身更值得琢磨。AI行业从”拼命烧钱换增长”到”认真对待unit economics”,可能比很多人预期的要快。Anthropic如果真的在这个季度转正,不管能不能维持,都会给其他大模型公司带来压力。

  • 谷歌云安全负责人说一套做一套:Gemini API密钥漏洞让开发者收到五位数账单

    谷歌云COO的”安全宣言”

    洛杉矶的一场活动后台,谷歌云首席运营官弗朗西斯·德·索萨(Francis de Souza)抽了几分钟出来聊企业AI安全的现状。他的语气像大学教授一样冷静审慎:”会有一个过渡期,然后我认为我们会进入一个更好的阶段。”

    话说得漂亮。但《注册表》(The Register)在过去几周里记录的大量案例,让这番话听起来有点微妙——那些案例里,开发者因为对 Gemini 模型的未授权 API 调用,收到了五位数甚至六位数的账单。

    AI安全概念图
    AI安全:说起来容易做起来难

    “影子AI”:企业安全的隐形漏洞

    德·索萨的核心观点其实是安全专业人士多年来一直在试图让高管们内化的:安全不能是事后想法。他特别警告了”影子AI”的风险——员工在没有组织监督的情况下使用消费级工具。

    他说:”当公司开启AI之旅时,他们需要采取平台化方法。安全不是你之后可以加装的东西,也不是你可以留给员工自己处理的事情。”

    这话没错。但有趣的地方在于,谷歌自己似乎也还在经历这个”过渡期”——就像德·索萨自己说的那样。

    “没有数据战略和安全战略的AI战略是不存在的,它们必须齐头并进。”——弗朗西斯·德·索萨,谷歌云首席运营官

    23分钟的”黑洞”:Gemini API密钥撤销延迟

    问题出在哪儿?《注册表》报道了一个让人坐不住的细节:开发者即使捕获到泄露的 Gemini API 密钥并立即删除它,攻击者仍然可以继续使用该密钥长达23分钟。

    原因是谷歌的撤销操作在其基础设施中是逐步传播的,不是即时生效。安全公司 Aikido 的研究员约瑟夫·莱昂(Joseph Leon)发现,在这23分钟的窗口期内,超过90%的请求仍然可以认证——攻击者完全可以利用这段时间从 Gemini 中提取文件和缓存的对话数据。

    莱昂还指出,谷歌自己较新的凭证格式似乎没有同样的问题:服务账户 API 凭证的撤销时间约为5秒,Gemini 较新的 AQ 前缀密钥格式的撤销时间约为1分钟。这说明23分钟的窗口不是工程限制,而是优先级问题。

    五位数账单:开发者的噩梦

    面试准备平台 Prentus 的 CEO 罗德·达南(Rod Danan)遇到了这种事。他的密钥被攻击者利用后,大约30分钟内账单就达到了10138美元。

    悉尼的开发者伊苏鲁·丰塞卡(Isuru Fonseka)也遭遇了类似入侵,醒来时发现自己被收取了大约17000澳元的费用——尽管他相信自己设置了250澳元的消费上限。

    两个人都不知道的是,谷歌的自动化系统根据账户历史记录升级了他们的计费层级,将有效上限提高到高达10万美元,而且不需要明确同意。

    在《注册表》发布初步报告后,谷歌退还了这两人的费用。但谷歌表示不打算改变自动升级层级的政策,理由是优先考虑防止服务中断,而不是执行用户声明的预算偏好。

    威胁格局已经变了

    德·索萨说得对:从初始入侵到攻击进入下一阶段的平均时间已经从8小时缩短到22秒,攻击面也远远超出了传统的网络边界。除了通常的资产,企业现在还有模型、用于训练模型的数据管道、智能体,还有提示词——所有这些都需要被保护。

    但他也指出了一个没有得到足够关注的风险:在企业内部系统游走的智能体,可能会暴露出多年来无人问津的遗忘数据存储库。”很多组织有旧的 SharePoint 服务器和访问控制,他们很久没有真正更新过,但这没关系,因为没人知道它们在哪里。但会在你的企业里漫游的智能体会找到这些数据资产,并暴露上面的数据。”

    应对方法是以机器速度对抗机器速度——用 AI 原生的、完全智能体化的防御来保护自己。但这又回到了那个问题:当平台自己还在”过渡期”的时候,客户的过渡期要到什么时候才能结束?


  • ClickUp大裁员22%:AI替代人工的时代真的来了?

    AI加持下的”100倍组织”梦想

    ClickUp 的 CEO Zeb Evans 在 X 平台上说了一句话,让很多人心里一紧。他说这次裁掉 22% 的员工,不是成本削减,而是”激进地拥抱 AI”,要让 ClickUp 变成”100 倍组织”。

    什么叫”100 倍组织”?简单说就是:用极少的人,干出原来 100 倍的工作量。Evans 甚至承诺,省下来的人力成本会”直接回流给留下来的员工”,还要推出”百万美元薪资档位”。听起来很美好,但问题是——那些被裁掉的人,已经不在”留下来的人”的范围内了。

    AI与工作未来的概念图
    AI正在重塑工作场所,但代价由谁承担?

    3000 个 AI 智能体在”上班”

    根据《财富》杂志的报道,ClickUp 最近内部引入了约 3000 个 AI 智能体,代替员工处理各类复杂任务。现在的员工不需要亲自完成工作,而是被要求”指挥”这些智能体,然后审核输出结果。

    这个变化背后有一个微妙的逻辑:原来一个人做的工作,现在变成”人指挥 AI 做,人审核”。理论上人的效率提升了,但实际上需要的人数变少了。Evans 说”用 AI 自动化自己工作的人永远会有工作”——这话没错,但能走到那一步的人,显然不会是全部。

    ClickUp 并非唯一一家把 AI 智能体当作生产力答案的公司。Gartner 的调查显示,约 80% 使用自主技术的公司已经削减了岗位——但裁员并不一定会转化为有意义的财务回报。

    “代币最大化”:一个值得警惕的指标

    近几个月来,越来越多的公司开始监控员工的”代币消耗量”,把它当作衡量员工是否真正在用 AI 工具的指标。ClickUp 说他们不是在做”代币成本游戏化”,而是在游戏化”创造的价值和节省的时间”。

    但批评者指出,把代币消耗作为考核指标本身就是个错误方向,因为这只会刺激不必要的 AI 调用,推高成本,却不一定带来真实的价值产出。这就像一个餐厅老板跟厨师说:”你今天用了多少度电,我就给你发多少奖金。”厨师会怎么反应?当然是拼命开最大功率的烤箱。

    一个极端案例:只有一名员工的初创公司

    科技圈一直在理论推演”AI 完全替代人工”的场景,而现在已经有了一个高知名度的极端案例:成立仅一年的 Polsia,声称用 AI 自动化了所有软件运营工作,整个公司只有一名员工——创始人兼 CEO Ben Broca。

    这种效率显然正在获得资本市场的认可:Polsia 刚刚以 2.5 亿美元的估值完成了 3000 万美元的融资。投资者用真金白银说明了一件事——他们相信”一个人 + AI”可以替代几十甚至上百人的传统团队。

    ClickUp 的裁员或许只是一个开始。当 Evans 说”AI 会让留下的人拿到百万美元薪资”时,他可能没意识到,这句话的另一面是:大部分人会离开,而留下的人将面临前所未有的工作强度和压力。


  • 我们试了谷歌的AI眼镜,已经很接近理想状态了

    在今年的谷歌I/O开发者大会上,我们有机会短暂体验了谷歌即将推出的AI眼镜——不是该公司宣布将于今年秋季发售的仅支持音频的眼镜,而是同时提供音频和视觉体验的版本。

    这些Android XR眼镜在去年的大会上首次公布,其镜片内置显示屏,可将实用信息叠加在真实世界之上,直接呈现在用户视野中。这包括可显示天气、步行导航、Uber接驾信息、实时翻译等内容的小组件,甚至是用户自己用AI设计的自定义小组件。

    谷歌Android XR AI眼镜
    谷歌Android XR AI眼镜 (来源:TechCrunch)

    prototypes已经相当成熟

    我们测试的眼镜仍然是非常早期的原型,但已经足够成熟,可以进行外部测试。演示XR眼镜的工作人员解释说,原型机让公司不必担心与不同款式、造型相关的外观设计细节,因此可以更自由地试验显示技术,以及它对电池续航的影响。

    这意味着这些样机在佩戴贴合度、造型、尺寸和设计细节方面,和任何未来发售的正式版本都会有很大不同。更像是可以在基础、舒适的镜框内对眼镜的”内部构造”进行试验。

    这款带显示屏的眼镜是今年晚些时候推出的第一代音频眼镜的下一步迭代产品。眼镜是与Warby Parker、Gentle Monster和三星合作开发的,将谷歌的技术与这些品牌的设计美学相结合。

    实际使用体验

    要激活Gemini,需要长按眼镜镜框右侧2秒,启动提示音会响起,告知用户Gemini已经开启并正在监听。在演示版本中,启动Gemini的同时也会启动摄像头,但正式发售版本将允许用户配置是否在启动Gemini时同时开启摄像头。

    在第一次测试中,我们要求Gemini播放一位我们喜爱的艺术家的音乐。由于场地太吵,无法评估音质,即使音乐开到最大音量,仍然很难清晰、有细节地听到。但从这次有限的体验来看,初步印象是这款眼镜无法替代更高质量的耳塞,但如果只是想在外面散步、徒步或在家做家务时听点音乐,它可以满足需求。

    要关闭音乐,只需轻敲镜框侧面中间的位置,就像敲击太阳穴一样。

    拍照和AI处理

    在第二次测试中,我们按下拍照按钮给一个人拍了照片。当时显示屏是关闭的,所以照片被传输到了我们的手机和手表上。(之后你可以通过长按来拍摄视频,但原型机暂不支持这个功能。如果是拍视频,你会看到视频缩略图预览,而不是照片。)

    你也可以直接让Gemini拍照,无需按拍照按钮,还可以对拍摄结果进行一些AI处理。比如你可以说”拍张照片,把这个人物变成动漫角色”。照片会先发送到手机,再发送到Gemini和Nano Banana服务器,之后返回编辑后的版本。

    在谷歌I/O的场地里,Wi-Fi负载很高,整个往返过程大约需要45秒。

    显示屏体验

    开启显示屏后,你会在视野中看到一个简单的主屏幕。演示版本预装了一些小组件,显示天气和谷歌I/O活动的倒计时。如果你是眼镜的主要使用者,也可以把谷歌地图、翻译等特定应用的快速启动器设置好。

    原型机只有右眼上方的单显示屏,但该平台同时支持单显示、双显示以及仅音频的眼镜模式。显示屏的图像有点模糊,我们认为这和我们佩戴的处方隐形眼镜有关——我们一只眼睛的镜片是优化远距离视物的,另一只优化近距离视物。当我们闭上一只眼睛时,图像会更清晰,但这种体验几乎立刻就让我们右眼上方产生了视疲劳。


    翻译功能表现突出

    最出色的演示之一是眼镜的语言翻译功能,它依托手机上的谷歌翻译应用。一位演示人员语速很快地说西班牙语,眼镜自动检测到了语言,并在显示屏上显示英语翻译文本,同时Gemini会在我们耳边用英语说出来。

    我们认为很多出境旅行者会为了这个功能购买这款眼镜。需要指出的是,仅音频的眼镜也支持翻译功能,只是不会在眼镜上显示文本,如果需要的话,你可以在手机上看到转录文本,同时还有实时音频反馈。

    导航体验不挡视线

    另一个演示是使用眼镜导航。你可以通过要求Gemini导航到某个目的地来启动谷歌地图体验——甚至可以模糊到比如”最近的咖啡店”这样的指令。

    Gemini会激活手机上的谷歌地图,在体验加载的短暂延迟后,眼镜会显示转向导航信息。当你向前看时,会显示下一个转向的信息。但如果你需要在空间中定位,低头看地面就能看到地图上的蓝色圆点。你也可以左右转动身体来在空间中旋转,就像你在手机上调整蓝色圆点的方向一样。

    然后当你再抬头时,可以继续行走,地图不会挡住你的视线。因为这个体验是和手机上的谷歌地图绑定的,所以”家””公司”等已保存的目的地已经可以直接使用。

    物体识别还需优化

    我们还短暂地用眼镜识别视野中的各种物体,并向它提问。眼镜最初很难识别我们面前架子上的莫奈画作复制品,这是因为原型机没有自动开启摄像头——必须从应用中手动开启。

    不过即使我们凑近去聚焦画布左下方的莫奈签名,Gemini还是问了几个问题之后才说它看起来像莫奈的作品。其他测试更顺畅,眼镜立刻识别了架子上的植物,还回答了关于书上不同食谱的问题。


    后续规划和市场背景

    谷歌表示,今年晚些时候它会分享更多关于Android XR显示眼镜的信息,届时它会扩大其可信测试者计划。

    与此同时,该公司认为音频功能已经可以满足部分用户的需求,这可能是面对Meta和Snap在该领域的竞争,它还没有准备好显示眼镜的巧妙说法。

    和显示版本一样,仅音频眼镜也可以访问谷歌的Gemini AI,你可以通过眼镜的镜框扬声器私密收听。你可以通过眼镜听音乐、按按钮拍照、打电话,或者访问手机应用,这些功能和未来的显示版本一样。

  • 我试了亚马逊的Bee可穿戴设备,感兴趣但有点发毛

    最近我上手试了下Bee,这是亚马逊去年收购的那款AI腕带设备,今年又推了好几轮功能更新。和它宣传的一样,这东西定位就是个”全天候个人助理”:录你一整天的对话、自动转录、生成总结,还能和日历同步之后给你发提醒。

    用法倒不复杂——开机、戴上、和手机App配对、填点基本信息就能跑起来。Bee自带录音按键,绿灯闪就是在录,再按一下就停,录完之后App会自动生成一段易读的总结,完整的转录文本也在里面。

    亚马逊Bee可穿戴设备
    Bee AI可穿戴设备实拍图 (来源:TechCrunch)

    职场场景确实好用

    我专门拿它测了一次商务通话(当然事先征得了对方同意),录完之后App给出的总结相当到位,把对话拆成了几个板块,之后不用重听整段录音就能回顾内容。

    这个功能本身没什么稀奇,Otter、Granola这些工具也能做转录和自动总结,体验上差别不大。但你可以想象,一个整天在不同会议之间辗转的职场人,确实会很需要这种设备——Bee可以一整天都开着,之后随时回顾总结,确认自己没漏掉任何关键内容。

    Bee在工作场景下的表现相当扎实,如果你的一天被各种会议填满,又很难捋清所有内容,它会是个还算称职的助理。

    转录准确度还有提升空间

    Bee生成的对话总结做得不错,但原始转录文本偶尔会有点乱。之前的评测也提到,你通常需要手动输入其他说话人的名字,因为Bee不一定能识别谁在说话。我这次测试中也发现它遗漏了部分聊天内容——倒不是什么重要信息,但确实不是百分之百完整的记录。

    我还带着Bee去参加了每周两次的朋友电影之夜,让它整晚都保持运行。我们当时在看《落水狗》,我还有点担心设备会把所有粗俗的暴力场面当成真实的流血事件、触发什么内部警报。不过Bee基本清楚发生了什么:它识别出我们在看电影,在之后的事件总结里,把这段对话标注为”塔伦蒂诺电影场景分析”。

    隐私问题没法绕开

    对我来说,问题核心在于:我算是个隐私爱好者。在普通人已经被无处不在的数字监控包围的当下,我很珍惜任何不被录制的机会,所以想到要24小时把个会偷听的gadget戴在手腕上,我本来是不太感兴趣的。

    但有点奇怪的是,Bee目前的营销定位很大程度上是面向个人使用的。要接受这点,你得愿意让Bee接触到你线下和数字生活的大部分内容。

    确实,要想好用,Bee需要获取广泛的手机权限,包括位置、照片、手机通讯录、日历和手机通知权限。你还可以和它共享健康数据——如果你出于某种原因想让它知道你的睡眠模式或者静息心率的话。

    Bee收集的大量数据都存在云端,这对数字隐私爱好者来说又带来了新的担忧。科技YouTuber Becca Farsace曾收到消息,Bee展示过完全本地运行的设备demo。如果这家公司真的能做出这样的设备,我会非常感兴趣,甚至会考虑买一台。不过到目前为止,亚马逊还没有公布这方面的进展。


    安全承诺和现实之间的落差

    至于Bee的数字隐私保护,公司表示会对用户数据进行加密,无论是静态存储还是传输过程中都受保护。在隐私政策中,公司表示已经”实施了技术和组织安全措施,旨在保护公司处理的所有个人信息的安保”。Bee还声称会接受”严格的第三方安全审计”,并采用持续的安全监控。

    这些听起来都很不错,不过值得注意的是,亚马逊和很多大型科技公司一样,偶尔也会出现一两个数据安全问题(对于一家管理着全球大量云环境的公司来说,这倒也不算意外,但依然值得关注)。

    简单来说,Bee是一款很有意思的硬件,如果经过一段时间的调整和优化,未来很可能在职场场景有很好的应用前景。但作为个人生活的数字助理,对部分用户来说,它可能还是有点太有侵入性了。

  • Anthropic即将迎来首个盈利季度,营收翻倍至109亿美元

    《华尔街日报》放出一条消息:Anthropic告诉投资人,今年第二季度营收会比第一季度翻倍以上,冲到约109亿美元,而且——这是头一回——要实现运营盈利了。

    这个数字如果兑现,Anthropic相对于头号对手OpenAI的处境会好不少。不过《华尔街日报》也补了一刀:因为接下来有一大笔算力开支要付,Anthropic今年未必能全程保持盈利。

    Anthropic Claude AI
    Anthropic的Claude聊天机器人(图源:Ludovic MARIN / AFP / Getty Images)

    这数据是哪来的

    这些财务数据是Anthropic在一轮融资过程中透露给投资人的。融资嘛,总得拿点漂亮数字出来让人看——营收翻倍、首次盈利,这俩放一块确实够有说服力的。

    过去这一年,Anthropic涨势挺猛。越来越多的专业人士表示更偏好用Claude,而不是其他家的聊天机器人。公司也在努力拓宽客户群,比如给小企业主推新服务,给律师事务所搞新工具。

    有趣的是,Anthropic盈利的消息传出来的同一天,正好也爆出了OpenAI可能很快就要交IPO申请的新闻。

    算力账单是座大山

    营收翻倍听起来很爽,但Anthropic的算力成本也是真烧钱。训练大模型、跑推理、维护服务,每一笔都是天文数字。这就是为什么《华尔街日报》说它”可能没法全年保持盈利”——钱赚到了,但花得也狠。

    这其实是整个AI行业的共同难题。模型越训越大,用户越来越多,算力需求就跟着滚雪球。Anthropic这次能实现单季度盈利,已经是个不小的事情,至于能不能稳住,得看接下来的成本控制做得怎么样。


    跟OpenAI的对比

    Anthropic盈利的消息,跟OpenAI的IPO传闻同一天出来,这时间点卡得够巧的。两家公司一直在明争暗斗:Anthropic主打”更安全、更靠谱”,OpenAI主打”更强大、更通用”。

    如果Anthropic真的在二季度实现盈利,这在AI独角兽里算是相当靠前的。毕竟大多数AI公司现在还在疯烧钱的阶段,能赚到钱的没几家。这也会给即将IPO的OpenAI一点压力——投资人肯定会拿俩家的财务数据来回比。

    Anthropic拒绝对此事发表进一步评论。也正常,融资还没关,话说多了容易出岔子。

  • Spotify联手环球音乐,AI翻唱正式合法化

    Spotify最近干了一件挺有意思的事——跟环球音乐集团(UMG)签了协议,要让用户用AI翻唱和混音自己喜欢的歌。这不是那种游走在法律灰色地带的玩法,而是正儿八经拿到了版权方授权的。

    这个功能会以付费插件的形式上线,只有Spotify Premium订阅用户才能用。参与的艺人还能从AI生成音乐的收入里分一杯羹——这算是给音乐人们吃了颗定心丸。

    Spotify app on phone screen
    手机屏幕上显示的Spotify图标(图源:Jakub Porzycki/NurPhoto / Getty Images)

    明摆着在怼谁

    Spotify去年就透露过这个计划,当时特意强调了一句话:”通过事先协议来实现,而不是先做了再求原谅。”这话说的,明眼人都能看出来是在怼谁——就是Suno和Udio那帮人。

    Suno和Udio确实是AI音乐生成领域的先行者,但他们起步的时候根本没搞定版权问题。结果可想而知,三大唱片公司直接把状子甩了过去。去年11月,Suno跟华纳音乐集团达成了5亿美元的和解——这钱够多的。

    环球音乐和索尼音乐还在告Suno,Udio虽然已经跟华纳和环球和解了,但跟索尼的官司还没打完。

    Spotify的玩法不一样

    消费者显然想要这种功能,Spotify干脆直接去找版权方谈。规则很明确:艺人和版权方自己决定参不参与,参与的话怎么分钱,都由他们说了算。

    Spotify联合CEO亚历克斯·诺斯特伦说:”解决音乐领域的难题是Spotify的拿手好戏,AI翻唱和混音是下一个目标。我们正在打造的东西,根基是征得同意、署名权和补偿机制,参与的艺人和词曲作者都能获益。”

    环球音乐集团董事长兼CEO卢西恩·格兰奇也挺买账,说这能让艺人和粉丝的关系更深,还能多赚一份钱。目前还不知道有哪些环球旗下的艺人愿意参与,估计得等功能正式上线才能见分晓。


    不只是AI翻唱

    这笔交易是Spotify投资者日当天公布的一揽子消息之一。同一天还发布了好几个AI相关的新功能:

    • 基于ElevenLabs的AI有声书创作工具
    • 播客的AI问答和摘要生成功能
    • 用AI生成个人播客的桌面端应用
    • 为头部粉丝保留演唱会门票

    环球音乐只是第一个,Spotify大概率还会跟更多唱片公司签类似的协议。毕竟索尼和华纳那边也有不少艺人,粉丝的AI翻唱需求同样旺盛。

    这件事最大的意义在于:AI生成音乐终于有了一条合法、合规、各方都能分到钱的路径。之前Suno和Udio搞得沸沸扬扬,归根结底就是没解决版权问题。Spotify这次把规则定好了,后续其他平台估计也会跟着学。

  • Anthropic收购Stainless背后:AI工具链的锁定战略

    5月18日,Anthropic 宣布收购 SDK 生成工具 Stainless,行业消息称成交额超过2.8亿欧元,约合22.18亿元人民币。这笔收购看起来是一桩普通的 AI 基础设施并购,但如果你知道 Stainless 在 AI 开发工具链里的位置,就会明白 Anthropic 在做什么。

    Anthropic收购Stainless
    Anthropic 收购 Stainless 报道(来源:IT之家/新浪科技)

    Stainless 是做什么的

    简单来说,Stainless 做的事情很”基础设施”:它自动把 API 规范转换成 TypeScript、Python、Go、Java 等多语言的 SDK(软件开发工具包)。对于一个提供 API 的公司来说,维护多语言 SDK 是件极其枯燥且容易出错的事,Stainless 把这个流程自动化了。

    更有价值的是,当 API 发生变化时,Stainless 能自动更新对应代码。这意味着依赖外部接口的开发团队可以大幅降低维护成本,加快集成速度。在 AI 时代,几乎所有公司都在对外提供 API,这个能力的战略价值被成倍放大。

    Stainless 成立于2022年,创始人 Alex Rattray。在被收购前,它的客户包括 OpenAI、谷歌、Cloudflare 等数百家公司。可以说,整个 AI 行业的开发者工具链里,都有 Stainless 的影子。

    收购后的”切断”操作

    Anthropic 完成收购后的第一个动作,是把 Stainless 的全部托管产品关停。也就是说,OpenAI、谷歌这些曾经的客户,没法继续用 Stainless 的托管服务了。他们要么自己维护已生成的代码库,要么去找替代方案。

    现有客户虽然保留了已生成代码库的专属所有权,可以继续自行修改和扩展,但后续无法获得 Stainless 官方的更新和支持。这个操作本质上是在”锁喉”——把一项对 AI 智能体开发尤为关键的连接层能力,从开放市场收回到 Anthropic 体系内部。

    对于 OpenAI 和谷歌来说,这不是小事。它们的开发者生态高度依赖流畅的多语言 SDK 支持,突然失去 Stainless 的托管服务,要么投入资源自建类似能力,要么找其他第三方工具——但市面上能替代 Stainless 的产品并不多。

    为什么是现在

    把时间线拉长来看,这笔收购和同一周 Andrej Karpathy 加入 Anthropic,以及 Anthropic 洽谈至少300亿美元新一轮融资(估值可能超过9000亿美元),是同一个战略的不同落子。

    Anthropic 在做的,是一件微软和谷歌都做过的事:控制开发者工具链。当你用我的工具构建应用,你的产品就天然绑定了我的生态。AI 时代的”开发者工具链”战争,实际上比模型能力竞赛更决定长期格局。

    Stainless 创始人 Alex Rattray 表示,加入 Anthropic 是自然决定,团队能在”更早认可这项技术价值的公司”体系内继续推进工作。这句话的潜台词是:OpenAI 和谷歌并没有真正理解 Stainless 的战略价值。

    同期还有一个细节:Claude Code 的快速模式默认模型从 Opus 4.6 切换到 Opus 4.7,代码迭代速度提升2.5倍。Anthropic 在企业版推出 Managed Agents 自托管沙箱,Agent 可在私有网络运行而无需暴露公网端口。这些动作和收购 Stainless 放在一起,是一个完整的”企业 AI 开发平台”拼图。


    对行业的影响

    短期来看,OpenAI 和谷歌需要快速找到 Stainless 的替代方案。中长期来看,这笔收购可能会被监管机构关注——如果 Anthropic 在 AI 开发者工具链上的份额过大,会不会构成新的”垄断”争议?

    更深层的问题是:当 AI 实验室从”提供模型”向上游的”开发者工具链”延伸,行业会不会出现新的割裂?如果每家实验室都推自己的 SDK 工具,开发者最终要在多个生态之间做选择,这对整个行业的创新效率未必是好事。

    Anthropic 这笔2.8亿欧元的收购,买的不只是 Stainless 的技术团队,更是 AI 开发工具链的战略咽喉。这个信号,值得所有在做 AI 基础设施的人认真想想。

    📎 原文来源:新浪科技 · IT之家报道
  • Karpathy投奔Anthropic,OpenAI重组冲刺IPO:这一周AI圈发生了什么

    这一周 AI 圈的热闹程度,差不多赶得上去年的同一时期。Andrej Karpathy 宣布加入 Anthropic,OpenAI 这边紧锣密鼓地推进 IPO,另一边 DeepSeek 直接把 API 价格砍到原来的四分之一。三件事摆在一起看,你会发现 AI 行业的竞争节奏已经完全变了。

    Karpathy 的”二次出走”

    5月19日,Karpathy 在社交媒体上发了短短一行字:”Personal update: I’ve joined Anthropic.” 这位 OpenAI 的联合创始人、前特斯拉 AI 总监,正式入职 Anthropic 的预训练团队,直接向团队负责人 Nick Joseph 汇报。

    说”二次出走”是因为 Karpathy 的职业生涯一直在几个顶级 AI 实验室之间游走。他最早是 OpenAI 的创始成员之一,后来去了特斯拉带队 Autopilot,离开特斯拉后又回到了 OpenAI。现在他选择 Anthropic,而不是回 OpenAI,这个信号值得玩味。

    Andrej Karpathy 是以个人贡献者身份加入的,不是来当管理者的。他要组建一个”用 Claude 本身来加速预训练研究”的小组——意思是让 AI 帮忙做 AI 研究,这个思路很 Anthropic。

    Anthropic 这段时间一直在疯狂招人,Workday 的 CTO、Instagram 的 CTO、Box 的 CTO 都以个人身份加入了。但 Karpathy 无疑是其中名头最响的一个。他加入的预训练团队,恰恰是大模型”底座”最核心的地方。

    OpenAI 的 IPO 冲刺与内部大重组

    就在 Karpathy 官宣的同一周,OpenAI 内部发生了一次大规模重组。联合创始人兼总裁 Greg Brockman 正式接管全部产品战略,取代因病休假的 AGI 部署负责人 Fidji Simo。Brockman 在全员备忘录里说得很直白:要建设”一个统一的 Agent 平台”。

    视频生成产品 Sora 同日关停,理由是算力消耗与营收严重不匹配。产品负责人 Kevin Weil 和技术负责人 Bill Peebles 随之离开。这些人事变动的背后,是 OpenAI 正在为 IPO 做最后准备。

    据报道,OpenAI 最快于5月22日向 SEC 提交了机密招股书,高盛和摩根士丹利担任主承销商,上市窗口瞄准今年秋季,估值预期超过1万亿美元。如果成功,这将是 AI 时代最具标志性的上市事件。

    OpenAI重组与IPO规划
    OpenAI 产品线重组示意图(来源:新浪财经)

    但财务数据也同步披露了出来:Q1 营收57亿美元,调整后经营利润率为负122%。也就是说每赚1美元要亏1.22美元。用户增长也在放缓,ChatGPT 周活9.05亿,低于2月峰值9.2亿。IPO 之前,OpenAI 需要给资本市场讲一个更动人的盈利故事。

    好消息是,马斯克对 OpenAI 的诉讼在同一周被加州联邦陪审团驳回,理由是全部索赔已过诉讼时效。IPO 路上一块巨大的法律绊脚石,就这样消失了。

    DeepSeek 的”永久降价”到底意味着什么

    5月22日,DeepSeek 官方宣布:V4-Pro 模型的2.5折优惠在5月31日到期后,将直接锁定为原价的四分之一,不再恢复原价。调整后输入价0.435美元/百万 token,输出0.87美元/百万 token。

    这个定价是什么概念?比 GPT-5.5 便宜约98%。而且 DeepSeek V4-Pro 总参数1.6万亿,每次推理激活490亿参数,是目前参数量最大的开放权重模型。用华为昇腾芯片跑推理,成本结构和英伟达路线完全不同,这就是降价的底气。

    DeepSeek 这一招”永久降价”,本质上是用价格战倒逼整个行业重新审视推理成本。如果你用极低的价格提供顶尖水平的模型能力,竞争对手要么跟进,要么失去价格敏感的开发者和企业用户。

    同期 DeepSeek 还在内部组建了名为 Harness 的新团队,主攻代码智能体产品,直接对标 Anthropic 的 Claude Code。V4-Pro 全部运行在华为昇腾芯片上,这种”芯片+模型+应用”的全栈打法,是目前美国实验室做不到的。

    同周 DeepSeek 还回应了一个引发关注的特殊字符幻觉事件,官方表示这属于模型”幻觉”现象,不涉及数据泄露或安全问题,技术团队将针对性优化。


    三件事放在一起看

    Karpathy 加入 Anthropic,说明顶级研究者认为 Anthropic 的技术路线更有前途。OpenAI 推进 IPO,说明资本市场对 AI 的期待已经到了必须兑现的时刻。DeepSeek 永久降价,说明中国 AI 实验室正在用成本优势重构全球竞争格局。

    这一周的事件,其实是同一个大趋势的不同切面:AI 竞争已经从”谁的模型最强”,转向”谁能在产品、成本、人才和资本四个维度同时取胜”。目前来看,还没有任何一家实验室能在这四个维度上同时领先。

  • Google DeepMind憋了个大招:AI不再只陪你聊天,开始帮你搞科研了

    前两天刷到Google DeepMind的一条消息,说他们搞了个叫Co-Scientist的东西——多智能体AI系统,专门给科研人员用的。我第一反应是:又来一个”AI助力科研”的PPT项目?但仔细看完,发现这次有点不一样。

    Google DeepMind Co-Scientist AI系统
    Co-Scientist:基于Gemini构建的多智能体科研助手

    从”搜索工具”到”科研搭档”,这步跨得挺大

    以往AI在科研里的角色,说白了就是个高级搜索引擎——你问它”XXX领域有什么进展”,它给你列一堆文献摘要,然后你自己去啃。

    Co-Scientist想做的事不一样。它的定位是:假设生成、讨论、验证的协同伙伴。核心架构是”生成-讨论-验证”三阶段,多个AI智能体互相抬杠、互相验证,最后给你一个它觉得靠谱的假设方向。

    传统科研里,一个有价值的研究假设,往往需要研究者花几个月甚至几年去打磨。Co-Scientist的目标,是把这个”灵感孵化”的过程,压缩到几天甚至几个小时。

    它到底强在哪?不是参数多,是”会自己纠偏”

    DeepMind在介绍里特意强调了一点:Co-Scientist强化了准确引用专业文献自我修正逻辑矛盾的能力。

    这话什么意思?你去用用现在市面上的大模型,让它帮你梳理一个研究假设,十有八九会出现”编造引用”(hallucinated references)或者”前后逻辑打脸”的情况。Co-Scientist针对这个痛点做了强化,目标是让AI在科研场景里不乱说话

    当然,现在它还处在实验性开放阶段,主要面向研究机构,不是你我去网页上就能白嫖的。但它透露出的方向很明确:AI不再只是”知识的搬运工”,而是开始涉足”知识的创造过程”。


    瞄准的是哪些科研领域?生物学、化学,还有那些”人类搞了几十年还没搞明白”的难题

    DeepMind在展望里点名了几个方向:

    • ALS(肌萎缩侧索硬化症)治疗:这个病折腾了科学界几十年,AI能不能帮忙找到新的药物靶点或者治疗路径?Co-Scientist想试试。
    • 衰老研究:衰老机制极其复杂,假设空间巨大,人工筛选成本极高。AI介入后,可能会开辟一些人类研究者还没想到的角度。
    • 化学分子设计:新药物、新材料的分子结构搜索,本质上是超高维空间的探索问题,AI”生成-验证”的循环在这里很有优势。

    未来DeepMind还打算把Co-Scientist跟实验自动化系统整合起来。到那时候,AI不只是帮你”想”,还能指挥实验室里的机器人去”做”,再把结果喂回来继续迭代。这个闭环一旦跑通,科研效率的跃升会是数量级的。

    跟OpenAI证明数学猜想那件事,其实是同一个信号

    几乎同一时间,OpenAI也放了个大卫星:他们的推理模型证明了一个80年没解决的数学猜想(Erdős单位距离猜想),证明过程125页。

    这两件事放在一起看,信号就很清楚了:2026年的AI,已经从”帮我总结一下”进化到”帮我证明/帮我发现”了。这不是简单的参数堆砌,而是推理能力、文献理解、逻辑自洽性这几件事同时到了一个临界点。

    科研人员如果还在把AI当”高级搜索引擎”用,可能真的有点亏了。下一步值得关注的,是这些科研AI智能体能不能真正加速重大发现,而不只是在已有假设上修修补补。