标签: AI

  • 西班牙人做机器人,不走波士顿动力的路子

    西班牙人做机器人,不走波士顿动力的路子

    类人机器人喊了这么多年,工厂里还是少见。不是技术不行,是制造业等不及了。欧洲一家叫Theker的初创公司刚完成8500万美元A轮融资,做的就是这件事——让机器人真的进工厂。

    他们的思路跟波士顿动力那种固定形态的人形机器人不一样。Theker的机器人可以重新配置,手、手臂、整体形态都能根据任务换。今天分拣包裹,明天打包服装,后天在仓库里处理瓶罐,同一个机器人换个”零件”就能干。

    Theker机器人
    Theker联合创始人,来源:Theker

    Zara的母公司投了,但这只是起点

    Theker的第一个大客户是Zara的母公司Inditex。这件事的意义不只是拿到一个客户,而是证明了他们的方向是对的——零售和物流的场景足够复杂,能搞定这里,制造业就不会太远。

    这轮融资由美国VC公司CRV领投,三星和LVMH董事长贝尔纳·阿尔诺旗下的Aglaé Ventures也跟进了。三星目前还不是客户,但双方聊得很深。Theker的态度很明确:欢迎三星同时当客户、供应商和投资者,这种三重身份能让一家初创公司同时拿到大规模制造的订单和信任背书。

    “我们创立Theker不是为了做试点项目。”联合创始人Carla Gómez Cano说得很直接。所以他们完全跳过创新部门,直接找物流或运营部门谈,那些地方的合作是实打实的,决策也快得多。

    欧洲史上最大机器人A轮,钱要花在哪

    8500万美元,Theker说这是”欧洲有史以来规模最大的机器人领域A轮融资”。他们在巴塞罗那市中心设了展示厅,接下来还要在欧洲、美国和亚洲开更多。团队现在几十人,到今年年底要冲到120人——光是筛选15000份求职申请就够忙一阵的。

    融资额是原计划的两倍。Gómez Cano之前还说要融3000万或4000万美元,结果拿了两倍的份。这件事也让他们更坚定了把总部留在巴塞罗那的决定。巴塞罗那这几年机器人产业起来了,Theker就是其中的代表。

    工厂机器人这个赛道,过去几十年一直是日本和德国的天下。现在AI进来了,游戏规则开始变。Theker的赌注是:通用化,而不是 specialization。一个能换零件的机器人,比十个只能干一件事的机器人,对工厂来说可能更划算。


    • Theker完成8500万美元A轮融资,CRV领投,三星和Aglaé Ventures跟投
    • 机器人支持重新配置,可适配分拣、打包、仓储等多种任务
    • Zara母公司Inditex为早期支持者,目标拓展至制造业
    • 总部位于巴塞罗那,计划扩建展示厅并扩大团队至120人
  • 毕业典礼上学生嘘AI演讲,微软写了3100字长文回应:你们是在提醒我们

    这几年科技公司推广AI的方式,和大众对AI的真实感受,中间有一道越来越宽的裂缝。最近美国各地大学毕业典礼上出现了一个有趣的现象:只要演讲嘉宾提到AI,台下就会响起嘘声。相关视频在TikTok和X上疯传,成了某种集体情绪的出口。

    前谷歌CEO埃里克·施密特在亚利桑那大学演讲时遭遇学生大声抗议;另一场佛州毕业典礼上,演讲者刚说AI是「下一个工业革命」,台下的反应也是一片起哄。这些视频看起来是学生在闹,但实际上折射的是一种更广泛的不满——年轻人一边在用AI,一边对它带来的后果感到不安。

    Microsoft
    微软总部 | 来源:The Verge

    微软的3100字回应

    面对这个局面,微软副总裁兼总裁布拉德·史密斯(Brad Smith)没有直接无视,而是写了一篇超过3100字的长文,标题叫《AI、就业与下一代》。文章的态度是温和的,甚至有点反思的意味。

    史密斯在文章里说,那些对AI提及皱眉甚至发出嘘声的毕业生,「其实是在告诉我们该听的信息:是时候再次提高标准了」。他在X平台上也补充了一句:「发出嘘声的毕业生是在提醒我们,AI应该服务人,而不是取代人。」

    「你们处于能发挥积极影响的位置,你们经历过不少挑战。虽然就业市场的不确定性可能让你觉得不公平,但你就是为这个时刻而生的。」

    这封信是写给谁看的?

    The Verge的文章提出了一个挺尖锐的问题:史密斯这篇长文,到底是说给愤怒的毕业生听的,还是说给那些看了嘘声视频却不以为然的企业高管听的?

    如果是后者,那这篇文章的意义就不一样了。那些高管本来就需要被提醒「AI要服务人」,但问题是,他们本身就是推动AI大规模落地的人。指望他们自我约束,这件事本身就有点矛盾。

    更何况,科技圈在这件事上的公信力并不高。OpenAI的CEO山姆·奥特曼之前警告AI会有灾难性影响,后来发现这种说法不受欢迎,又改口了。微软自己的AI CEO Mustafa Suleyman也一直在就业话题上「走钢丝」。大家不信,也是有原因的。


    年轻人的AI愧疚感

    这件事背后还有一个值得注意的细节。最近有调研发现,Z世代其实广泛使用AI,但用的时候会有「愧疚感」。他们知道AI有问题——能耗、版权、对就业的影响——但又离不开它。这种矛盾心理,在毕业典礼那个场合被放大了。

    毕业典礼本来是个展望未来时刻,演讲嘉宾站在台上描绘AI将如何改变世界,台下的学生听到的可能是:「我未来的工作要被这个东西取代了,而你正是推动这件事的人。」嘘声是一种抗议,但也是一种无力感的表达。

    史密斯的长文试图消解这种对立,但他的核心逻辑还是「AI会来,我们要学会适应」。这个叙事框架本身,可能就是学生不信的原因之一。

  • 狮门影业买了Runway的股份,打算用《饥饿游戏》IP做AI短剧

    好莱坞和AI的关系一直很微妙。一边是编剧大罢工留下的伤口还没愈合,一边是各家制片厂悄悄地和AI公司签协议。6月11日,狮门影业(Lionsgate)和生成式视频AI公司Runway宣布把合作升级——不只是技术合作,狮门还直接拿了Runway的少数股权。

    从「用AI做电影」到「用IP做AI内容」

    这次合作的核心内容其实分三层。第一层是股权:狮门买进了Runway的少数股份,正式成为战略股东。第二层是内容开发:双方要联合开发新的IP,同时推出一系列AI驱动的合作项目,其中第一批落地的就是AI生成的短剧系列。第三层是IP授权:狮门把自己手里的一堆经典IP交给Runway,用来训练或者生成内容。

    狮门手里的IP清单相当能打——《饥饿游戏》《疾速追杀》《分歧者》《广告狂人》……这些IP加起来的全球票房超过200亿美元。现在Runway可以用这些IP来生成AI短剧,至于具体先用哪个IP,双方暂时还没公布。

    John Wick
    狮门影业经典IP《疾速追杀》剧照 | 来源:TheWrap

    Runway的CEO说:AI是创意资源,不是省钱工具

    这话说出来其实挺有讲究的。好莱坞对AI的最大恐惧就是「AI来替代编剧和演员」,所以美国编剧工会(WGA)2023年大罢工的核心诉求之一就是限制AI的使用。Runway联合创始人兼联席CEO Cristobal Valenzuela特意强调了这个定位:

    「我们一直看到,对AI最重视的制片厂都将其视为创意资源,而非削减成本的工具。狮门理解这一点。此次扩大合作将帮助更多故事更快被讲述。」

    狮门副董事长Michael Burns的表态也在这个方向上:「Runway是很好的创意合作伙伴……它将帮助我们的创作者重新定义和重塑他们创意实践中『可能性』的边界。」

    上次的合作其实卡住了

    这不是狮门和Runway第一次合作。2024年双方就签过合作协议,但据TheWrap此前的独家报道,那个合作在「用AI生成完整电影」这件事上遇到了不小的限制——生成出来的画面达不到电影级的要求。这次调整方向,改做短剧系列,某种程度上是双方在现实约束下找到的一个新路径。

    短剧这个格式对AI生成来说要比长片友好得多。单集几分钟,容错率更高,观众对画质的容忍度也更高。而且短剧现在的商业逻辑已经跑通了——TikTok、Reels、Shorts这些平台上的剧情类短内容,已经有稳定的受众和变现路径。


    AI电影节的信号

    作为合作的一部分,狮门会成为Runway今年6月举办的「Runway AI电影节」的呈现合作伙伴。这个电影节的定位是展示AI辅助创作的电影作品,狮门的加入等于给了这个活动一个主流制片厂的背书。

    目前双方还没有公布AI短剧系列的具体上线时间表。但从合作宣布的节奏来看,Runway显然希望在AI视频生成这个赛道上,抢在OpenAI的Sora正式大规模开放之前,先把自己的商业落地案例做出来。

  • 独立音乐人把Google告了:你在用我的歌训练AI,还不承认?

    Google Lyria AI音乐训练争议
    独立音乐人起诉谷歌,指控其使用YouTube内容训练Lyria AI音乐模型 | 图片来源:The Verge

    独立音乐人把Google告了:你在用我的歌训练AI,还不承认?

    一群独立音乐人正在起诉谷歌,理由听起来挺直接:谷歌非法使用他们上传到YouTube的歌曲来训练Lyria 3音乐生成模型。但谷歌的回应方式,比诉讼本身更值得玩味。

    谷歌已提交驳回诉讼的动议。它的抗辩策略是典型的”两步走”:先说”你们无法证明我们用了你们的具体作品来训练”,再退一步说”就算我们用了,你们也在服务条款里授权我们这么做了”。

    “他们的诉讼基于’谷歌用他们的特定作品进行训练’这一没有证据支持的假设。即使接受他们未经证实的指控为事实,这份起诉书也不成立。每位原告都授权YouTube及其服务提供方谷歌,对上传内容拥有广泛的使用许可。”

    这是法律文件的常规操作。但当记者直接问谷歌是否使用YouTube视频训练Lyria 3时,该公司拒绝置评。这个沉默本身,其实已经说明了一些问题。

    谷歌自己说漏过嘴

    把几件事放在一起看,答案其实相当明显。

    2024年4月,YouTube CEO尼尔·莫汉(Neal Mohan)在接受彭博社采访时提到,YouTube视频的”一部分”可能会被内部用于训练Gemini等模型。同年晚些时候,一篇关于创作者工具的官方博客也确认了这一点,称”我们使用上传到YouTube的内容,来改善YouTube和谷歌平台上的创作者和观众的产品体验,包括通过机器学习和AI应用的方式。”

    谷歌甚至向CNBC确认,它正在使用YouTube上传内容训练Gemini和Veo。只是从头到尾,它从来没有明确确认过:这些内容是否也被用来训练Lyria。

    所以在驳回诉讼的动议里,谷歌其实把底牌亮出来了:原告直接将内容上传到YouTube时,已同意YouTube的服务条款,该条款授予谷歌”复制、分发、制作衍生作品”等基于上传内容的广泛权利。

    为什么不干脆承认

    原因并不难理解。目前谷歌公开承认这件事并没有什么好处,而且在诉讼仍在进行的情况下,保持”合理推诿”是它经过计算的策略。

    但这件事触及的问题比一场诉讼更大。AI音乐生成模型需要大量音乐内容作为训练数据,而全球最大的音乐视频平台就是YouTube。如果谷歌在用YouTube上的音乐内容训练Lyria,它面对的就不只是这一场集体诉讼,而是整个音乐创作者群体对AI训练数据合法性的质疑。

    华纳音乐今年收购AI溯源公司Sureel AI,走的正是另一条路:用技术追踪AI训练中的版权使用,而不是等到被告上法庭才回应。谷歌选择的是更硬的抗辩姿态,这场官司怎么判,可能会影响整个AI音乐行业的游戏规则。


  • 在线购房平台Opendoor撤出印度,AI真的在吃掉外包饭碗吗

    Opendoor撤出印度
    Opendoor在印度业务仅运营不到两年便宣布撤出 | 图片来源:TechCrunch

    在线购房平台Opendoor撤出印度,AI真的在吃掉外包饭碗吗

    在线购房平台Opendoor本周宣布关停印度业务,距离它在钦奈和班加罗尔开设办公室还不到两年。CEO Kaz Nejatian给出的说法是:要把运营工作迁回客户所在的美国,同时转向规模更小、以AI为核心的团队。

    这则公告在硅谷引发了一轮不小的讨论。创始人、投资者和外包专家都在问同一个问题:AI是不是已经开始改变离岸工作的经济逻辑了?

    印度早已不是只做外包后台工作的地方。它是全球最大的全球能力中心(GCC)市场——跨国企业设立的专属离岸单元,负责处理从IT、财务到研发的所有业务。印度目前有超过2100个这类中心,雇佣约236万人,年营收接近1000亿美元。

    Opendoor在2024年进军印度时,在钦奈和班加罗尔组建了近250人的团队,主要处理分散在各系统中的手动工作流。但过去几年,整个公司一直在收缩。证券文件显示,去年年底Opendoor全球员工总数为1042人,而前一年是1470人;非美国员工数量也从342人缩减到184人。

    大规模裁员让人很难单纯从”AI替代外包”这个角度来理解印度业务的关停。在美国房地产市场低迷、在线购房业务整体承压的背景下,Opendoor一直在全业务线削减成本。但Nejatian解释这一举措时的表述,还是让投资者和外包分析师感到共鸣——他们认为AI正在重塑企业组织运营工作的方式。

    投资者怎么看

    部分投资者把Opendoor的决定当作AI对印度庞大外包劳动力影响的信号。Better Tomorrow Ventures联合创始人Sheel Mohnot直接写道:”随着手动工作被AI取代,印度的很多工作岗位都会消失。”

    另一些人看到的则是企业组织方式更大范围的转变。Emergent Ventures风险投资家Keshav Lohia称这是”AI驱动运营的转折点”,认为AI的进步正在开始挑战让印度成为热门离岸目的地的成本套利模式。

    HFS Research首席执行官Phil Fersht对TechCrunch表示,这一进展不应只被看作工作岗位从印度转移到美国,更重要的转变是:AI正在减少企业原本需要的运营人力规模,让企业无论位于何处都能以更精简的组织运营。

    “这不是一次孤立的重组。这是随着企业围绕AI、自动化和更精简的工作流重新设计运营,我们开始看到的更广泛模式的一部分。”

    “服务即软件”时代来了?

    Fersht认为,赢家将是那些把AI、软件和人类专业知识结合起来、在不持续增加人员规模的情况下交付成果的企业。他把这种模式描述为”服务即软件”(service-as-software)。

    他说,虽然Opendoor可能是第一个备受瞩目的案例,但不太可能是最后一个。

    部分投资者的思考已经延伸到单个企业之外。Speedinvest风险投资家Varun Rekhi认为,如果AI降低对劳动密集型服务的需求,最终可能会给印度最重要的出口产业之一带来压力——该产业的核心就是向全球企业供应人才和专业知识。

    目前的Opendoor案例仍然复杂。该公司多年来一直在大幅削减人员规模,其退出印度业务的原因,既关乎自身的困境,也关乎AI和离岸工作的未来。但可以肯定的是,类似的讨论只会越来越多。


  • 把核反应堆冷却技术搬进数据中心,这家MIT初创公司说能零耗水还省电

    AI的爆炸性增长,背后是数据中心的大规模扩张。到这个十年结束的时候,美国数据中心的用电量预计会占到全国总量的9%到17%。而今天,数据中心大约有三分之一的电力是花在冷却芯片上的。

    这就是Ferveret想要解决的问题。这家公司的名字不太常见,是两个MIT的研究员创办的。其中一个是Reza Azizian,他曾经是MIT核工程方向的博士后;另一个是Matteo Bucci,MIT核科学与工程系的副教授。

    从核反应堆到AI芯片

    他们做的事情听起来有点跨界:把核反应堆里的热量传递技术,搬到数据中心的芯片冷却上。核反应堆里,怎么把堆芯的热量高效地导出来,直接决定了能发多少电。科学家在这件事上研究了几十年。现在,同样的技术思路被用到了AI芯片上。

    Ferveret的方案叫自适应相变冷却(APC)。简单说,就是把服务器整个浸没在一种特殊的液体里。这种液体比风扇吹出来的空气吸热效率高得多。但Ferveret跟别家的浸没式冷却不一样的地方在于气泡——他们的液体在服务器表面产生的小气泡,比别的方案更小,脱离表面的频率也更高,这样热量传递就快得多。

    最关键的一点是,这个方案不耗水。传统的数据中心冷却,蒸发水冷要耗掉大量的水。Ferveret用的是一种低沸点的液体,不含那些有毒的PFAS”永久化学物质”,而且根本不需要往系统里加水。

    Ferveret冷却系统
    Ferveret的冷却系统将服务器浸入特殊液体中(图片来源:MIT News)

    实测数据

    他们最近跟加州大学洛杉矶分校的塞缪利计算机科学系合作做了一项测试,结果显示Ferveret的APC方案比目前最先进的液冷方案,计算能效提升了15%。如果把这部分节省下来的电,再加上Ferveret的功率控制系统对运行条件的优化,同样多的电力,数据中心的AI模型能多产出35%的token。

    Azizian第一次走进数据中心是2017年。他记得那时候整个建筑里全是巨大又嘈杂的冷却风扇。”我当时想,天哪,你们不是这么冷却设备的吧。”风冷最多能占到数据中心总功耗的40%。因为不影响性能,没人介意这套技术已经是50年前的了。

    模块化设计,适配现有基础设施

    Ferveret的产品做得比较巧妙,不是那种把服务器整个泡进去的大油箱,而是一个个能装单台服务器的小箱子,直接装在机架里。这样的模块化设计,部署和维护都方便,现有的数据中心基础设施不用大改。

    他们还配套提供了控制软件,实时调整每台服务器的功率,进一步优化效率。Bucci说,他们的全栈系统包括冷却箱、机架、冷却分配单元和传感器,软件会监控这些传感器的数据,自动把每个箱子里的运行条件调到最优。

    零耗水的地理红利

    零耗水还有一个额外的好处。阳光充足的地方往往缺水,比如非洲、中东、美国的一些地区。Ferveret的技术让那些地方也有可能建数据中心,用当地的可再生能源,不用担心冷却用水的问题。

    Ferveret现在已经跟几家公司展开了测试,包括数据中心开发商CleanSpark、AI加速器公司FuriosaAI,还有美国最大的数据中心运营商之一Switch。他们也在跟那些超大规模的云厂商谈,目前已经是英伟达Inception初创扶持计划的成员。公司计划今年晚些时候公布更多合作伙伴的消息。


  • 亚马逊第一次公布数据中心用水数字:一年25亿加仑,说自己比同行省水

    亚马逊终于把数据中心用多少水这件事说出来了,这是他们第一次公开年度用水数据。2025年,亚马逊全球数据中心一共烧掉了25亿加仑的水。

    数字公布的时间挺微妙。就在西雅图通过了一年数据中心建设禁令之后没多久,这个禁令还得到了部分亚马逊员工的支持。公司这时候把用水数据亮出来,多少有点回应外界质疑的意思。

    25亿加仑背后的数字游戏

    25亿加仑,听起来是个天文数字。但亚马逊说,他们的用水效率其实比微软、谷歌、Meta这些同行都要高。他们的报告里有一张对比图,显示每用1千瓦时的电,亚马逊的数据中心耗水0.12升,比那几家的数字都低。

    不过这个对比有点取巧。亚马逊引用谷歌的数据,只针对Gemini AI的数据中心,而亚马逊自己的数据覆盖的是全部业务。如果把谷歌所有数据中心的用水算进来,情况可能不一样。

    还有一个漏洞。亚马逊的用水统计,没有算上为数据中心供电的那些发电厂间接用了多少水,也没有把新建数据中心施工过程中的用水算进去。环保组织一直盯着这一点,说科技公司的用水报告总是挑对自己有利的数字放出来。

    风冷为主,水冷为辅

    亚马逊说他们有办法省水。数据中心90%的时间用的是风冷,只有最热的那几天、一天里最热的几个小时,才会打开蒸发水冷系统。他们还把服务器的耐热阈值调高了,让机器在高温下也能撑得住,这样就不用一热就开水冷。

    亚马逊引用了一篇去年发表的同行评审论文,调整后的数字显示,他们的数据中心用水效率是行业平均水平的7倍。这个数字外界还无法独立核实。

    亚马逊数据中心
    亚马逊的数据中心园区(图片来源:The Verge)

    时机不凑巧

    外界的质疑声不会因为这一个报告就停下来。数据中心用水这个话题,已经从小圈子里的技术讨论变成了社区政治。纽约州已经通过了一年的数据中心建设禁令,西雅图的禁令能不能撑过法律挑战还不好说。亚马逊这时候把数字亮出来,更像是一次公关防御,而不是主动透明。

    科技公司之间比用水效率,这件事本身就很新。过去大家比的是算力、比的是模型效果,现在算力背后的环境成本被摆到了台面上。亚马逊第一个把数字亮出来,不管怎么说,总比一直捂着强。


  • DoorDash用AI聊天机器人点餐,拍张照片它就知道你想吃什么

    外卖App的点餐体验其实一直有点笨:你知道自己大概想吃什么,但就是找不到——要么搜关键词匹配不到,要么翻了半天菜单还是拿不定主意。DoorDash本周推出的一款AI聊天机器人,想用对话的方式把这个过程重新做一遍。

    这个功能叫”Ask DoorDash”,已经在iOS的部分美国用户中开始推送。它的核心逻辑很简单:你不用再手动搜索餐厅或商品,直接用自然语言告诉它你想吃什么,或者更直接一点——拍张照片,它帮你把照片里出现的东西变成购物车。

    拍照就能生成购物车

    杂货购物是这个功能最实用的场景。你可以拍一张烹饪书的页面,或者手写的购物清单,甚至直接拍一张食谱截图,Ask DoorDash会自动识别其中的食材和分量,帮你把对应的商品加进购物车。它还会贴心地问你:家里还有没有糖?有没有黄油?避免你重复购买。

    如果你之前在这家店下过单,它还能根据你的历史订单推荐商品,或者帮你一键重新下单上次的购物车。这个设计和国内一些电商App的”再来一单”有点像,但多了AI对话的灵活性——你可以说”上次买的那款咖啡再来一包,再加两盒牛奶”。

    DoorDash AI聊天机器人点餐
    DoorDash新推出的Ask DoorDash支持文字和照片两种方式点餐丨图片来源:TechCrunch

    点餐和预订也一样

    点餐的场景更偏向”模糊搜索”。你可以告诉它”帮我家四口人找点能吃饱的晚餐”,它会返回一堆匹配的餐厅,并且附带一句个性化说明解释为什么推荐这家。如果结果不够精准,你可以继续对话:”有没有适合带孩子去的?口味要清淡的。”它会在这个基础上重新筛选。

    选好餐厅之后,它还能根据你的饮食偏好、预算和用餐人数,直接帮你生成推荐购物车——相当于把”看菜单→选菜→加购物车”这几步合并成一句话。

    预订功能也是类似的逻辑。你说”晚上8点左右,市中心,两个人约会用”,它会返回有空位的餐厅列表。不满意可以继续提要求:”有没有环境更私密一点的?”

    大家都在做,但DoorDash来晚了

    把AI助手塞进外卖和购物场景,这个概念已经不算新鲜了。今年2月,Uber Eats就推出了一个名为”Cart Assistant”的AI购物车助手;Instacart也有类似的AI购物工具,面向使用Instacart技术的杂货商客户开放。大家押的赌注是同一件事:AI让”购物”这件事变得更像”聊天”,用户不用再适应软件的搜索逻辑,软件来适应用户的说法方式。

    从实际体验来说,这套思路确实解决了一些痛点。传统搜索要求用户知道确切的餐厅名或商品名,但现实中很多人点外卖的状态是”大概想吃这个,但也不知道叫什么”,这时候对话式搜索就有优势了。

    不过也得泼点冷水。类似的AI聊天购物功能,过去几年里已经被各种电商平台宣布过无数次,但真正改变用户习惯的案例并不多。大部分人还是习惯直接搜索,因为确定需求的时候,搜索比聊天更快。Ask DoorDash能不能真正被用户用起来,而不是一个”听起来很酷但没人用”的功能,接下来几周的推广数据会给出答案。

    DoorDash表示,这个功能未来几周会逐步推到美国更多用户,覆盖iOS和Android两端。至于国内用户什么时候能用上——暂时还没有消息。


  • Anthropic悄悄给Claude Fable加了隐形护栏,被发现后道歉了

    Anthropic上周把Claude Fable 5推上线的时候,顺便给它加了一道用户看不到的”暗门”——一旦系统判断你在使用Claude的输出训练竞争模型(也就是所谓的”模型蒸馏”),它会悄悄降低回答质量,而且不会告诉你原因。

    这件事最先在AI研究社区里炸了锅。有人发现,用自己的数据去”探测”Fable的时候,回答突然变得很奇怪,像是被人为削弱了,但查系统日志又找不到任何拦截记录。大家这才意识到,Anthropic在系统卡(system card)里写了这件事,但写的方式非常不显眼——他们说对于”判定为蒸馏尝试”的查询,Fable会”修改回答质量”,而且用户不会收到通知。

    系统卡里的原话是:”对于它判定为蒸馏尝试的查询,它会直接修改、降低模型回答的质量。用户不会收到任何通知,不知道自己触发了安全措施,也不会被告知回答被修改了。”

    “不可见护栏”背后的逻辑

    Anthropic在声明里解释过为什么要这么做。他们说,可见的安全机制容易被”探测”——如果你明确告诉用户”这条查询被拦截了”,别人就能反过来摸索出你的安全边界在哪里。而不可见的机制可以更精准,误判率低,还能让模型快速上线。

    这个理由听起来有一定道理,但问题在于:当用户花了钱调用API,却得到被偷偷”降级”的输出,而且完全不知情——这无论怎么看都不太对。更麻烦的是,这种暗地里的限制也会影响第三方对模型能力的正常评估,因为你根本不知道拿到的结果是真实的模型输出,还是被”动过手脚”的版本。

    Anthropic Claude Fable 5
    Anthropic为Claude Fable设置的隐形护栏引发了社区强烈反弹丨图片来源:The Verge

    道歉,然后改掉它

    压力之下,Anthropic在X上发了一条声明,宣布改变做法。从现在起,涉及蒸馏的查询不再被暗中降级,而是直接”回退”到上一代模型Claude Opus 4.8来处理,并且——这一点很重要——系统会明确告诉用户:”你触发了蒸馏保护,这次回答由Opus 4.8生成。”

    这个处理方式其实和Fable在其他高风险领域的做法是一致的。比如你问它生物学或化学的问题,如果触发了安全规则,它也会把查询转给Opus 4.8,除非问题涉及毒品、武器等明确禁止的内容,才会直接拦截。

    Anthropic在道歉声明里说了一句挺坦诚的话:”可见的安全机制可能被探测,因此必须足够稳健,这需要时间打磨。我们之前选择不可见的防护措施就是出于这个原因——但这是一个错误的权衡。你有权了解我们部署的安全措施以及背后的原因,很抱歉我们没有把握好平衡。”

    这件事还没完

    有意思的是,这已经不是Fable第一次因为”过度保守”而出问题了。就在几天前,有用户发现Fable连”线粒体是什么”这种高中生物问题都拒绝回答,后来Anthropic也承认是安全校准范围太宽,正在修复。

    两件事放在一起看,一个矛盾就浮现出来了:Anthropic一直对外强调自己把”安全”放在第一位,但接连两次”安全机制”的设计都引发了用户的强烈反弹。如果一家以安全著称的AI公司,连”如何把安全措施告诉用户”这件事都做不好,那它口中的”负责任AI”到底意味着什么,恐怕要打一个问号了。

    再说回蒸馏这件事。Anthropic之前多次公开点名DeepSeek等中国AI公司,指责它们以”工业化”规模蒸馏Claude的输出。从这个角度看,Fable的隐形护栏更像是Anthropic的一次”技术报复”——既然我没法阻止你偷我模型,那我就在模型里埋个暗门,让你偷到的东西是”残血版”的。想法可以理解,但这么做的同时,也把自己的信誉搭进去了。


  • 【开源推荐】autoresearch:86K+ Stars!Karpathy开源AI自主研究工具,让Agent通宵帮你优化LLM训练

    【开源推荐】autoresearch:86K+ Stars!Karpathy开源AI自主研究工具,让Agent通宵帮你优化LLM训练

    🔥 GitHub 热门 AI 开源项目

    autoresearch

    AI Agent 自主运行 LLM 训练研究 · Karpathy 出品

    🤖 AI Agent
    🧠 深度学习
    ⚡ 单GPU
    🔬 自动研究

    📌项目简介

    autoresearch 是 AI 大神 Andrej Karpathy(前 Tesla AI 总监、OpenAI 创始成员)开源的颠覆性项目——让 AI Agent 在单张 GPU 上自主运行深度学习实验,自动修改代码、训练模型、评估结果,通宵跑完 100+ 实验,早上起来收报告。这不是科幻,是现在就能用的真实工具。

    ⚙️安装要求和过程

    1

    环境要求

    单张 NVIDIA GPU(测试过 H100)、Python 3.10+、uv 包管理器

    2

    快速安装(4步搞定)

    # 1. 安装 uv(如果还没有)
    curl -LsSf https://astral.sh/uv/install.sh | sh
    
    # 2. 安装依赖
    uv sync
    
    # 3. 下载训练数据 + 训练 BPE 分词器(一次性,约2分钟)
    uv run prepare.py
    
    # 4. 手动跑一次训练实验(约5分钟)
    uv run train.py

    3

    启动 AI Agent 自主研究

    在仓库目录下启动 Claude Code / Codex 等 AI Agent(关闭所有权限确认),然后发送提示:

    Hi have a look at program.md and let's kick off a new experiment!
    let's do the setup first.

    4

    低配设备适配

    没有 H100?社区已有 macOSMLXWindows RTX 等 Fork,MacBook 也能跑!

    核心功能

    🤖

    AI Agent 自主研究

    Agent 自动修改 train.py,训练5分钟,检查 val_bpb 是否下降,保留或丢弃改动,不断迭代。你只需要睡前启动,早上收实验日志。

    ⏱️

    固定时间预算(公平对比)

    每次实验固定5分钟(wall clock),不管 Agent 怎么改模型架构、batch size,所有实验都可直接对比。约12次实验/小时,通宵可跑100+次。

    📁

    极简设计(只改一个文件)

    整个仓库只有3个核心文件:prepare.py(固定)、train.py(Agent 修改)、program.md(人类修改)。diff 清晰可审查,不会失控。

    🔌

    支持任意 AI Agent

    Claude Code、OpenAI Codex、Gemini CLI、OpenClaw……任何能读写文件的 AI Agent 都能用。program.md 本质上是一个超轻量级的”技能提示词”。

    🌍

    活跃社区 Fork(多平台支持)

    macOS(M系列芯片)、Windows(RTX显卡)、MLX框架均有社区 Fork,低配设备也能体验 AI 自主研究。

    🚀典型使用场景

    🌙 场景一:夜间自动实验

    下班前启动 Agent,让它通宵自主实验。第二天早上,你会收到一份完整的实验日志,记录每次改动、训练曲线和验证集效果。相当于白得一个不知疲倦的研究生。

    🔬 场景二:快速模型架构探索

    想尝试不同的注意力机制、优化器组合或模型深度?让 Agent 在固定时间预算内自动探索各种组合,快速找到最优配置,省去大量手工调参时间。

    📚 场景三:学习深度学习最佳实践

    即使是深度学习初学者,也可以阅读 Agent 的修改记录和实验日志,从中学习哪些改动有效、哪些无效,快速积累建模经验。

    💡推荐理由

    Karpathy 出品,必属精品。autoresearch 最震撼的地方在于它把”AI 做 AI 研究”从科幻变成了现实——而且代码极简,整个训练代码只有一个 train.py,清晰到可以作为学习材料。

    固定5分钟时间预算的设计非常巧妙:不管怎么改模型,每次实验成本相同,结果可直接对比。这让 Agent 的”研究”变得可解释、可复现,而不是黑盒魔法。

    ⚠️ 注意:目前官方版本需要 NVIDIA GPU,低配设备建议使用社区 Fork。但无论如何,这个项目代表的”AI 自主研究”方向,值得每个 AI 从业者关注和思考。

    📦下载地址

    🔔 关注我们,每周分享最新 AI 开源项目!

    GitHub 热门 AI 项目持续更新中…