博客

  • Anthropic估值的9000亿美元,不只是钱,更是一场AI军备竞赛

    如果你前几天还在说OpenAI是全球最值钱的AI公司,那这条新闻可能会让你重新掂量一下。Anthropic正在和投资人谈一轮新融资,估值目标直奔9000亿美元。什么概念?OpenAI刚在3月拿到8520亿美元估值,Anthropic这一跃,就把它甩在了身后。

    Anthropic在2月的估值才3800亿美元,不到3个月,估值翻倍不止。年化收入从去年底约100亿美元,现在已经跑到300亿美元。Claude Code出来之后,开发者的钱包是真的打开了。

    钱从哪来,花到哪去

    这轮融资如果落地,规模大概是500亿美元。背后的战略投资方已经基本明朗:Amazon最高出250亿,Google最高出400亿,但不是直接砸现金,而是算作AI基础设施投资——说白了,就是给Anthropic提供算力的那些数据中心和TPU/GPU集群,折合股份。

    为什么这么急?Claude Mythos Preview这 model 出来之后,特朗普政府、科技CEO、银行高管都在问:这东西能不能用到我们这边?Anthropic需要大量算力来训练和部署Mythos,没有足够的计算资源,模型能力再强也只是PPT。

    所以你看,Amazon给了5吉瓦的计算容量,Google/Broadcom那边也有5吉瓦,2027年开始陆续上线。这些不是简单的”云服务费”,而是深度绑定的战略联盟——Anthropic用它们的算力,它们拿到Anthropic的股权和未来模型的使用优先权。


    Claude Code是真正的现金牛

    Anthropic的收入爆发,Claude Code功不可没。这个AI编程助手出来之后,不只个人开发者在用,企业也在悄悄把Claude Code塞进自己的工作流。年化收入300亿美元,去年才100亿,这个增速在AI行业里也是数得着的。

    OpenAI有ChatGPT的全民流量,但Anthropic走的是另一条路:先做技术圈口碑,再做企业市场。Claude的”更安全、更可控”定位,在金融、医疗、法律这些对准确性要求高的行业,反而比OpenAI更吃香。Ramp的数据也验证了这一点——Anthropic的企业客户占比已经反超OpenAI。


    9000亿之后,IPO还远吗

    有消息说Anthropic正在考虑最早2026年10月启动IPO。以9000亿美元的估值进场,这会是有史以来最大的科技IPO之一。但问题也随之而来:Anthropic现在还是严重亏损状态,高额的算力采购和人才成本压着,IPO之后能不能兑现投资人的预期,是个大问题。

    另一个角度看,Anthropic和OpenAI的战争,已经从模型能力延伸到生态系统。Amazon和Google下重注,不只是看中Anthropic的技术,更是要在AI基础设施层面和微软+OpenAI的组合拳打对手戏。这一轮融资,本质上是AI时代新旧势力的一次重新排位。

    • Anthropic估值9000亿美元,超越OpenAI的8520亿
    • Amazon/Google以算力换股权,各出数百亿美元
    • Claude Code推动年化收入激增至300亿美元
    • 最早2026年10月IPO,届时将创下科技IPO纪录
    • AI算力军备竞赛,Anthropic站到了有利位置
  • OpenAI砸40亿美元成立DeployCo:从卖模型变成了干脏活

    OpenAI最近搞了一件大事,不是发布新模型,也不是搞融资,而是成立了一家新公司——OpenAI Deployment Company,简称DeployCo。5月11日官宣,首期投入超过40亿美元,投资方阵容包括TPG领投,Advent、Bain Capital、Brookfield联合创始,软银、高盛、Warburg Pincus等跟投,总共19家机构参与。

    OpenAI Deployment Company
    OpenAI Deployment Company (来源: OpenAI)

    干了什么?买人、买公司、派工程师进驻客户

    DeployCo的核心模式叫Forward Deployed Engineers(前沿部署工程师)。简单说就是:OpenAI把自己的工程师派到你公司里去,坐你旁边,跟你业务团队一起干活。识别哪些场景有高价值、重构关键流程、把模型接进你现成的数据和业务系统里。

    为了快速启动,OpenAI同时宣布收购Tomoro——一家做企业AI咨询和工程的公司。Tomoro大概有150名部署工程师,给Tesco、Virgin Atlantic、Supercell这些大客户做过实时AI系统。这笔收购目前还在走监管审批。

    另外还拉来了Bain & Company、Capgemini、McKinsey三家咨询公司做系统集成伙伴。这三家加起来服务的企业超过2000家,渠道优势明显。

    为什么OpenAI要干这件事

    OpenAI声称已有超过100万家企业在使用其产品和API。但大量企业卡在试点阶段,没法把AI真正嵌入核心生产系统。

    这就是DeployCo瞄准的断层——从”试点”到”生产系统”之间的鸿沟。模型能力强只是入场券,流程跑通才是护城河。OpenAI自己显然也意识到了这一点:光靠卖API和ChatGPT Enterprise订阅,没法帮客户把AI真正融入日常业务。

    从商业模式上看,这是一次比较大的转型。以前OpenAI赚的是调用费和订阅费,现在它要切入的是咨询和系统集成的钱。决策者从开发者变成CIO和CTO,预算从软件采购变成数字化转型项目。成败标准也变了——不再是API调用量,而是生产系统效果和业务指标。


    几个值得关注的变量

    首先,DeployCo进入的是一个已经有Palantir、埃森哲、微软Copilot混战的市场。OpenAI的优势是离模型研发最近,能第一时间拿到最新能力;短板是交付规模还没被验证,行业经验和客户内部政治处理能力需要时间积累。

    其次,咨询伙伴关系怎么处理是个微妙的问题。Bain、McKinsey这些公司本身就是OpenAI的渠道,但它们也做系统集成。在客户的预算里,DeployCo的FDE团队和咨询公司之间是增量合作还是正面相撞,现在还不清晰。

    还有一个数据安全方面的问题——客户的流程改造经验、业务数据会在多大程度上反哺给OpenAI的模型训练?这对很多企业来说是一条不能忽视的红线。

    40亿美元是个大手笔。如果DeployCo能跑通一套可复制的行业交付模板,商业边界会比单纯的API供应商宽得多。但如果只是用钱砸扩张速度,那这笔投资的回报率可能就不那么好看了。

  • Notion不再只是笔记工具了,它要当AI智能体的指挥中心

    用过Notion的人都知道,它是一个挺顺手的协作工具——文档、数据库、看板、日历,基本日常办公能想到的东西都能往里塞。但5月13日Notion发布3.5版本后,这件事变了:Notion正式推出开发者平台,目标很直接——把工作区变成AI智能体的调度中心。

    Notion Developer Platform
    Notion 3.5 开发者平台展示 (来源: Notion)

    Workers:不需要你自己搭服务器

    这次更新最核心的概念叫Workers——一段运行在Notion自己基础设施上的代码。你写好逻辑,通过CLI部署上去,它就在安全沙箱里跑了。不租服务器、不配域名、不搞CI/CD,连运行时环境都不用管。

    Workers目前免费(beta阶段),8月11日后会切换到Notion credits计费。目前支持三种核心场景:

    • 数据库同步——把任何API能访问的数据源拉进Notion数据库,比如Zendesk工单、Salesforce客户数据
    • 自定义Agent工具——写确定性逻辑替代LLM推理,省钱又可靠
    • Webhook触发——任何外部应用都能触发Notion里的工作流,PR合并自动关任务、订阅变更自动更新CRM

    外部Agent接入:Claude、Codex都能直接用

    另一个值得注意的功能是External Agents API。简单说就是:你可以把Claude、Codex、Decagon这些智能体接入Notion,让它们在你的工作区里干活。Notion在这里扮演的是编排层的角色——一个Decagon的工单可以路由给编程Agent起草修复方案,再拉团队成员审批。

    Notion is our AI layer because it’s where work is created or imagined—and we want our agents as close to the action as possible. — Dan Gilbert, CEO at Brainlabs

    这个功能目前是Alpha阶段,需要加入等待列表。非工程师也可以在Notion里直接和Agent交互,不需要去命令行。

    Agent SDK:反向输出到任何应用

    更长远的一步是Notion Agent SDK(也在Alpha阶段),可以把你在Notion里搭好的Agent嵌入到外部工具里。在CRM里点个按钮就生成报告,在Teams或Discord里回答团队成员的常见问题——数据都从你的Notion工作区里拉。

    除此之外还有几个对开发者友好的更新:Markdown API让Agent直接读写Notion页面(Agent天然处理Markdown)、MCP协议支持了会议笔记和评论、API权限从Workspace Owner扩展到了所有成员。


    怎么看这件事

    Notion这次做的事情,本质上是把自己从一个SaaS工具升级成了一个平台。以前你用它来写文档、管项目;现在它希望你的Claude、你的Codex、你自己写的Agent都住在Notion里,通过它来协调数据和任务流。

    这个定位挺聪明的。AI Agent生态现在最大的痛点不是缺模型,而是缺一个能把多个Agent串起来、让非技术人员也能参与协作的界面。Notion恰好有这个用户基础和产品心智。

    不过Workers目前还是beta,External Agents API还在Alpha,Agent SDK更是刚开了个等待列表。Notion能否真正成为企业AI的调度中心,取决于这些功能能不能快速成熟,以及开发者的响应速度。

  • 不用改提示词,直接调模型“大脑”:DeepSeek-V4-Flash让LLM Steering回归实用

    跟AI打交道的人大概都有这种体验:你在系统提示词里写了800字约束模型的语气、风格和立场,结果对话进行到第三轮,模型就开始放飞自我了。提示词能影响的只是模型的输入端,模型内部怎么处理、怎么生成,你管不着。

    但现在有一种替代方案正在重新回到聚光灯下——LLM Steering(大语言模型引导)。这不是什么新概念,早在Anthropic做Golden Gate Claude的时候就引发过关注。只是以前它太重了,需要A100级别的GPU和PyTorch加TransformerLens,普通开发者根本玩不起。而DeepSeek-V4-Flash加上一个叫DwarfStar 4的工具,把这个门槛降到了单张RTX 4090就能跑。

    Steering到底是什么,跟提示词有什么区别

    打个比方。提示词就像你给一个人写了张纸条:”请你用简洁的语气回答”,这个人看了纸条,可能前两句照做了,聊着聊着又回到啰嗦的老样子。Steering则像你直接拧了这个人脑子里一个名为”简洁度”的旋钮,每一句话都说出来之前,这个旋钮都在生效。

    技术上的实现也不复杂。Steering的核心是对比对(Contrast Pair)——让模型分别处理两个条件,比如”简洁回答”和”详细回答”,记录某一层激活值的差异,算出平均差值作为”简洁方向向量”。之后在正常的推理过程中,把这个向量加到对应层的激活值上,模型的输出就会不自觉地偏向简洁。

    提示词管的是输入,Steering管的是过程。前者是”请你这样做”,后者是”我帮你这样做”。每个token生成时都在施加影响,所以效果在整个输出中保持一致。

    为什么以前没流行起来

    Steering概念好是好,但有三个硬伤一直挡在前面。第一,它只适用于开源模型——你需要访问模型内部每一层的激活值,而OpenAI和Anthropic的API不可能给你这个权限。第二,以前做激活值分析需要搭建PyTorch + TransformerLens的完整环境,硬件起步就是A100。第三,大多数Steering能实现的效果,其实用提示词也能凑合达到,多花几行字就完事了。

    所以之前Steering基本是大厂实验室的自留地,Anthropic拿它做可解释性研究,学术界拿它写论文,一线开发者完全用不上。

    DeepSeek-V4-Flash + DwarfStar 4改变了什么

    两个关键因素。DeepSeek-V4-Flash本身就是一个针对推理效率优化过的模型,能在相对有限的显存上运行,同时保持了不错的推理质量。而DwarfStar 4是llama.cpp的一个分支,专门为特定模型系列加了激活值钩子,把”提取和注入激活值”这个操作简化到了几乎一条命令就能完成。

    这意味着什么?以前你需要一个有A100的实验室和一整套PyTorch环境,现在你只需要一张4090和几行命令就能跑完整个Steering实验的流程。门槛的降低是数量级的。

    能拿它干什么

    • 语气一致性:让模型在长对话中始终维持特定的语气和风格,不会漂移
    • 领域偏移:不用微调,就让模型的输出偏向金融、医疗或法律风格(但只影响表达框架,不影响事实准确性)
    • 安全防护:构建安全拒绝向量,在推理时注入作为轻量级护栏
    • 上下文压缩:把原本需要大量token描述的约束条件压缩成一个向量,省出上下文窗口

    不过也别太乐观。Sean Goedecke在他那篇广为流传的文章里提到,Steering目前还有明显的局限性:你很难精确理解一个激活值差异到底编码了什么信息,副效应可能出现在不相关的任务上,而且在一个领域构建的向量未必能迁移到另一个领域。


    从黑盒喊话到白盒调参

    Bagua AI的文章里有一个观点我觉得很到位:过去几年,行业一直在把LLM当黑盒,用提示词从外面”喊”它。Steering的复兴代表了一个转变——我们从外部喊话,变成从内部调参。这不仅仅是效率优化,而是机械可解释性(Mechanistic Interpretability)走向工业化应用的第一步。

    对实际做开发的团队来说,Steering目前最直接的价值在于替代那些越来越臃肿的系统提示词。与其花500个token约束模型行为,不如提取一个向量注入进去,既省上下文窗口又稳定。这个账,但凡做过复杂Agent系统的人都会算。

    竞争壁垒正在从”提示词工程”转向”理解内部表征”。谁能读懂模型的激活空间,谁就能更好地控制模型。这项技能在未来可能比写prompt值钱得多。

  • 合并三个月,50人跑路:马斯克的SpaceXAI正在被掏空

    今年2月,SpaceX把xAI收入囊中,马斯克把这两家自己旗下的公司合二为一,取名SpaceXAI,估值1.25万亿美元。当时马斯克对外描绘的蓝图很宏大——火箭、卫星、AI模型、轨道数据中心,一套垂直整合的创新引擎。可三个月过去了,这架引擎还没飞起来,人先跑了。

    SpaceXAI总部
    SpaceXAI,马斯克旗下新合并的AI公司(图片来源:Getty Images)

    50人离职,几乎搬空了核心团队

    根据The Information的报道,自2月合并以来,已有超过50名研究员和工程师离开了SpaceXAI。这个数字听起来可能不太多,但考虑到xAI本来就是个几百人规模的团队,50人的流失率已经相当惊人。

    最让人担心的不是走了多少人,而是走了哪些人。Grok的编码团队、世界模型团队、语音功能团队都受到了冲击,而负责训练新模型的预训练团队缩水最严重——从之前的规模缩减到只剩下几个人。预训练团队负责人Juntang Zhuang也已经离职,这对一个要跟OpenAI、Anthropic正面对抗的AI公司来说,相当于把造发动机的工程师全放走了。

    xAI几乎所有的联合创始人(除了马斯克本人)都已经离开了。合并后宣布的第一波离职名单里就包括两位联合创始人。

    竞争对手趁机挖人

    这50多人不是凭空消失的,他们中的大多数人都有了明确去处。Meta是最大的赢家,至少收了11名前SpaceXAI员工。Mira Murati创办的Thinking Machines Lab也招走了至少7人。还有一些人去了Anthropic,或者自己出来创业。

    AI人才市场的竞争本来就激烈到离谱,顶级研究员的薪酬包能跟职业运动员和基金经理掰手腕。当SpaceXAI内部的稳定性开始动摇,外部机会又唾手可得的时候,走人几乎成了理性选择。

    马斯克的”极限文化”又一次出了问题

    离职背后的原因不只是竞争对手挖角那么简单。The Information引用的消息源提到,马斯克给模型训练设定了不切实际的截止日期,导致团队在Grok开发上走捷径。这种高压文化在特斯拉就屡遭抱怨,现在在SpaceXAI重演了。

    另外,把一个前沿AI实验室塞进一家航天公司,组织架构的冲击也不小。研究人员习惯了快速迭代和学术自由,突然要适应航天工业的流程和层级,水土不服是意料之中的。

    还有钱的因素。SpaceX定期提供股票回购计划,让员工可以把已归属的股票变现。当一部分员工手里有了现金,又对未来IPO有了信心,留下来忍受高压的动力就弱了很多。


    钱和规模救不了人才流失

    SpaceXAI并不是没有牌可打。算力资源、资金储备、马斯克的话题制造能力,这些都是实打实的优势。就在离职消息传出来之前,SpaceX还和Cursor达成了一笔交易——可以选择以600亿美元收购Cursor,或者支付100亿美元获取双方共同开发的技术。

    但AI竞争的核心不是谁钱多,而是谁手里有最好的研究团队。Meta在疯狂砸钱招人,OpenAI在持续扩大企业版图,Anthropic在企业客户上实现了对OpenAI的反超,Thinking Machines Lab还没发布产品就已经吸引了大批精英。在这样一个环境下,SpaceXAI的50人离职潮不是个小问题,它可能直接拖慢公司追赶前沿模型的速度。

    一个正在打造人类太空未来的公司,眼下却面临一个更接地气的挑战:怎么让自己最顶尖的AI研究员不要走出那扇门。

  • 500万中国医生的新搭档:阿里健康「氢离子」牵手BMJ,要当医生的循证第二大脑

    阿里健康发布医学AI氢离子
    阿里健康在杭州正式发布医学AI「氢离子」

    5月13日,阿里健康在杭州发布了一款叫「氢离子」的医学AI助手。名字起得就很有意思——氢离子是宇宙中最小最活跃的粒子,寓意是:小而快,精准到原子级别。

    氢离子与英国BMJ集团达成独家合作——70本医学期刊过去十年的全文内容,中国医生可以在线阅读、翻译、循证问答。这是国际顶级期刊首次牵手中国AI。

    为什么中国医生需要它?

    中国有约500万执业医生,但大多数人获取前沿医学研究的通道并不畅通。文献分散在各数据库里,语言是一道墙,付费门槛又是一道墙。更麻烦的是,用通用AI查医学问题?幻觉率高得吓人,一个编造的参考文献可能就误导了临床决策。

    氢离子想解决的正是这个矛盾:让医生有一个低幻觉、高循证的AI助手,不是随便聊天的通用大模型,而是严格基于循证医学的决策支持工具。

    四层循证AI架构:每句话都有出处

    氢离子的底层逻辑跟通用大模型完全不同,它搭了四层循证闭环:

    • 证据理解层:所有指南和文献进入系统时,按PICO框架和GRADE标准结构化理解
    • 循证检索层:基于PICO的检索与数据增强,保证每句话有据可查
    • 模型强化层:微调让模型学会什么叫准确、忠实循证、安全有用
    • 专家评审层:300+临床专家参与质量闭环

    简单讲就是:从理解到检索,从训练到评审,每一步都强制溯源。输出的每个回答都可追溯、可验证、可信赖。


    BMJ独家授权意味着什么

    BMJ集团成立于1840年,旗下70余种一流医学期刊,旗舰刊《英国医学杂志》是全球最具影响力的医学期刊之一。这次合作不是简单的接入API——是全文授权,不是摘要检索。中国医生可以在氢离子里直接读BMJ的全文、做循证问答、在线翻译。以前要么订阅贵得离谱的数据库,要么忍着语言障碍啃原文,现在一个入口全搞定。

    而且氢离子此前已经跟中华医学会、人民卫生出版社、中国抗癌协会达成深度合作。BMJ是国际线,国内线早就铺好了。

    从信息检索到循证第二大脑

    全球医学AI正从通用智能转向循证可信,氢离子走的是后一条路。定位不是搜索工具,是医生的循证第二大脑——查文献、读全文、做循证问答、辅助临床决策,一条链路走通。300+临床专家参与评价标准制定和数据集建设,10位顶级专家把学术方向,50位指导委员会定评测方法论,还有来自复旦100强医院的评测医生持续验证反馈。

    这个方向其实对了。医学AI的核心矛盾从来不是能不能聊天,而是能不能别编。氢离子用四层循证架构+顶刊授权+专家评审来降幻觉,思路比堆参数实在得多。

  • 英伟达2.6B小模型跑赢行业巨兽:单卡生成1分钟720p视频的世界模型来了

    前两天NVIDIA的NVLabs悄悄丢了个炸弹——SANA-WM,一个只有2.6B参数的开源世界模型,能在一块H100上生成720p、1分钟长的可控视频。你没有看错,一块卡,一分钟。

    SANA-WM吞吐量比开源基线高36倍,动作跟随准确率超过所有现有开源方案,视觉质量却跟大规模工业模型差不多。

    混合线性注意力:让长视频不再OOM

    做长视频生成最头疼的问题就是显存爆炸。标准DiT用的Softmax Attention是O(n²)复杂度,生成60秒视频(约1800帧)时,纯Softmax方案大概跑到15秒就OOM了。

    SANA-WM的解法很巧妙——混合线性注意力。帧与帧之间用Gated DeltaNet做线性依赖(O(n)复杂度),每隔几帧再插一次Softmax Attention保长程一致性。这样既控制了显存,又没丢掉全局关联。效果就是:别人OOM的时候,它还在稳稳生成。

    双分支相机控制:6自由度精确驾驭

    世界模型跟普通文生视频最大的区别在于可控性。SANA-WM支持6自由度(6-DoF)相机轨迹控制,输入一张静态图+相机运动路径,就能生成对应的漫游视频。它用双分支架构:粗粒度全局位姿分支理解相机大致走向,细粒度像素对齐几何分支精确到像素级的几何变化。这让生成的视频不只是像,而是准。

    两阶段生成 + 极致训练效率

    生成流程分两步:2.6B基础模型先出60秒原始视频,再由17B精炼网络提升纹理和运动质量。有意思的是训练效率——只用了21.3万条公开视频片段(带6-DoF标注),64张H100跑15天就完事。对比同行动辄256+卡跑几个月,这个数据效率相当亮眼。

    • 蒸馏版 + RTX 5090:60秒720p视频34秒出片
    • 吞吐量:开源基线的36倍
    • 动作跟随准确率:超越所有开源方案
    • 视觉质量:对标LingBot-World等工业基线

    世界模型 vs 文生视频:两条路的分歧

    Sora、Kling这些文生视频模型走的是文字驱动路线,控制力偏弱;SANA-WM这类世界模型走的是图像+轨迹驱动路线,控制力强、物理合理性高。说白了,文生视频像是给AI一段描述让它自由发挥,世界模型像是给AI一张照片和运动指令让它精确执行。

    应用场景也很明确:自动驾驶仿真、机器人训练、游戏内容生成、影视预可视化、建筑漫游……任何需要如果相机这样动,世界会怎样的场景,都是世界模型的主场。

    2.6B参数就能做到这个程度,开源社区该兴奋了。代码已在GitHub放出(NVlabs/Sana-WM),权重按CC BY-NC-SA 4.0许可即将发布。

  • 不依赖云端就能跑DeepSeek?这个Mac工具让AI回归本地

    跑AI模型基本等于把数据扔给云端服务器处理,你的文档、代码、聊天记录全在别人机器上过一遍。有个叫Osaurus的开源项目想换个玩法——把AI塞进你的Mac里,本地跑模型,数据不离开你的硬盘。

    Osaurus应用界面
    Osaurus在Mac上的运行界面

    一个前特斯拉工程师的执念

    Osaurus的创始人Terence Pae之前在特斯拉和Netflix做软件工程师。他的想法很直接:既然Mac有越来越强的芯片,为什么不能让AI直接在本地跑?这个项目从一个叫Dinoki的桌面AI伴侣进化而来,现在已经是一个完整的LLM服务器,支持本地和云端模型无缝切换。上线不到一年,下载量已经超过11万次。

    “去年本地AI连句子都写不完,但今天它能跑工具、写代码、访问浏览器、从亚马逊买东西。进步速度太快了。”——Terence Pae

    本地+云端,两不耽误

    Osaurus最实用的地方在于它不是非此即彼。你想跑DeepSeek V4、Gemma 4、Llama这些开源模型?本地来。你想用GPT、Claude、Gemini?连上云端API就行。所有记忆、文件、工具都留在你自己的硬件上。通过硬件隔离的虚拟沙箱来保证安全,数据不会被随便传走。

    它还有20多个原生插件——邮件、日历、浏览器、音乐、Git、文件系统、Excel、PPT这些都能直接操作。最近还加了语音功能。本质上它把自己定位成一个”AI控制层”,不管底层用什么模型,上层体验统一。

    硬件门槛和商业化方向

    门槛不算低——最低64GB内存,想跑大模型推荐128GB。不过Pae认为这个门槛会越来越低,因为”每瓦特能输出的智能”在快速提升,这条曲线的斜率甚至比GPU的摩尔定律还陡。

    竞争对手不少——Ollama、LM Studio、Msty都是这条赛道上的玩家。但Osaurus的差异在于它面向普通用户而非开发者,界面更友好。目前项目完全开源免费,团队在纽约的Alliance加速器里打磨产品,未来考虑切入法律和医疗这些对隐私要求极高的B2B场景。


    • Osaurus是Mac专属的开源LLM服务器,支持本地+云端模型切换
    • 创始人Terence Pae,前特斯拉和Netflix工程师
    • 上线近一年下载量超11万,20+原生插件
    • 最低硬件要求64GB内存,推荐128GB
    • 面向非开发者群体,计划切入法律/医疗等隐私敏感领域
    📎 原文来源:Osaurus brings both local and cloud AI models to your Mac (TechCrunch, Sarah Perez, 2026-05-15)
  • 一边创纪录赚158亿,一边裁4000人:思科的AI阳谋

    5月14号,思科干了件让硅谷炸锅的事——同一天公布创纪录的季度财报和近4000人的裁员计划。股价在盘后涨了差不多20%,华尔街用真金白银给这个决定投了赞成票。

    Chuck Robbins在2026年Semafor世界经济大会上发言
    思科CEO Chuck Robbins,2026年4月15日华盛顿Semafor世界经济大会

    钱没少赚,人照样裁

    思科2026财年第三季度收入158亿美元,同比涨了12%。CEO Chuck Robbins在博客里高调宣布”创纪录营收”和”两位数增长”,话音刚落就甩出裁员通知。这不是思科第一次这么干了——2024年两轮裁员5600人,2025年又裁了150人,加起来这已经是第四轮了。CFO Mark Patterson的说法很体面:这不是为了省钱,而是”快速把资源重新分配到硅芯片、光模块、安全和AI这些优先领域”。

    “AI时代能赢的公司,是那些有聚焦、有紧迫感、有纪律去持续把投资转向需求和长期价值最强领域的公司。”——Chuck Robbins

    9亿美元的AI订单意味着什么

    真正驱动思科动作的不是节流,而是开源。微软、Google、亚马逊、Meta这些超级云厂商正在疯狂建设计算集群,对高带宽网络设备的需求创了历史新高。思科本财年AI基础设施订单已经53亿美元,全年预计能到90亿——这比年初预估的50亿几乎翻了一番。数据中心交换机订单涨了40%以上,网络产品订单涨了50%以上。这不是周期性波动,而是一个”网络超级周期”的开端。

    裁掉4000人,补上AI工程师

    思科给被裁员工提供了遣散费、按比例发放的奖金、一年免费课程和就业安置服务。但Gartner的分析师Helen Poitevin一针见血地指出:”很多CEO用裁员来展示AI的快速回报,但这个思路是错的。裁员也许能腾出预算,但不创造回报。真正提升ROI的公司,不是那些消除了对人的需求的公司,而是那些放大了人的能力的公司。”

    Gartner今年5月的调查更有意思:350家年收入超10亿美元的企业中,80%因部署AI而裁了人,但裁员公司的财务表现和没裁员的公司几乎一模一样。他们甚至预测到2027年,50%把裁员归因于AI的公司会重新雇佣类似岗位的人,只不过换了种头衔。

    Sam Altman也说了句大实话:”有些AI洗白存在,人们把本就要做的裁员怪到AI头上。”虽然AI确实在替代工作,但这两件事混在一起,外人很难分辨。


    • 思科Q3营收158亿美元,同比+12%;盘后股价涨约20%
    • 裁员约4000人(占员工总数5%),2024年以来第四轮
    • 全年AI订单预期从50亿上调至90亿美元
    • Gartner调查:80%大企业因AI裁员,但财务表现无明显差异
    • 2026年前4个月美国科技裁员超8.5万人,AI是最多引用的原因
    📎 原文来源:Cisco cuts nearly 4,000 jobs to spend more on AI, reports record quarterly revenue (TechCrunch, Zack Whittaker, 2026-05-14)
  • AI开始自己造自己了?前You.com创始人携6.5亿美元杀回来

    当一个AI系统能自己找出自己的弱点,然后动手改掉它——全程不需要人类插手——会发生什么?这听起来像科幻小说,但Richard Socher觉得这就是下一件真实发生的事。

    Socher不是无名之辈。他创立了早期AI搜索引擎You.com,在那之前还是ImageNet的论文作者之一。本周三,他带着一家叫Recursive Superintelligence(递归超智能)的新公司正式走出隐身模式,首轮融资就拿到了6.5亿美元,投资方包括Greycroft和GV(Google Ventures)。

    目标:让AI递归地自我改进

    递归超智能这个名字就说明了野心。Socher在接受TechCrunch采访时说:

    “我们主要的聚焦点是建立真正递归的、自我改进的超大规模智能体。这意味着整个过程——产生研究想法、实施想法、验证结果——全程自动。”

    他特别强调,这种递归自我改进不是简单的”让AI去优化某个东西”。那只是改进,不是递归。真正的递归,意味着AI系统能够自主识别自己的缺陷,然后自己动手改代码或架构,形成一个持续向上的闭环——没有人类干预的循环。

    团队里全是狠人

    Socher这次拉来的队友份量十足:Google AI元老Peter Norvig、前OpenAI Codex和深度研究团队负责人Josh Tobin,以及Google DeepMind开放性(open-endedness)研究团队的Tim Rocktäschel——Genie 3世界模型的缔造者。

    Rocktäschel提出的”彩虹红队”(rainbow teaming)概念尤其有意思:两个AI互相攻防,一个不断寻找对方的漏洞,另一个持续修复进化——就像自然界猎豹和瞪羚的军备竞赛,能在数百万次迭代中产生远超单一方向优化的效果。这套方法已经被各大AI实验室广泛采用。

    产品多久能出来?

    Socher说产品推出时间可能比原计划提前,但他还是卖了个关子:“几季度内,不是几年内。”

    他真正想探讨的,是一个更深层的问题——一旦这种递归自我改进成为现实,计算资源将变成唯一真正稀缺的东西。Socher打了个比方:未来人类会面临选择——要不要用多少算力去治愈某种癌症?这类问题将成为全球最大的资源分配决策。

    “我们对智力的上限一无所知——它可能是天文数字级别的,我们离那个边界还远得很。但正因如此,这个问题值得认真对待。”

    说到底,Recursive Superintelligence想要做的,其实也是整个AI行业最核心的那道谜题:机器能否真正理解自己,然后超越自己?6.5亿美元,Socher至少已经迈出了第一步。


    AI递归自我改进概念图
    递归超智能:AI开始自己造自己
    📎 原文来源:What happens when AI starts building itself? — TechCrunch, Russell Brandom, 2026-05-14