博客

Anthropic估值的9000亿美元，不只是钱，更是一场AI军备竞赛
如果你前几天还在说OpenAI是全球最值钱的AI公司，那这条新闻可能会让你重新掂量一下。Anthropic正在和投资人谈一轮新融资，估值目标直奔9000亿美元。什么概念？OpenAI刚在3月拿到8520亿美元估值，Anthropic这一跃，就把它甩在了身后。

Anthropic在2月的估值才3800亿美元，不到3个月，估值翻倍不止。年化收入从去年底约100亿美元，现在已经跑到300亿美元。Claude Code出来之后，开发者的钱包是真的打开了。

钱从哪来，花到哪去

这轮融资如果落地，规模大概是500亿美元。背后的战略投资方已经基本明朗：Amazon最高出250亿，Google最高出400亿，但不是直接砸现金，而是算作AI基础设施投资——说白了，就是给Anthropic提供算力的那些数据中心和TPU/GPU集群，折合股份。

为什么这么急？Claude Mythos Preview这 model 出来之后，特朗普政府、科技CEO、银行高管都在问：这东西能不能用到我们这边？Anthropic需要大量算力来训练和部署Mythos，没有足够的计算资源，模型能力再强也只是PPT。

所以你看，Amazon给了5吉瓦的计算容量，Google/Broadcom那边也有5吉瓦，2027年开始陆续上线。这些不是简单的”云服务费”，而是深度绑定的战略联盟——Anthropic用它们的算力，它们拿到Anthropic的股权和未来模型的使用优先权。

Claude Code是真正的现金牛

Anthropic的收入爆发，Claude Code功不可没。这个AI编程助手出来之后，不只个人开发者在用，企业也在悄悄把Claude Code塞进自己的工作流。年化收入300亿美元，去年才100亿，这个增速在AI行业里也是数得着的。

OpenAI有ChatGPT的全民流量，但Anthropic走的是另一条路：先做技术圈口碑，再做企业市场。Claude的”更安全、更可控”定位，在金融、医疗、法律这些对准确性要求高的行业，反而比OpenAI更吃香。Ramp的数据也验证了这一点——Anthropic的企业客户占比已经反超OpenAI。

9000亿之后，IPO还远吗

有消息说Anthropic正在考虑最早2026年10月启动IPO。以9000亿美元的估值进场，这会是有史以来最大的科技IPO之一。但问题也随之而来：Anthropic现在还是严重亏损状态，高额的算力采购和人才成本压着，IPO之后能不能兑现投资人的预期，是个大问题。

另一个角度看，Anthropic和OpenAI的战争，已经从模型能力延伸到生态系统。Amazon和Google下重注，不只是看中Anthropic的技术，更是要在AI基础设施层面和微软+OpenAI的组合拳打对手戏。这一轮融资，本质上是AI时代新旧势力的一次重新排位。
- Anthropic估值9000亿美元，超越OpenAI的8520亿
- Amazon/Google以算力换股权，各出数百亿美元
- Claude Code推动年化收入激增至300亿美元
- 最早2026年10月IPO，届时将创下科技IPO纪录
- AI算力军备竞赛，Anthropic站到了有利位置
📎 原文来源：CNBC – Anthropic Weighs Raising Funds at $900B Valuation, Topping OpenAI
2026年5月17日
OpenAI砸40亿美元成立DeployCo：从卖模型变成了干脏活

OpenAI最近搞了一件大事，不是发布新模型，也不是搞融资，而是成立了一家新公司——OpenAI Deployment Company，简称DeployCo。5月11日官宣，首期投入超过40亿美元，投资方阵容包括TPG领投，Advent、Bain Capital、Brookfield联合创始，软银、高盛、Warburg Pincus等跟投，总共19家机构参与。

OpenAI Deployment Company (来源: OpenAI)

干了什么？买人、买公司、派工程师进驻客户

DeployCo的核心模式叫Forward Deployed Engineers（前沿部署工程师）。简单说就是：OpenAI把自己的工程师派到你公司里去，坐你旁边，跟你业务团队一起干活。识别哪些场景有高价值、重构关键流程、把模型接进你现成的数据和业务系统里。

为了快速启动，OpenAI同时宣布收购Tomoro——一家做企业AI咨询和工程的公司。Tomoro大概有150名部署工程师，给Tesco、Virgin Atlantic、Supercell这些大客户做过实时AI系统。这笔收购目前还在走监管审批。

另外还拉来了Bain & Company、Capgemini、McKinsey三家咨询公司做系统集成伙伴。这三家加起来服务的企业超过2000家，渠道优势明显。

为什么OpenAI要干这件事

OpenAI声称已有超过100万家企业在使用其产品和API。但大量企业卡在试点阶段，没法把AI真正嵌入核心生产系统。

这就是DeployCo瞄准的断层——从”试点”到”生产系统”之间的鸿沟。模型能力强只是入场券，流程跑通才是护城河。OpenAI自己显然也意识到了这一点：光靠卖API和ChatGPT Enterprise订阅，没法帮客户把AI真正融入日常业务。

从商业模式上看，这是一次比较大的转型。以前OpenAI赚的是调用费和订阅费，现在它要切入的是咨询和系统集成的钱。决策者从开发者变成CIO和CTO，预算从软件采购变成数字化转型项目。成败标准也变了——不再是API调用量，而是生产系统效果和业务指标。

几个值得关注的变量

首先，DeployCo进入的是一个已经有Palantir、埃森哲、微软Copilot混战的市场。OpenAI的优势是离模型研发最近，能第一时间拿到最新能力；短板是交付规模还没被验证，行业经验和客户内部政治处理能力需要时间积累。

其次，咨询伙伴关系怎么处理是个微妙的问题。Bain、McKinsey这些公司本身就是OpenAI的渠道，但它们也做系统集成。在客户的预算里，DeployCo的FDE团队和咨询公司之间是增量合作还是正面相撞，现在还不清晰。

还有一个数据安全方面的问题——客户的流程改造经验、业务数据会在多大程度上反哺给OpenAI的模型训练？这对很多企业来说是一条不能忽视的红线。

40亿美元是个大手笔。如果DeployCo能跑通一套可复制的行业交付模板，商业边界会比单纯的API供应商宽得多。但如果只是用钱砸扩张速度，那这笔投资的回报率可能就不那么好看了。

📎 原文来源：OpenAI成立DeployCo：从卖模型走向企业AI落地现场 / OpenAI Blog

2026年5月17日
Notion不再只是笔记工具了，它要当AI智能体的指挥中心
用过Notion的人都知道，它是一个挺顺手的协作工具——文档、数据库、看板、日历，基本日常办公能想到的东西都能往里塞。但5月13日Notion发布3.5版本后，这件事变了：Notion正式推出开发者平台，目标很直接——把工作区变成AI智能体的调度中心。

Notion 3.5 开发者平台展示 (来源: Notion)

Workers：不需要你自己搭服务器

这次更新最核心的概念叫Workers——一段运行在Notion自己基础设施上的代码。你写好逻辑，通过CLI部署上去，它就在安全沙箱里跑了。不租服务器、不配域名、不搞CI/CD，连运行时环境都不用管。

Workers目前免费（beta阶段），8月11日后会切换到Notion credits计费。目前支持三种核心场景：
- 数据库同步——把任何API能访问的数据源拉进Notion数据库，比如Zendesk工单、Salesforce客户数据
- 自定义Agent工具——写确定性逻辑替代LLM推理，省钱又可靠
- Webhook触发——任何外部应用都能触发Notion里的工作流，PR合并自动关任务、订阅变更自动更新CRM
外部Agent接入：Claude、Codex都能直接用

另一个值得注意的功能是External Agents API。简单说就是：你可以把Claude、Codex、Decagon这些智能体接入Notion，让它们在你的工作区里干活。Notion在这里扮演的是编排层的角色——一个Decagon的工单可以路由给编程Agent起草修复方案，再拉团队成员审批。

Notion is our AI layer because it’s where work is created or imagined—and we want our agents as close to the action as possible. — Dan Gilbert, CEO at Brainlabs

这个功能目前是Alpha阶段，需要加入等待列表。非工程师也可以在Notion里直接和Agent交互，不需要去命令行。

Agent SDK：反向输出到任何应用

更长远的一步是Notion Agent SDK（也在Alpha阶段），可以把你在Notion里搭好的Agent嵌入到外部工具里。在CRM里点个按钮就生成报告，在Teams或Discord里回答团队成员的常见问题——数据都从你的Notion工作区里拉。

除此之外还有几个对开发者友好的更新：Markdown API让Agent直接读写Notion页面（Agent天然处理Markdown）、MCP协议支持了会议笔记和评论、API权限从Workspace Owner扩展到了所有成员。

怎么看这件事

Notion这次做的事情，本质上是把自己从一个SaaS工具升级成了一个平台。以前你用它来写文档、管项目；现在它希望你的Claude、你的Codex、你自己写的Agent都住在Notion里，通过它来协调数据和任务流。

这个定位挺聪明的。AI Agent生态现在最大的痛点不是缺模型，而是缺一个能把多个Agent串起来、让非技术人员也能参与协作的界面。Notion恰好有这个用户基础和产品心智。

不过Workers目前还是beta，External Agents API还在Alpha，Agent SDK更是刚开了个等待列表。Notion能否真正成为企业AI的调度中心，取决于这些功能能不能快速成熟，以及开发者的响应速度。

📎 原文来源：Notion Releases — May 13, 2026: Notion Developer Platform
2026年5月17日
不用改提示词，直接调模型“大脑”：DeepSeek-V4-Flash让LLM Steering回归实用
跟AI打交道的人大概都有这种体验：你在系统提示词里写了800字约束模型的语气、风格和立场，结果对话进行到第三轮，模型就开始放飞自我了。提示词能影响的只是模型的输入端，模型内部怎么处理、怎么生成，你管不着。

但现在有一种替代方案正在重新回到聚光灯下——LLM Steering（大语言模型引导）。这不是什么新概念，早在Anthropic做Golden Gate Claude的时候就引发过关注。只是以前它太重了，需要A100级别的GPU和PyTorch加TransformerLens，普通开发者根本玩不起。而DeepSeek-V4-Flash加上一个叫DwarfStar 4的工具，把这个门槛降到了单张RTX 4090就能跑。

Steering到底是什么，跟提示词有什么区别

打个比方。提示词就像你给一个人写了张纸条：”请你用简洁的语气回答”，这个人看了纸条，可能前两句照做了，聊着聊着又回到啰嗦的老样子。Steering则像你直接拧了这个人脑子里一个名为”简洁度”的旋钮，每一句话都说出来之前，这个旋钮都在生效。

技术上的实现也不复杂。Steering的核心是对比对（Contrast Pair）——让模型分别处理两个条件，比如”简洁回答”和”详细回答”，记录某一层激活值的差异，算出平均差值作为”简洁方向向量”。之后在正常的推理过程中，把这个向量加到对应层的激活值上，模型的输出就会不自觉地偏向简洁。

提示词管的是输入，Steering管的是过程。前者是”请你这样做”，后者是”我帮你这样做”。每个token生成时都在施加影响，所以效果在整个输出中保持一致。

为什么以前没流行起来

Steering概念好是好，但有三个硬伤一直挡在前面。第一，它只适用于开源模型——你需要访问模型内部每一层的激活值，而OpenAI和Anthropic的API不可能给你这个权限。第二，以前做激活值分析需要搭建PyTorch + TransformerLens的完整环境，硬件起步就是A100。第三，大多数Steering能实现的效果，其实用提示词也能凑合达到，多花几行字就完事了。

所以之前Steering基本是大厂实验室的自留地，Anthropic拿它做可解释性研究，学术界拿它写论文，一线开发者完全用不上。

DeepSeek-V4-Flash + DwarfStar 4改变了什么

两个关键因素。DeepSeek-V4-Flash本身就是一个针对推理效率优化过的模型，能在相对有限的显存上运行，同时保持了不错的推理质量。而DwarfStar 4是llama.cpp的一个分支，专门为特定模型系列加了激活值钩子，把”提取和注入激活值”这个操作简化到了几乎一条命令就能完成。

这意味着什么？以前你需要一个有A100的实验室和一整套PyTorch环境，现在你只需要一张4090和几行命令就能跑完整个Steering实验的流程。门槛的降低是数量级的。

能拿它干什么
- 语气一致性：让模型在长对话中始终维持特定的语气和风格，不会漂移
- 领域偏移：不用微调，就让模型的输出偏向金融、医疗或法律风格（但只影响表达框架，不影响事实准确性）
- 安全防护：构建安全拒绝向量，在推理时注入作为轻量级护栏
- 上下文压缩：把原本需要大量token描述的约束条件压缩成一个向量，省出上下文窗口
不过也别太乐观。Sean Goedecke在他那篇广为流传的文章里提到，Steering目前还有明显的局限性：你很难精确理解一个激活值差异到底编码了什么信息，副效应可能出现在不相关的任务上，而且在一个领域构建的向量未必能迁移到另一个领域。

从黑盒喊话到白盒调参

Bagua AI的文章里有一个观点我觉得很到位：过去几年，行业一直在把LLM当黑盒，用提示词从外面”喊”它。Steering的复兴代表了一个转变——我们从外部喊话，变成从内部调参。这不仅仅是效率优化，而是机械可解释性（Mechanistic Interpretability）走向工业化应用的第一步。

对实际做开发的团队来说，Steering目前最直接的价值在于替代那些越来越臃肿的系统提示词。与其花500个token约束模型行为，不如提取一个向量注入进去，既省上下文窗口又稳定。这个账，但凡做过复杂Agent系统的人都会算。

竞争壁垒正在从”提示词工程”转向”理解内部表征”。谁能读懂模型的激活空间，谁就能更好地控制模型。这项技能在未来可能比写prompt值钱得多。

📎 原文来源：DeepSeek-V4-Flash means LLM steering is interesting again – Sean Goedecke ｜ LLM Steering Vectors 2026 – braindetox ｜ DeepSeek-V4-Flash Revitalizes LLM Steering – Bagua AI
2026年5月17日
合并三个月，50人跑路：马斯克的SpaceXAI正在被掏空

今年2月，SpaceX把xAI收入囊中，马斯克把这两家自己旗下的公司合二为一，取名SpaceXAI，估值1.25万亿美元。当时马斯克对外描绘的蓝图很宏大——火箭、卫星、AI模型、轨道数据中心，一套垂直整合的创新引擎。可三个月过去了，这架引擎还没飞起来，人先跑了。

SpaceXAI，马斯克旗下新合并的AI公司（图片来源：Getty Images）

50人离职，几乎搬空了核心团队

根据The Information的报道，自2月合并以来，已有超过50名研究员和工程师离开了SpaceXAI。这个数字听起来可能不太多，但考虑到xAI本来就是个几百人规模的团队，50人的流失率已经相当惊人。

最让人担心的不是走了多少人，而是走了哪些人。Grok的编码团队、世界模型团队、语音功能团队都受到了冲击，而负责训练新模型的预训练团队缩水最严重——从之前的规模缩减到只剩下几个人。预训练团队负责人Juntang Zhuang也已经离职，这对一个要跟OpenAI、Anthropic正面对抗的AI公司来说，相当于把造发动机的工程师全放走了。

xAI几乎所有的联合创始人（除了马斯克本人）都已经离开了。合并后宣布的第一波离职名单里就包括两位联合创始人。

竞争对手趁机挖人

这50多人不是凭空消失的，他们中的大多数人都有了明确去处。Meta是最大的赢家，至少收了11名前SpaceXAI员工。Mira Murati创办的Thinking Machines Lab也招走了至少7人。还有一些人去了Anthropic，或者自己出来创业。

AI人才市场的竞争本来就激烈到离谱，顶级研究员的薪酬包能跟职业运动员和基金经理掰手腕。当SpaceXAI内部的稳定性开始动摇，外部机会又唾手可得的时候，走人几乎成了理性选择。

马斯克的”极限文化”又一次出了问题

离职背后的原因不只是竞争对手挖角那么简单。The Information引用的消息源提到，马斯克给模型训练设定了不切实际的截止日期，导致团队在Grok开发上走捷径。这种高压文化在特斯拉就屡遭抱怨，现在在SpaceXAI重演了。

另外，把一个前沿AI实验室塞进一家航天公司，组织架构的冲击也不小。研究人员习惯了快速迭代和学术自由，突然要适应航天工业的流程和层级，水土不服是意料之中的。

还有钱的因素。SpaceX定期提供股票回购计划，让员工可以把已归属的股票变现。当一部分员工手里有了现金，又对未来IPO有了信心，留下来忍受高压的动力就弱了很多。

钱和规模救不了人才流失

SpaceXAI并不是没有牌可打。算力资源、资金储备、马斯克的话题制造能力，这些都是实打实的优势。就在离职消息传出来之前，SpaceX还和Cursor达成了一笔交易——可以选择以600亿美元收购Cursor，或者支付100亿美元获取双方共同开发的技术。

但AI竞争的核心不是谁钱多，而是谁手里有最好的研究团队。Meta在疯狂砸钱招人，OpenAI在持续扩大企业版图，Anthropic在企业客户上实现了对OpenAI的反超，Thinking Machines Lab还没发布产品就已经吸引了大批精英。在这样一个环境下，SpaceXAI的50人离职潮不是个小问题，它可能直接拖慢公司追赶前沿模型的速度。

一个正在打造人类太空未来的公司，眼下却面临一个更接地气的挑战：怎么让自己最顶尖的AI研究员不要走出那扇门。

📎 原文来源：Elon Musk’s SpaceXAI has been bleeding staff since its merger – TechCrunch

2026年5月17日
500万中国医生的新搭档：阿里健康「氢离子」牵手BMJ，要当医生的循证第二大脑
阿里健康在杭州正式发布医学AI「氢离子」

5月13日，阿里健康在杭州发布了一款叫「氢离子」的医学AI助手。名字起得就很有意思——氢离子是宇宙中最小最活跃的粒子，寓意是：小而快，精准到原子级别。

氢离子与英国BMJ集团达成独家合作——70本医学期刊过去十年的全文内容，中国医生可以在线阅读、翻译、循证问答。这是国际顶级期刊首次牵手中国AI。

为什么中国医生需要它？

中国有约500万执业医生，但大多数人获取前沿医学研究的通道并不畅通。文献分散在各数据库里，语言是一道墙，付费门槛又是一道墙。更麻烦的是，用通用AI查医学问题？幻觉率高得吓人，一个编造的参考文献可能就误导了临床决策。

氢离子想解决的正是这个矛盾：让医生有一个低幻觉、高循证的AI助手，不是随便聊天的通用大模型，而是严格基于循证医学的决策支持工具。

四层循证AI架构：每句话都有出处

氢离子的底层逻辑跟通用大模型完全不同，它搭了四层循证闭环：
- 证据理解层：所有指南和文献进入系统时，按PICO框架和GRADE标准结构化理解
- 循证检索层：基于PICO的检索与数据增强，保证每句话有据可查
- 模型强化层：微调让模型学会什么叫准确、忠实循证、安全有用
- 专家评审层：300+临床专家参与质量闭环
简单讲就是：从理解到检索，从训练到评审，每一步都强制溯源。输出的每个回答都可追溯、可验证、可信赖。

BMJ独家授权意味着什么

BMJ集团成立于1840年，旗下70余种一流医学期刊，旗舰刊《英国医学杂志》是全球最具影响力的医学期刊之一。这次合作不是简单的接入API——是全文授权，不是摘要检索。中国医生可以在氢离子里直接读BMJ的全文、做循证问答、在线翻译。以前要么订阅贵得离谱的数据库，要么忍着语言障碍啃原文，现在一个入口全搞定。

而且氢离子此前已经跟中华医学会、人民卫生出版社、中国抗癌协会达成深度合作。BMJ是国际线，国内线早就铺好了。

从信息检索到循证第二大脑

全球医学AI正从通用智能转向循证可信，氢离子走的是后一条路。定位不是搜索工具，是医生的循证第二大脑——查文献、读全文、做循证问答、辅助临床决策，一条链路走通。300+临床专家参与评价标准制定和数据集建设，10位顶级专家把学术方向，50位指导委员会定评测方法论，还有来自复旦100强医院的评测医生持续验证反馈。

这个方向其实对了。医学AI的核心矛盾从来不是能不能聊天，而是能不能别编。氢离子用四层循证架构+顶刊授权+专家评审来降幻觉，思路比堆参数实在得多。

📎 原文来源：阿里健康发布医学AI氢离子独家合作国际顶刊BMJ / 新浪科技报道
2026年5月17日
英伟达2.6B小模型跑赢行业巨兽：单卡生成1分钟720p视频的世界模型来了
前两天NVIDIA的NVLabs悄悄丢了个炸弹——SANA-WM，一个只有2.6B参数的开源世界模型，能在一块H100上生成720p、1分钟长的可控视频。你没有看错，一块卡，一分钟。

SANA-WM吞吐量比开源基线高36倍，动作跟随准确率超过所有现有开源方案，视觉质量却跟大规模工业模型差不多。

混合线性注意力：让长视频不再OOM

做长视频生成最头疼的问题就是显存爆炸。标准DiT用的Softmax Attention是O(n²)复杂度，生成60秒视频（约1800帧）时，纯Softmax方案大概跑到15秒就OOM了。

SANA-WM的解法很巧妙——混合线性注意力。帧与帧之间用Gated DeltaNet做线性依赖（O(n)复杂度），每隔几帧再插一次Softmax Attention保长程一致性。这样既控制了显存，又没丢掉全局关联。效果就是：别人OOM的时候，它还在稳稳生成。

双分支相机控制：6自由度精确驾驭

世界模型跟普通文生视频最大的区别在于可控性。SANA-WM支持6自由度（6-DoF）相机轨迹控制，输入一张静态图+相机运动路径，就能生成对应的漫游视频。它用双分支架构：粗粒度全局位姿分支理解相机大致走向，细粒度像素对齐几何分支精确到像素级的几何变化。这让生成的视频不只是像，而是准。

两阶段生成 + 极致训练效率

生成流程分两步：2.6B基础模型先出60秒原始视频，再由17B精炼网络提升纹理和运动质量。有意思的是训练效率——只用了21.3万条公开视频片段（带6-DoF标注），64张H100跑15天就完事。对比同行动辄256+卡跑几个月，这个数据效率相当亮眼。
- 蒸馏版 + RTX 5090：60秒720p视频34秒出片
- 吞吐量：开源基线的36倍
- 动作跟随准确率：超越所有开源方案
- 视觉质量：对标LingBot-World等工业基线
世界模型 vs 文生视频：两条路的分歧

Sora、Kling这些文生视频模型走的是文字驱动路线，控制力偏弱；SANA-WM这类世界模型走的是图像+轨迹驱动路线，控制力强、物理合理性高。说白了，文生视频像是给AI一段描述让它自由发挥，世界模型像是给AI一张照片和运动指令让它精确执行。

应用场景也很明确：自动驾驶仿真、机器人训练、游戏内容生成、影视预可视化、建筑漫游……任何需要如果相机这样动，世界会怎样的场景，都是世界模型的主场。

2.6B参数就能做到这个程度，开源社区该兴奋了。代码已在GitHub放出（NVlabs/Sana-WM），权重按CC BY-NC-SA 4.0许可即将发布。

📎 原文来源：SANA-WM: Efficient Minute-Scale World Modeling with Hybrid Linear Diffusion Transformers / 项目主页
2026年5月17日
不依赖云端就能跑DeepSeek？这个Mac工具让AI回归本地
跑AI模型基本等于把数据扔给云端服务器处理，你的文档、代码、聊天记录全在别人机器上过一遍。有个叫Osaurus的开源项目想换个玩法——把AI塞进你的Mac里，本地跑模型，数据不离开你的硬盘。

Osaurus在Mac上的运行界面

一个前特斯拉工程师的执念

Osaurus的创始人Terence Pae之前在特斯拉和Netflix做软件工程师。他的想法很直接：既然Mac有越来越强的芯片，为什么不能让AI直接在本地跑？这个项目从一个叫Dinoki的桌面AI伴侣进化而来，现在已经是一个完整的LLM服务器，支持本地和云端模型无缝切换。上线不到一年，下载量已经超过11万次。

“去年本地AI连句子都写不完，但今天它能跑工具、写代码、访问浏览器、从亚马逊买东西。进步速度太快了。”——Terence Pae

本地+云端，两不耽误

Osaurus最实用的地方在于它不是非此即彼。你想跑DeepSeek V4、Gemma 4、Llama这些开源模型？本地来。你想用GPT、Claude、Gemini？连上云端API就行。所有记忆、文件、工具都留在你自己的硬件上。通过硬件隔离的虚拟沙箱来保证安全，数据不会被随便传走。

它还有20多个原生插件——邮件、日历、浏览器、音乐、Git、文件系统、Excel、PPT这些都能直接操作。最近还加了语音功能。本质上它把自己定位成一个”AI控制层”，不管底层用什么模型，上层体验统一。

硬件门槛和商业化方向

门槛不算低——最低64GB内存，想跑大模型推荐128GB。不过Pae认为这个门槛会越来越低，因为”每瓦特能输出的智能”在快速提升，这条曲线的斜率甚至比GPU的摩尔定律还陡。

竞争对手不少——Ollama、LM Studio、Msty都是这条赛道上的玩家。但Osaurus的差异在于它面向普通用户而非开发者，界面更友好。目前项目完全开源免费，团队在纽约的Alliance加速器里打磨产品，未来考虑切入法律和医疗这些对隐私要求极高的B2B场景。
- Osaurus是Mac专属的开源LLM服务器，支持本地+云端模型切换
- 创始人Terence Pae，前特斯拉和Netflix工程师
- 上线近一年下载量超11万，20+原生插件
- 最低硬件要求64GB内存，推荐128GB
- 面向非开发者群体，计划切入法律/医疗等隐私敏感领域
📎 原文来源：Osaurus brings both local and cloud AI models to your Mac (TechCrunch, Sarah Perez, 2026-05-15)
2026年5月17日
一边创纪录赚158亿，一边裁4000人：思科的AI阳谋
5月14号，思科干了件让硅谷炸锅的事——同一天公布创纪录的季度财报和近4000人的裁员计划。股价在盘后涨了差不多20%，华尔街用真金白银给这个决定投了赞成票。

思科CEO Chuck Robbins，2026年4月15日华盛顿Semafor世界经济大会

钱没少赚，人照样裁

思科2026财年第三季度收入158亿美元，同比涨了12%。CEO Chuck Robbins在博客里高调宣布”创纪录营收”和”两位数增长”，话音刚落就甩出裁员通知。这不是思科第一次这么干了——2024年两轮裁员5600人，2025年又裁了150人，加起来这已经是第四轮了。CFO Mark Patterson的说法很体面：这不是为了省钱，而是”快速把资源重新分配到硅芯片、光模块、安全和AI这些优先领域”。

“AI时代能赢的公司，是那些有聚焦、有紧迫感、有纪律去持续把投资转向需求和长期价值最强领域的公司。”——Chuck Robbins

9亿美元的AI订单意味着什么

真正驱动思科动作的不是节流，而是开源。微软、Google、亚马逊、Meta这些超级云厂商正在疯狂建设计算集群，对高带宽网络设备的需求创了历史新高。思科本财年AI基础设施订单已经53亿美元，全年预计能到90亿——这比年初预估的50亿几乎翻了一番。数据中心交换机订单涨了40%以上，网络产品订单涨了50%以上。这不是周期性波动，而是一个”网络超级周期”的开端。

裁掉4000人，补上AI工程师

思科给被裁员工提供了遣散费、按比例发放的奖金、一年免费课程和就业安置服务。但Gartner的分析师Helen Poitevin一针见血地指出：”很多CEO用裁员来展示AI的快速回报，但这个思路是错的。裁员也许能腾出预算，但不创造回报。真正提升ROI的公司，不是那些消除了对人的需求的公司，而是那些放大了人的能力的公司。”

Gartner今年5月的调查更有意思：350家年收入超10亿美元的企业中，80%因部署AI而裁了人，但裁员公司的财务表现和没裁员的公司几乎一模一样。他们甚至预测到2027年，50%把裁员归因于AI的公司会重新雇佣类似岗位的人，只不过换了种头衔。

Sam Altman也说了句大实话：”有些AI洗白存在，人们把本就要做的裁员怪到AI头上。”虽然AI确实在替代工作，但这两件事混在一起，外人很难分辨。
- 思科Q3营收158亿美元，同比+12%；盘后股价涨约20%
- 裁员约4000人（占员工总数5%），2024年以来第四轮
- 全年AI订单预期从50亿上调至90亿美元
- Gartner调查：80%大企业因AI裁员，但财务表现无明显差异
- 2026年前4个月美国科技裁员超8.5万人，AI是最多引用的原因
📎 原文来源：Cisco cuts nearly 4,000 jobs to spend more on AI, reports record quarterly revenue (TechCrunch, Zack Whittaker, 2026-05-14)
2026年5月17日
AI开始自己造自己了？前You.com创始人携6.5亿美元杀回来

当一个AI系统能自己找出自己的弱点，然后动手改掉它——全程不需要人类插手——会发生什么？这听起来像科幻小说，但Richard Socher觉得这就是下一件真实发生的事。

Socher不是无名之辈。他创立了早期AI搜索引擎You.com，在那之前还是ImageNet的论文作者之一。本周三，他带着一家叫Recursive Superintelligence（递归超智能）的新公司正式走出隐身模式，首轮融资就拿到了6.5亿美元，投资方包括Greycroft和GV（Google Ventures）。

目标：让AI递归地自我改进

递归超智能这个名字就说明了野心。Socher在接受TechCrunch采访时说：

“我们主要的聚焦点是建立真正递归的、自我改进的超大规模智能体。这意味着整个过程——产生研究想法、实施想法、验证结果——全程自动。”

他特别强调，这种递归自我改进不是简单的”让AI去优化某个东西”。那只是改进，不是递归。真正的递归，意味着AI系统能够自主识别自己的缺陷，然后自己动手改代码或架构，形成一个持续向上的闭环——没有人类干预的循环。

团队里全是狠人

Socher这次拉来的队友份量十足：Google AI元老Peter Norvig、前OpenAI Codex和深度研究团队负责人Josh Tobin，以及Google DeepMind开放性（open-endedness）研究团队的Tim Rocktäschel——Genie 3世界模型的缔造者。

Rocktäschel提出的”彩虹红队”（rainbow teaming）概念尤其有意思：两个AI互相攻防，一个不断寻找对方的漏洞，另一个持续修复进化——就像自然界猎豹和瞪羚的军备竞赛，能在数百万次迭代中产生远超单一方向优化的效果。这套方法已经被各大AI实验室广泛采用。

产品多久能出来？

Socher说产品推出时间可能比原计划提前，但他还是卖了个关子：“几季度内，不是几年内。”

他真正想探讨的，是一个更深层的问题——一旦这种递归自我改进成为现实，计算资源将变成唯一真正稀缺的东西。Socher打了个比方：未来人类会面临选择——要不要用多少算力去治愈某种癌症？这类问题将成为全球最大的资源分配决策。

“我们对智力的上限一无所知——它可能是天文数字级别的，我们离那个边界还远得很。但正因如此，这个问题值得认真对待。”

说到底，Recursive Superintelligence想要做的，其实也是整个AI行业最核心的那道谜题：机器能否真正理解自己，然后超越自己？6.5亿美元，Socher至少已经迈出了第一步。

递归超智能：AI开始自己造自己

📎 原文来源：What happens when AI starts building itself? — TechCrunch, Russell Brandom, 2026-05-14

2026年5月17日

博客

钱从哪来，花到哪去

Claude Code是真正的现金牛

9000亿之后，IPO还远吗

干了什么？买人、买公司、派工程师进驻客户

为什么OpenAI要干这件事

几个值得关注的变量

Workers：不需要你自己搭服务器

外部Agent接入：Claude、Codex都能直接用

Agent SDK：反向输出到任何应用

怎么看这件事

Steering到底是什么，跟提示词有什么区别

为什么以前没流行起来

DeepSeek-V4-Flash + DwarfStar 4改变了什么

能拿它干什么

从黑盒喊话到白盒调参

50人离职，几乎搬空了核心团队

竞争对手趁机挖人

马斯克的”极限文化”又一次出了问题

钱和规模救不了人才流失

为什么中国医生需要它？

四层循证AI架构：每句话都有出处

BMJ独家授权意味着什么

从信息检索到循证第二大脑

混合线性注意力：让长视频不再OOM

双分支相机控制：6自由度精确驾驭

两阶段生成 + 极致训练效率

世界模型 vs 文生视频：两条路的分歧

一个前特斯拉工程师的执念

本地+云端，两不耽误

硬件门槛和商业化方向

钱没少赚，人照样裁

9亿美元的AI订单意味着什么

裁掉4000人，补上AI工程师

目标：让AI递归地自我改进

团队里全是狠人

产品多久能出来？