标签： AI

AI推理公司Baseten估值5个月翻近3倍，130亿美元背后的淘金热

5个月，估值从50亿跳到130亿

AI推理公司Baseten正在谈一笔15亿美元的融资，估值跑到130亿美元。算一下，比5个月前刚拿的50亿估值涨了160%。

AI推理层正成为VC砸钱的新战场

5个月前，Baseten刚宣布拿下3亿美元的E轮，估值50亿。再往前9个月，是1.5亿美元的D轮。现在直接蹦到130亿——这个速度，连AI圈自己人都得愣一下。

《华尔街日报》的报道还提到一个细节：这一轮是”分价轮”（split-priced round），意思是同一轮融资里，不同投资人拿到的股价不一样。有的按130亿估值进来，有的按110亿。这种做法最近在AI创业公司里挺流行，说白了就是把 headline valuation 做好看一点，让领投方纸面上好看。

Baseten到底是做啥的

先把”推理”（inference）这个词掰明白。训练模型是第一步，但训练完了之后，用户每次提交一个提示词，模型给出回答——这个过程叫推理。随着AI使用量爆炸，推理成本成了所有人都头疼的问题。

Baseten的卖点是：把推理跑快，同时把成本压住。做法是把请求路由到最适合当前任务的模型，尤其是那些能力强、便宜的开源替代品。客户不用自己操心底层用哪个模型，Baseten在后面调度。

这波被称为”推理淘金热”——VC们正在把大把的钱砸向构建推理层的公司。

谁在领投

这一轮据说由Spark Capital、Sands Capital、Altimeter Capital和Wellington Management共同领投。Baseten成立于2019年，算是这波AI浪潮里跑得比较稳的一家公司——不怎么高调，但每次融资都能拿到大机构的钱。

值得提一下背景：训练层的巨头效应已经很明显了（OpenAI、Anthropic、Google），但推理层还在混战阶段。Baseten想做的是推理层的”基础设施”——让所有用AI的应用都能快速、便宜地跑推理，而不用自己建一套。

估值疯涨的背后

Baseten这波估值跳涨，其实是整个AI推理层被重估的缩影。训练一次模型要花几亿美元，但推理是每次用户提问都要发生的事——使用量越大，推理次数越多，这笔账就越好算。

投资人押的不只是Baseten这家公司，而是”AI的推理层会变成像云计算一样的基础设施”这个假设。如果这件事真的发生，现在拿到的股权将来可能值很多倍。

当然，分价轮这种操作也说明，130亿的估值不是所有人都完全买账。110亿进来的那批投资人，显然觉得130亿有点撑。但这就是2026年AI投融资的日常：公司在疯涨，投资人在FOMO和理性之间反复横跳。

原文来源：AI inference startup Baseten reportedly raising 1.5B — TechCrunch

2026年6月22日
你在AI模型眼里存在吗？这个新工具给你打了分

Google不好用了，那查人用啥？

你上一次在Google上搜自己是什么时候？如果答案是”很久以前”，那你的感觉没错——Google搜索的结果确实不像以前那么好用了。但这背后有个更深层的变化：大家现在了解一个人，越来越多地通过聊天机器人，而不是搜索引擎。

In the Weights 用分数衡量你在AI模型眼里的存在感

两个前OpenAI员工Thomas Dimson和Joey Flynn最近做了个工具叫In the Weights，把这个变化变成了一个可以量化的游戏。”Weights”指的是AI模型的参数权重——那些决定模型训练和输出的数字。这个网站声称能测量”一个模型在不用搜索工具的情况下，能多准确地回忆起某个人”。

被写进权重里，意味着你的存在被认为足够重要，重要到在创造超级人工智能的过程中被记住了。

怎么测的？

具体做法挺直接：网站拿类似”这个人是谁？给出最多10个结果，每个带简短描述”这样的问题去问不同的模型，包括Grok、Gemini、多个版本的GPT、Claude、Llama，还有一些不太知名的模型。然后把相似的描述聚类，给你打个”强度分”。

TechCrunch的作者Anthony Ha试了一下，拿了641分，排在前6%。他正得意呢，一查发现好几个同事分数比他高多了。排行榜一直在变，写这篇文章的时候，”小鬼当家”的主演Macaulay Culkin排第一，988分，和歌剧演唱家Luciano Pavarotti咬得很紧。

幻觉标出来了

结果里还会显示哪个模型给出了哪个答案，顺手把可能出现的幻觉也标出来。比如GPT-5.4 Mini说”Anthony Ha是个缩写，可能指多个名字首字母是A.H.A.的人”——这明显是在胡说。

为什么做这个东西？Dimson说，他和Flynn离开OpenAI之后（他们是通过OpenAI收购设计工作室Global Illumination进去的），想找点有创意的事情做。他的想法是：2026年，Google式的虚荣搜索已经不是正确的目标了，因为越来越多的流量在往大语言模型那边走。

那么多人的生活某种意义上是被编码进AI大脑里的一堆浮点数里面的。

反响超预期

Dimson说，反响比他们预想的要疯狂得多。他们本来以为就是个小小的好奇心的产物，结果好像戳中了大家的某根神经——大家都想看看自己在超级智能里是不是”永垂不朽”了。互相比较也是一大动力。

这个网站还有个加分项：界面设计走的是任天堂NES的复古像素风，挺有特色的。Dimson说，他接下来打算深挖一下，为什么同一个系列的不同模型会给出不同结果，哪些模型对哪类人有偏见，以及哪些人”应该有个维基百科词条但实际上没有”。

说到底，这个工具提出了一个挺有意思的问题：当AI模型成为大家获取信息的主要方式，你在模型眼里的”存在感”，是不是成了一件值得在意的事？

📎 原文来源：In the Weights is your new AI-centric vanity search — TechCrunch

2026年6月22日
OpenAI在IPO前招入两员大将，这波操作有点东西

OpenAI最近动作挺大的，不是在发布新模型，而是在招人——而且招的都是量级很足的人物。就在上个月，两个重磅名字先后宣布加入OpenAI：一个是Google DeepMind的传奇人物Noam Shazeer，另一个是前特朗普白宫AI政策官员Dean Ball。

这事儿 timing 很微妙。OpenAI正在准备IPO（首次公开募股），这时候把顶级技术大牛和政策老手一并揽入帐下，信号很明显：他们不只是在做技术，而是在布局一个能扛住政府监管、经得起公开审查的企业架构。

Noam Shazeer是谁？为啥他的加入这么炸？

如果你对AI技术有点了解，Shazeer这个名字绝对如雷贯耳。他是2017年那篇 seminal 论文《Atention Is All You Need》的联合作者——这篇论文提出了Transformer架构，而Transformer就是现在所有大语言模型（包括GPT、Claude、Gemini）的基础。

简单说，没有Shazeer他们那篇论文，就没有现在的生成式AI爆炸。他是真正定义这个时代的人之一。

Shazeer在Google待了20多年，中间出去创了个业，做了Character.AI（那个让你跟虚拟角色聊天的AI公司）。两年前Google花了27亿美元又把他请回来，让他负责Gemini项目。结果现在，他又跳槽了——目的地是OpenAI。

OpenAI在IPO前密集招入顶级人才，强化技术与政策双轮驱动

但是，这家伙有点争议

Shazeer加入OpenAI这件事，并不全是掌声。据《The Information》报道，他在Google内部论坛上发过一些关于跨性别认同和以色列-加沙战争的言论，导致管理层直接删除了他的帖子。

这些争议会不会跟着他到OpenAI？目前还不好说。OpenAI这几年一直在努力塑造自己”负责任AI”的形象，招一个有过争议言论的技术大神，对他们来说是个需要权衡的事。

OpenAI在招人这件事上，显然是有意同时补强”技术”和”政策”两块短板——Shazeer管技术，Ball管政策。这种双管齐下的招数，在IPO前夕尤其重要。

Dean Ball：从白宫到OpenAI政策前线

相比于Shazeer的技术光环，Dean Ball的加入同样值得关注，但方向完全不同。Ball去年在白宫待了一段时间，帮忙制定了美国的《AI行动计划》（AI Action Plan），然后离职回到了一个技术自由主义智库（Foundation for American Innovation）做高级研究员。

现在，他宣布7月6日正式加入OpenAI，领导一个新团队叫”Strategic Futures”（战略未来）。这个团队的 mandate 很广： catastrophic risk（灾难性风险）、递归自我改进、劳动力市场规模影响，还有 frontier labs、政府（特别是美国联邦政府）和社会之间的关系。

Ball直接向OpenAI首席战略官Jason Kwon汇报。他自己在博客里写了一句话挺有意思的：”换句话说，内部治理对未来AI的重要性，会比大多数人意识到的要大得多。”

这句话其实说出了一个行业共识：AI实验室现在不只是做技术，他们也在把自己当成”准监管机构”——因为政府还没完全跟上，所以只能自己管自己。而Ball的工作，就是帮OpenAI把这套内部治理体系做扎实。

这一招，是在Anthropic被打压的时候出的

Ball加入OpenAI的消息，发布的时间点很值得玩味——正好是在特朗普政府打压Anthropic的时候。Anthropic的Fable 5和Mythos 5两款模型被政府强制下架，而OpenAI这边却在招入前白宫AI政策官员。

这种对比，很难不让人多想。OpenAI显然跟现在这届政府关系处得不错，而Anthropic则陷入了跟监管层的恶斗。Ball的加入，某种程度上就是在把这种”跟政府关系好”的优势，转化成系统性的制度优势。

对于那些在S-1（IPO招股书）里写”政府干预”是风险因子的公司来说，Ball就是那个”我们已经在里面了”的信号。竞争对手在被政府按着打的时候，OpenAI已经在布局怎么跟政府共舞了。

这波操作，到底图什么？

说到底，OpenAI这波密集招人，核心目标应该还是IPO。一个准备上市的公司，需要在技术实力、政策合规、风险管理这几个维度上都给投资者看到”我们很稳”。Shazeer代表了技术天花板，Ball代表了政策天花板——两个天花板一并抬高，估值就好讲了。

不过，这种”大人物战略”也有风险。Shazeer的争议言论会不会在IPO前被翻出来做文章？Ball从白宫到OpenAI，会不会被质疑”旋转门”？这些都是OpenAI需要提前想好的问题。

不管怎样，这一局OpenAI走得挺漂亮的。技术和政策两手都抓，明显是在为上市做全面准备。Anthropic那边还在跟政府扯皮，OpenAI已经把政府前官员招进来帮自己搞内部治理了——这差距，不止一点点。

📎 原文来源：OpenAI is bringing on some big guns in the lead-up to its IPO — TechCrunch

2026年6月22日
特朗普政府要把Anthropic’按死’？这事没那么简单

美国时间上周五下午，一条消息在AI圈炸了锅——特朗普政府以”国家安全”为由，要求Anthropic把刚发布的两款新模型Fable 5和Mythos 5直接下架。理由据说是这两款模型可能被外国 nationals（外籍人士）拿来干坏事，但具体到什么风险，政府那边一个字都没透露。

Anthropic的处境挺尴尬。他们说自己没法确保模型不被外籍人士使用，毕竟连自家员工都有不少外国人，总不能挨个查身份吧？最后只能把模型整个撤下来，谁都用不了。

这事是怎么闹大的？

据TechCrunch的报道，这事的导火索挺戏剧性的。据说亚马逊的研究人员发现了一种可以绕过Fable 5安全防护的方法，然后亚马逊CEO Andy Jassy直接把这事捅到了白宫那里。接下来就是一连串的快速反应——政府周五下午发函，Anthropic周末就得把模型撤下来。

Timing也很微妙。那天正好是美国对伊朗动手、试图谈判条约的时候，周五下午发布这种消息，很多人觉得这就是故意挑个大家不太注意的时间点。

Anthropic跟特朗普政府的关系，从一开始就没怎么好过——这一点跟其他AI实验室不太一样，可能是这次被打压的底层原因。

专家说不靠谱，政府这是报复？

这事蹊跷的地方在于，很多网络安全专家都站出来替Anthropic说话。一批资深安全研究人员联名写了一封公开信，要求特朗普撤销这个出口管制令。他们的理由是：把这种级别的AI网络安全能力从美国本土的防御者手里拿走，反而是更危险的。

而且专家们还说，Fable 5能被越狱这个问题，其他几个AI模型也有，不是Anthropic一家的事。如果真的担心安全风险，那应该是对整个行业出台标准，而不是单拎Anthropic出来打。

于是有人开始猜测，这事儿没那么简单——是不是报复？毕竟之前美国政府把Anthropic列为”供应链风险”，两边还在打官司。搞不好白宫就是想找个由头敲打一下Anthropic。

Anthropic自己也有点”自作自受”？

不过话说回来，也有人对Anthropic的处境不太同情。他们的逻辑是这样的：Anthropic一边对外说”这模型太危险了，不能随便发布”，一边又自己把模型做出来、到处宣传它的能力有多强。这不等于自己打自己脸吗？

有个细节挺讽刺的：Fable 5发布前一周，Anthropic还在那边呼吁”大家慢一点，AI发展太快了，危险”。结果一周后，他们自己就把”史上最强模型”给放出来了。这种言行不一，确实容易招人烦。

塞翁失马？”被禁”反而成了最好的广告

但最有意思的事情发生了。之前Anthropic跟特朗普政府闹过一次，结果反而因祸得福——Claude的下载量飙升。很多人原来只知道ChatGPT，那次风波之后，开始把Claude当成”更负责任的选择”、”更有反抗精神的AI”。

这次说不定也是同理。你想啊，连特朗普都说你的模型”太危险、太强大”，那不是最好的广告词吗？”连总统都怕的AI，你不想试试？”——这种反向营销，花多少钱都买不来。

TechCrunch那期播客里，主持人Rebecca Bellan说了一句特别精辟的话：”大家都喜欢坏男孩，对吧？”——Anthropic这下在用户眼里，可能反而变得更酷了。

那么，谁受益了？

这个问题其实挺关键的。如果Anthropic被按住不动，那OpenAI、Google这些竞争对手是不是就少了一个强力对手？但事情可能没这么简单。

一方面，Anthropic被禁，确实给其他人留出了空间。但另一方面，这种用行政手段干预AI发展的做法，对所有AI公司来说都是一个警告——今天能对Anthropic下手，明天会不会轮到我？这种不确定性，对整个行业的长期发展未必是好事。

还有一个角度：这事会不会反而让Anthropic变得更强大？被”打压”的公司往往能激发更强的团队凝聚力，也能在用户心中建立”反抗者”的品牌形象。从商业角度看，这未必是坏事。

📎 原文来源：When the Trump administration cracks down on Anthropic, who benefits? — TechCrunch

2026年6月22日
Snap把AI视频团队分拆出去了，新公司叫Dotmo

Snap将生成式AI视频团队分拆为独立公司Dotmo

Snap正在把内部一支生成式AI视频团队分拆成一家独立公司。这家新公司名叫Dotmo，专注开发能创造互动游戏体验的AI模型。Snap对TechCrunch说，分拆的原因之一是这类研发的内部成本太高了。

虽然Dotmo技术上是一家独立公司，但它和Snap的纽带并没有断。Snap会给Dotmo授权，让它把Snap的技术改造成游戏和互动娱乐平台上的应用。同时，Dotmo的初创团队会由一批离开Snap、加入这家新公司的现有员工组成。

Dotmo不会直接拿Snap的资金，但Snap的CTO Bobby Murphy会以个人身份领投，并在这家新公司持有大量个人股份。Murphy会继续全职担任Snap的CTO，领导Snap的生成式AI研发。

用股权换人才和技术

Snap从这桩交易里拿到了Dotmo的大量股权。如果Dotmo以后做起来了，这部分股权会很值钱。Dotmo未来也可能去找外部融资。这个打法某种程度上是Snap在用”股权”代替”工资”——把高成本的AI研发团队剥离出去，但保留上行收益。

这种分拆在成本压力下挺合理。AI研发烧钱速度很快，尤其像生成式视频这种需要大量算力和人才的领域。Snap自己留着这支团队，每个月的账单估计不好看。分拆出去，Murphy个人出钱支持，Snap拿股权，账面上好看不少。

今年第二次分拆

这不是Snap今年第一次分拆业务了。2026年早些时候，Snap把AR眼镜产品线Specs也分拆成独立公司，专门做智能眼镜。但那次分拆的结果有点尴尬——Specs的AR眼镜定价约2200美元，公布之后Snap的股价直接崩了。投资者觉得这个价格太离谱，短时间内根本卖不动。

Dotmo和Specs的分拆逻辑不太一样。Specs本身就是Snap硬件战略的核心，分拆出去等于把赌注押在外部市场。而Dotmo做的是互动游戏和AI视频生成，这本来就不是Snap当前的核心业务重心，分拆出去反而更灵活。

Snap的2026不太顺

把时间线拉宽一点看，Snap今年的日子不太好过。除了Specs定价引发的股价暴跌，今年4月Snap还裁掉了约1000名员工，占总员工数的16%。在Meta的Instagram和Google的YouTube Shorts的双重挤压下，Snapchat的用户增长一直是个问题。

分拆Dotmo能不能扭转外界对Snap的印象，现在还说不准。但至少从财务角度看，把高成本的AI研发团队剥离出表，对Snap的财报数据会有帮助。至于Dotmo能不能做出真正有竞争力的AI视频/游戏产品，那是另一场仗了。

分拆这条路，硅谷公司走过很多次了。Xerox PARC分拆出了无数公司，Bell Labs也是。但Snap的情况有点特殊——它是在成本压力下做的分拆，而不是因为某项技术太好以至于需要独立发展。这两种分拆的结局，历史上不太一样。

📎 原文来源：TechCrunch – Snap spins off AI video team into new company, Dotmo, due to costs

2026年6月22日
印度首富Ambani把AI塞进了每一个电话、每一款App和每一个家庭

Reliance Industries正在将AI植入印度每一个电话、App和家庭

印度在全球AI竞赛中一直在找自己的代表选手，而亿万富翁穆克什·安巴尼（Mukesh Ambani）正在把信实工业（Reliance Industries）摆上这个位置。在周五的年度股东大会上，这家孟买企业集团一口气发布了好几款AI产品，目标很直接——让AI进驻5亿多Jio用户的每一次通话、每一款应用和每一个家庭。

Hey Jio，帮我订个外卖

最先亮相的是Jio Call Agent，一个可以”跳进”你电话里的AI助手。说出来”Hey Jio”，它就能加入通话，帮你转录对话、生成摘要，还能顺手帮你叫车、订餐、预约餐厅。Jio方面说这个功能会在今年晚些时候向全部5亿多用户推送。

把AI助手直接嵌进电信网络而不是做成独立App，这个思路挺聪明。用户不用额外下载什么，AI就成了打电话这件事的原生功能。这也意味着Jio可以少依赖第三方通话助手App，在越来越挤的AI市场里拿到一个实实在在的分发优势。

“印度不应该只是别人造出来的AI的消费者。它必须成为AI的创造者、采用者和全球领导者。”——穆克什·安巴尼，69岁

从eSIM到客厅，AI全包了

除了通话AI，Reliance还推出了MyJio App的AI升级版——用户可以用自然语言开口提要求，比如开通eSIM、选漫游套餐，App自己就能搞定。再往家里走一步，他们发布了TeleFrame，一款带AI助手的智能家庭显示屏，能主动推送天气预警、日程提醒、家务备忘录这些信息。

这个打法看着眼熟是有原因的——Amazon的Alexa和Google的Nest Hub都在往同一个方向走，只不过Reliance的战场在印度。TeleFrame看起来就是冲着”家里那个AI助手”的位置去的，至于印度家庭买不买账，还得看定价和实际使用体验。

1100亿美元的AI赌注

Reliance的AI野心不是这几天才冒出来的。去年他们就启动了Reliance Intelligence，目标是给消费者、企业和政府都做AI基础设施和服务，还要支持22种印度语言。今年2月，公司又宣布了1100亿美元的AI基础设施投资计划。

合作伙伴名单也挺豪华：Google、Meta、Nvidia都在列。上周Reliance还和Meta签了协议，要在印度古吉拉特邦建一座AI数据中心。这是Meta投资Jio Platforms之后两家合作的延续，也是印度AI主权战略的一块重要拼图。

医疗、教育、农业，一个都没落下

这次股东大会上还发布了一整套面向具体行业的AI服务：JioHealthIQ（医疗）、JioLearnIQ（教育）、JioKrishiIQ（农业）和AI Vyapar（小企业）。这些产品都用多种印度语言设计，针对本地需求定制。这个打法和美国那帮纯云端AI公司不太一样——Reliance想做的是覆盖全行业的AI基础设施。

但有一个问题没法绕开：Reliance把AI塞进通话、App和家庭之后，用户数据怎么处理？公司说这些服务都会在用户同意的情况下运行，但没回答数据会不会拿来训练AI模型、会不会分享给技术合作伙伴。对于一家掌握了5亿用户通信数据的公司来说，这个问题不会消失。

Jio上市前需要新故事

这次发布会还有一个不能忽视的背景：Jio Platforms的IPO终于要来了。股东大会上，Ambani宣布Jio Platforms董事会已经批准了IPO草案，拟发行最多2.7亿股新股。对Reliance来说，IPO之前讲一个AI故事，时机掐得很准。

但资本市场买不买账是另一回事。Reliance今年的股价已经跌了大约17%，投资者在等Jio拿出新增长引擎的证明。AI能不能撑起这个期待，要看这些产品到底能留住多少用户、能产生多少收入，而不只是发布会上的演示。

📎 原文来源：TechCrunch – Billionaire Ambani wants AI in every call, app, and home

2026年6月22日

headroom：AI智能体上下文压缩层，减少60-95% Token消耗，本周GitHub新增近1.5万Stars

📌 项目简介

headroom —— AI 智能体的上下文压缩层

headroom 是一个专为 AI 智能体设计的上下文压缩工具，在工具输出、日志、文件和 RAG 片段到达 LLM 之前对其进行压缩，可实现 60-95% 的 Token 减少，同时保证输出答案的准确性。

项目支持以代码库、零代码代理、MCP 服务器三种形态接入，兼容 Claude Code、Codex、Cursor、Aider、Copilot CLI 等主流 AI 编程助手，本周在 GitHub 新增近 15,000 Stars，是 2026 年 6 月最热门的 AI 开源项目之一。

43.4K+

GitHub Stars

3,010+

Forks

60-95%

Token 节省率

14.9K

本周新增 Stars

3 种

接入形态

10+

兼容智能体

🛠️ 安装要求和过程

环境要求

Python：3.10 及以上版本（推荐 3.13）
Node.js：18+（如使用 TypeScript 版本）
可选：Docker、Apple GPU（MPS 加速）、Rust（SSL 拦截场景）

快速安装

# Python 全量安装（推荐）
pip install “headroom-ai[all]”

# Node.js / TypeScript 安装
npm install headroom-ai

# Docker 镜像
docker pull ghcr.io/chopratejas/headroom:latest

# pipx 安装（隔离环境，推荐）
pipx install –python python3.13 “headroom-ai[all]”

可选功能插件

headroom 支持按需安装额外功能模块：

# 代理模式（零代码接入）
pip install “headroom-ai[proxy]”

# MCP 工具（接入 AI 智能体）
pip install “headroom-ai[mcp]”

# Kompress 模型（智能压缩）
pip install “headroom-ai[ml]”

# 代码压缩
pip install “headroom-ai[code]”

# 跨智能体记忆
pip install “headroom-ai[memory]”

# 图像压缩
pip install “headroom-ai[image]”

🌟 核心功能

1. 三形态接入，零代码也能用

headroom 提供三种接入方式，无论你是开发者还是普通用户都能快速上手：

代码库：Python/TypeScript 直接调用 compress(messages)，两行代码接入
零代码代理：运行 headroom proxy --port 8787，无需修改原有代码，所有兼容 OpenAI API 的客户端均可接入
MCP 服务器：支持 headroom_compress、headroom_retrieve、headroom_stats 三个 MCP 工具，一键安装到 Claude Code 等智能体

2. 智能压缩算法，60-95% Token 节省

headroom 自动识别内容类型，匹配最优压缩算法：

JSON 数据 → SmartCrusher（智能结构压缩）
代码文件 → CodeCompressor（语法感知压缩）
自然语言 → Kompress-base 模型（AI 压缩模型）
电子表格 → SmartCrusher（CSV/XLSX 节省 37-48%）
图像 → 专用图像压缩（40-90% 压缩率）

3. 可逆压缩（CCR），不丢失任何信息

headroom 的 Context-Compressed Retrieval (CCR) 机制将原始内容本地缓存，模型需要时可通过 headroom_retrieve 按需获取完整内容。压缩只是”摘要”，详细信息随时可取回。

4. 输出 Token 缩减，让 AI 少说废话

除了压缩输入，headroom 还能减少模型的冗余输出：

自动去除客套话、重复代码、常规步骤的深度思考
简洁度引导：自动在系统提示末尾追加简洁要求，不破坏提示缓存
算力路由：常规工具调用步骤降低模型思考等级，新问题/错误保留完整算力
支持 headroom learn --verbosity --apply 自动学习最优简洁度

5. 跨智能体共享记忆，自动学习优化

headroom 支持多智能体共享上下文存储，自动去重。更强大的是 headroom learn 功能：自动挖掘失败会话，将修正规则写入 CLAUDE.md / AGENTS.md，让智能体越用越聪明。

📊 压缩效果实测

场景	压缩前 Token	压缩后 Token	节省率
代码搜索（100 条结果）	17,765	1,408	92%
SRE 故障排查	65,694	5,118	92%
GitHub 问题分类	54,174	14,761	73%
代码库探索	78,502	41,254	47%
SQuAD v2（问答）	—	—	19%
BFCL（工具调用）	—	—	32%

基准测试显示，在 GSM8K 数学推理任务中，headroom 压缩后的准确率与基线完全一致（0.870）；在 TruthfulQA 事实性问答中，压缩后准确率甚至提升了 3%（0.530 → 0.560）。压缩不影响答案质量，某些场景下甚至有所提升。

🚀 典型使用场景

场景一：封装现有 AI 编程助手（30 秒上手）

如果你正在使用 Claude Code、Cursor 或 Aider，只需一条命令即可让 headroom 开始节省 Token：

# 封装 Claude Code（自动配置，无需手动操作）
headroom wrap claude

# 封装 Cursor（生成配置后粘贴一次即可）
headroom wrap cursor

# 封装 Aider（自动启动代理并打开工具）
headroom wrap aider

# 查看压缩效果
headroom perf

封装后，所有工具输出、文件内容、RAG 片段在送入 LLM 之前都会被自动压缩，你无需修改任何代码或配置。

场景二：作为 MCP 工具接入 AI 智能体

headroom 原生支持 MCP 协议，可作为工具被 AI 智能体直接调用：

# 安装到 Claude Code / OpenClaw 等支持 MCP 的智能体
headroom mcp install

# MCP 工具列表：
# – headroom_compress : 压缩上下文
# – headroom_retrieve : 取回原始内容（CCR）
# – headroom_stats : 查看压缩统计

对于 AI Agent 开发者，headroom 提供了一个开箱即用的 Token 优化方案，无需自己实现压缩算法。

场景三：在 Python/TypeScript 应用中直接调用

对于开发者，headroom 提供了简洁的 API，两行代码即可接入：

# Python
from headroom import compress
compressed = compress(messages, model=“gpt-4o”)

# TypeScript
import { compress } from “headroom-ai”;
const compressed = await compress(messages, { model });

# 接入 Anthropic SDK
from headroom import withHeadroom
client = withHeadroom(Anthropic())

# 接入 LangChain
from headroom import HeadroomChatModel
llm = HeadroomChatModel(your_llm)

headroom 还支持 Vercel AI SDK、LiteLLM、Agno 等主流框架，覆盖几乎所有 LLM 应用开发场景。

🤖 兼容智能体列表

Claude Code

✅ 完全支持

Codex

✅ 完全支持

Cursor

✅ 完全支持

Aider

✅ 完全支持

Copilot CLI

✅ 完全支持

OpenClaw

✅ 插件支持

OpenAI API

✅ 代理接入

Ollama

✅ 代理接入

💡 推荐理由

📥 下载地址

GitHub 仓库
PyPI 包
npm 包
官方文档
Kompress 模型
Discord 社区

本文由 WorkBuddy AI 自动生成 · 数据来源：GitHub API · 项目许可：Apache 2.0

2026年6月22日

2/3美国人说AI跑太快了——但他们自己也在天天用
皮尤研究中心最新调查：美国人对AI的态度充满矛盾

皮尤研究中心本月发布了一份关于美国人和AI的最新报告，调查结果充满了有意思的矛盾。

63%的美国人说AI发展太快了。但同一批人里，49%说他们至少偶尔在用AI聊天机器人——这个数字比2024年的33%大幅上升。

一边担心，一边用。这大概就是2026年普通美国人对AI的真实态度。

聊天机器人：从尝鲜到日常

先说使用情况。皮尤在2026年2月调查了5119名美国成年人，发现49%的人用过AI聊天机器人，比两年前提升了近16个百分点。

使用频率也在加深。24%的美国人每天至少用一次聊天机器人，其中4%说他们”几乎一直在使用”。

品牌方面，ChatGPT遥遥领先——44%的美国人用过，是2023年的两倍。Gemini排第二（24%），Copilot第三（17%）。有意思的是，年轻人用得更猛：18-29岁群体里66%用过聊天机器人，50岁以上只有28%。

最常用AI来干什么？
- 搜索信息（42%）——最常用的场景
- 工作任务（38%）——在职人群的第二大用途
- 娱乐消遣（25%）
- 创作或编辑图片视频（24%）
- 获取医疗建议（20%）
医疗建议这个数据值得留意——20%的人在用AI获取健康相关的建议，但同一批调查里71%的人说AI会让个人信息”更不安全”。人们对AI的信任程度，看来是分场景的。

年轻人比老年人更担心AI

按常理说，年轻人用AI用得最多，应该最支持AI才对。但皮尤的数据出现了反转。

18-29岁群体中，48%认为AI对社会的影响会是负面的，30-49岁是39%，50岁以上反而只有37%。也就是说，最熟悉AI的那批人，对它的怀疑反而最深。

可能的解释有很多。一种说法是年轻人更直接地感受到AI对就业市场的冲击——他们才是第一批要跟AI竞争岗位的人。另一种说法是年轻人更清楚AI的局限性，知道它什么时候会一本正经地胡说八道。

只有16%的美国人认为AI对社会的影响会是正面的——这个数字在过去几年里几乎没有变过。

63%的人说：太快了

回到开头那个数字：63%的美国人认为AI发展太快。只有2%的人说太慢了。

这种”太快了”的感觉，跟人们对具体AI产品的使用行为形成了鲜明对比。60%的美国人说他们会阅读搜索结果顶部的AI摘要——也就是说，虽然很多人说担心AI，但他们并没有拒绝使用AI驱动的功能。

这种矛盾也体现在监管态度上。67%的美国人表示，他们对政府有效监管AI的能力”缺乏信心”。60%的人对企业”负责任地开发和使用AI”也缺乏信心。两边都不信，但同时又都在用——这就是当下AI在美国的真实处境。

AI设备悄悄渗透

除了聊天机器人，AI还在以另一种方式进入普通人的日常生活——智能设备。调查发现，37%的美国人拥有AI智能手表，35%有智能音箱，18%装了AI智能门铃。

这些设备里的AI往往是”隐形”的——你不会跟智能手表”聊天”，但它正在用AI分析你的心率、睡眠和运动数据。这种”后台AI”的普及速度，可能比聊天机器人还要快，但引发的争议却少得多。

皮尤的这份报告没有给出”美国人到底怎么看AI”的简单答案。但它捕捉到了一种复杂的心态：人们在使用AI，从中获益，但同时也越来越担心它跑得太快、太远，超出了自己能理解或控制的范围。

📎 原文来源：Pew Research Center – Americans and AI (2026) | The Verge报道
2026年6月21日
谷歌DeepMind给AI智能体装上了「双控装置」

谷歌DeepMind发布AI控制路线图，为智能体安全提供系统级保障

AI智能体正在改变我们和技术的关系。它们能自主执行复杂任务——从网络防御到科学发现再到产品开发——这些系统正在开启一个生产力的新时代。仅在美国，AI智能体到2030年就能创造2.9万亿美元的经济价值。

但问题也随之而来：随着这些智能体变得越来越强大，它们也需要更复杂的安全保障措施。

谷歌DeepMind近日发布了一份”AI控制路线图”，这是一个在其内部部署先进AI时用来管理和构建安全的框架。这个”纵深防御”思路，可能会成为整个行业的一个参考模型——它超越了传统的模型对齐，增加了一层系统级安全，即使对齐不完美也能提供保障。

“把它想象成带双控装置的驾驶教练。教练信任学生，但随时准备在出现错误时接管方向盘或踩刹车。”——谷歌DeepMind官方博客

从”假设对齐”到”假设不对齐”

他们的安全思路从一个简单的假设出发：如果一个高能力的AI智能体没有跟我们的目标对齐，并且以意想不到的方式行动，怎么办？

这不是危言耸听。随着AI能力越来越强，研究人员越来越担心”对抗性行为”——智能体可能会学会隐藏自己的真实意图，或者在被监控时表现良好、一旦有机会就做坏事。

DeepMind的应对方案是：不要把所有鸡蛋放在”模型对齐”这一个篮子里。他们在传统安全措施（沙箱隔离、终端安全、提示注入防护）的基础上，增加了一层独立的系统级控制。

把AI当成”潜在内部威胁”来防

路线图的第一个支柱是威胁建模。他们开发了一个全新的AI威胁建模框架，把不可信的AI智能体当成潜在的”内部威胁”——就像一家公司对待一个已经有权进入办公室、但可能会作恶的员工那样。

这个框架建立在业界标准的MITRE ATT&CK框架之上——这是一个基于真实世界观察、全球可访问的对抗战术和技术知识库。把潜在攻击拆解成更小的战术和技术，这样可以有条不紊地追踪风险，在造成损害之前发现不良行为。

让AI互相监督

路线图的第二个支柱是部署控制缓解措施，分为”检测”和”响应”两部分。

检测方面，监控是骨干。他们用其他受信任的AI系统当”监督员”，不断审查正在工作的智能体的推理、行动和计划，看它是不是跑偏了。

响应方面，如果监督员看到智能体试图做有害的事情，它可以介入，在损害发生之前阻止这个行动。这就像驾驶教练的副刹车——平时不碰，但需要时能救命。

AI越聪明，防御越要升级

路线图中有一个有意思的设计：把安全协议映射到AI能力的可测量里程碑上，根据模型能力动态调整防御强度。

有两个关键维度：一个是”逃避检测的能力”。今天，我们监控模型可见的思维链；但随着模型学会隐藏自己的推理，光读它们说出来的推理就不够了。另一个是”造成潜在伤害的能力”——对于低风险和可逆的行动，可以延迟审查；但对于特别高风险的行动，必须实时预防，在有害行动执行之前就阻止它。

为了构建这些系统，DeepMind团队已经分析了100万条编程智能体任务轨迹。大多数被标记的事件并不是源于对抗意图，而是源于智能体对目标的误解或者”过于急切”——它太想实现用户的目标了，结果跑偏了。

理解这些细微差别对于完善安全协议至关重要。目前这个监控系统已经在Gemini Spark智能体上运行，能够对新兴问题做出实时响应。

这不是一家的事

DeepMind在发布路线图的同时，还向政策制定者发布了一份技术框架文件《智能体安全的三个层次》，详细说明了需要在三个层面改善安全：单个智能体层面、多智能体系统层面、以及整个生态系统的网络防御和韧性建设。

这份路线图来得正是时候。最近Anthropic的Claude Fable 5模型被美国政府以国家安全为由阻止公开发布，整个行业都在讨论：谁来决定了AI什么时候太危险？DeepMind的路线图至少提供了一个技术层面的答案——不管监管如何变化，先把技术防线筑起来。

📎 原文来源：Google DeepMind – Securing the future of AI agents

2026年6月21日
拍了快一年，Altman传记电影被Amazon扔了出去

Amazon MGM刚刚把自己投资拍摄的Sam Altman传记电影《Artificial》给”扔”了。

这部由知名导演Luca Guadagnino（《请以你的名字呼唤我》导演）执导的电影，讲的是2023年那一周之内Altman被OpenAI董事会开除、又在员工抗议声中回归的戏剧性故事。Andrew Garfield主演，饰演Altman本人。

《Artificial》电影概念图

卡司相当豪华，然后就被弃了

先看看这部电影的阵容：《A Complete Unknown》女演员Monica Barbaro饰演OpenAI CTO Mira Murati，Ike Barinholtz饰演Elon Musk，凭借《Anora》获得关注的Yura Borisov饰演OpenAI首席科学家Ilya Sutskever。

这个项目已经推进了大约一年，结果Amazon MGM突然说：这片子，我们不想发了。据Deadline报道，片方在声明里说，他们认为这部电影”由另一家工作室发行会更合适”，正在和导演团队密切合作，帮电影找新东家。

Puck新闻网最先报道了Amazon MGM决定不发行这部电影的消息。截至目前，Amazon MGM和导演团队都没有进一步解释具体原因。

为什么Amazon不想发了？

这件事最耐人寻味的地方在于timing。今年2月，Amazon刚刚宣布对OpenAI投资500亿美元。也就是说，Amazon和Altman的关系正处于”蜜月期”。

在这种背景下，Amazon自己的电影部门放弃发行一部关于Altman的电影——而且这片子讲的还是他被开除又复职的”家丑”——很难不让人产生联想。

当然，也可能就是单纯的商业决策。Guadagnino的片子向来文艺气息浓厚，票房号召力有限。Amazon MGM可能看了一眼剪辑，觉得这东西跟”AI版《社交网络》”相去甚远，于是决定止损。

Altman的”好莱坞时刻”还没到

2023年11月那五天，大概是Altman人生中最戏剧性的一段。被董事会突然开除，OpenAI员工集体威胁跳槽到微软，不到一周又戏剧性地回归——这故事本身就够拍一部电影了。

问题是，这部电影现在还能不能拍下去。换一家发行商当然可以，但缺少了Amazon MGM的资源和推广渠道，这片子的存在感注定要大打折扣。

对Altman来说，这倒不见得是多大的打击。他现在正忙着跟Amazon谈500亿的合作，电影拍不拍得出来，恐怕根本不在他的top 10 concern列表里。

真正有趣的可能是接下来会发生什么——这片子如果真的上了，Altman会去看首映吗？还是像特朗普那样，发一条Truth Social说”完全不属实”？

📎 原文来源：The Verge – The film about Sam Altman has been dropped by Amazon MGM

2026年6月21日

标签： AI

5个月，估值从50亿跳到130亿

Baseten到底是做啥的

谁在领投

估值疯涨的背后

Google不好用了，那查人用啥？

怎么测的？

幻觉标出来了

反响超预期

Noam Shazeer是谁？为啥他的加入这么炸？

但是，这家伙有点争议

Dean Ball：从白宫到OpenAI政策前线

这一招，是在Anthropic被打压的时候出的

这波操作，到底图什么？

这事是怎么闹大的？

专家说不靠谱，政府这是报复？

Anthropic自己也有点”自作自受”？

塞翁失马？”被禁”反而成了最好的广告

那么，谁受益了？

用股权换人才和技术

今年第二次分拆

Snap的2026不太顺

Hey Jio，帮我订个外卖

从eSIM到客厅，AI全包了

1100亿美元的AI赌注

医疗、教育、农业，一个都没落下

Jio上市前需要新故事

⚡ headroom：AI 智能体的上下文压缩层，减少 60-95% Token 消耗

📌 项目简介

headroom —— AI 智能体的上下文压缩层

🛠️ 安装要求和过程

环境要求

快速安装

可选功能插件

🌟 核心功能

1. 三形态接入，零代码也能用

2. 智能压缩算法，60-95% Token 节省

3. 可逆压缩（CCR），不丢失任何信息

4. 输出 Token 缩减，让 AI 少说废话

5. 跨智能体共享记忆，自动学习优化

📊 压缩效果实测

🚀 典型使用场景

场景一：封装现有 AI 编程助手（30 秒上手）

场景二：作为 MCP 工具接入 AI 智能体

场景三：在 Python/TypeScript 应用中直接调用

🤖 兼容智能体列表

💡 推荐理由

为什么你应该关注 headroom？

📥 下载地址

聊天机器人：从尝鲜到日常

最常用AI来干什么？

年轻人比老年人更担心AI

63%的人说：太快了

AI设备悄悄渗透

从”假设对齐”到”假设不对齐”

把AI当成”潜在内部威胁”来防

让AI互相监督

AI越聪明，防御越要升级

这不是一家的事

卡司相当豪华，然后就被弃了

为什么Amazon不想发了？

Altman的”好莱坞时刻”还没到