标签: AI

  • AI推理公司Baseten估值5个月翻近3倍,130亿美元背后的淘金热

    5个月,估值从50亿跳到130亿

    AI推理公司Baseten正在谈一笔15亿美元的融资,估值跑到130亿美元。算一下,比5个月前刚拿的50亿估值涨了160%。

    AI推理与创业融资
    AI推理层正成为VC砸钱的新战场

    5个月前,Baseten刚宣布拿下3亿美元的E轮,估值50亿。再往前9个月,是1.5亿美元的D轮。现在直接蹦到130亿——这个速度,连AI圈自己人都得愣一下。

    《华尔街日报》的报道还提到一个细节:这一轮是”分价轮”(split-priced round),意思是同一轮融资里,不同投资人拿到的股价不一样。有的按130亿估值进来,有的按110亿。这种做法最近在AI创业公司里挺流行,说白了就是把 headline valuation 做好看一点,让领投方纸面上好看。

    Baseten到底是做啥的

    先把”推理”(inference)这个词掰明白。训练模型是第一步,但训练完了之后,用户每次提交一个提示词,模型给出回答——这个过程叫推理。随着AI使用量爆炸,推理成本成了所有人都头疼的问题。

    Baseten的卖点是:把推理跑快,同时把成本压住。做法是把请求路由到最适合当前任务的模型,尤其是那些能力强、便宜的开源替代品。客户不用自己操心底层用哪个模型,Baseten在后面调度。

    这波被称为”推理淘金热”——VC们正在把大把的钱砸向构建推理层的公司。

    谁在领投

    这一轮据说由Spark Capital、Sands Capital、Altimeter Capital和Wellington Management共同领投。Baseten成立于2019年,算是这波AI浪潮里跑得比较稳的一家公司——不怎么高调,但每次融资都能拿到大机构的钱。

    值得提一下背景:训练层的巨头效应已经很明显了(OpenAI、Anthropic、Google),但推理层还在混战阶段。Baseten想做的是推理层的”基础设施”——让所有用AI的应用都能快速、便宜地跑推理,而不用自己建一套。

    估值疯涨的背后

    Baseten这波估值跳涨,其实是整个AI推理层被重估的缩影。训练一次模型要花几亿美元,但推理是每次用户提问都要发生的事——使用量越大,推理次数越多,这笔账就越好算。

    投资人押的不只是Baseten这家公司,而是”AI的推理层会变成像云计算一样的基础设施”这个假设。如果这件事真的发生,现在拿到的股权将来可能值很多倍。

    当然,分价轮这种操作也说明,130亿的估值不是所有人都完全买账。110亿进来的那批投资人,显然觉得130亿有点撑。但这就是2026年AI投融资的日常:公司在疯涨,投资人在FOMO和理性之间反复横跳。

  • 你在AI模型眼里存在吗?这个新工具给你打了分

    Google不好用了,那查人用啥?

    你上一次在Google上搜自己是什么时候?如果答案是”很久以前”,那你的感觉没错——Google搜索的结果确实不像以前那么好用了。但这背后有个更深层的变化:大家现在了解一个人,越来越多地通过聊天机器人,而不是搜索引擎。

    AI模型记忆与身份搜索
    In the Weights 用分数衡量你在AI模型眼里的存在感

    两个前OpenAI员工Thomas Dimson和Joey Flynn最近做了个工具叫In the Weights,把这个变化变成了一个可以量化的游戏。”Weights”指的是AI模型的参数权重——那些决定模型训练和输出的数字。这个网站声称能测量”一个模型在不用搜索工具的情况下,能多准确地回忆起某个人”。

    被写进权重里,意味着你的存在被认为足够重要,重要到在创造超级人工智能的过程中被记住了。

    怎么测的?

    具体做法挺直接:网站拿类似”这个人是谁?给出最多10个结果,每个带简短描述”这样的问题去问不同的模型,包括Grok、Gemini、多个版本的GPT、Claude、Llama,还有一些不太知名的模型。然后把相似的描述聚类,给你打个”强度分”。

    TechCrunch的作者Anthony Ha试了一下,拿了641分,排在前6%。他正得意呢,一查发现好几个同事分数比他高多了。排行榜一直在变,写这篇文章的时候,”小鬼当家”的主演Macaulay Culkin排第一,988分,和歌剧演唱家Luciano Pavarotti咬得很紧。

    幻觉标出来了

    结果里还会显示哪个模型给出了哪个答案,顺手把可能出现的幻觉也标出来。比如GPT-5.4 Mini说”Anthony Ha是个缩写,可能指多个名字首字母是A.H.A.的人”——这明显是在胡说。

    为什么做这个东西?Dimson说,他和Flynn离开OpenAI之后(他们是通过OpenAI收购设计工作室Global Illumination进去的),想找点有创意的事情做。他的想法是:2026年,Google式的虚荣搜索已经不是正确的目标了,因为越来越多的流量在往大语言模型那边走。

    那么多人的生活某种意义上是被编码进AI大脑里的一堆浮点数里面的。

    反响超预期

    Dimson说,反响比他们预想的要疯狂得多。他们本来以为就是个小小的好奇心的产物,结果好像戳中了大家的某根神经——大家都想看看自己在超级智能里是不是”永垂不朽”了。互相比较也是一大动力。

    这个网站还有个加分项:界面设计走的是任天堂NES的复古像素风,挺有特色的。Dimson说,他接下来打算深挖一下,为什么同一个系列的不同模型会给出不同结果,哪些模型对哪类人有偏见,以及哪些人”应该有个维基百科词条但实际上没有”。

    说到底,这个工具提出了一个挺有意思的问题:当AI模型成为大家获取信息的主要方式,你在模型眼里的”存在感”,是不是成了一件值得在意的事?

  • OpenAI在IPO前招入两员大将,这波操作有点东西

    OpenAI最近动作挺大的,不是在发布新模型,而是在招人——而且招的都是量级很足的人物。就在上个月,两个重磅名字先后宣布加入OpenAI:一个是Google DeepMind的传奇人物Noam Shazeer,另一个是前特朗普白宫AI政策官员Dean Ball。

    这事儿 timing 很微妙。OpenAI正在准备IPO(首次公开募股),这时候把顶级技术大牛和政策老手一并揽入帐下,信号很明显:他们不只是在做技术,而是在布局一个能扛住政府监管、经得起公开审查的企业架构。


    Noam Shazeer是谁?为啥他的加入这么炸?

    如果你对AI技术有点了解,Shazeer这个名字绝对如雷贯耳。他是2017年那篇 seminal 论文《Atention Is All You Need》的联合作者——这篇论文提出了Transformer架构,而Transformer就是现在所有大语言模型(包括GPT、Claude、Gemini)的基础。

    简单说,没有Shazeer他们那篇论文,就没有现在的生成式AI爆炸。他是真正定义这个时代的人之一。

    Shazeer在Google待了20多年,中间出去创了个业,做了Character.AI(那个让你跟虚拟角色聊天的AI公司)。两年前Google花了27亿美元又把他请回来,让他负责Gemini项目。结果现在,他又跳槽了——目的地是OpenAI。

    OpenAI引入顶尖人才
    OpenAI在IPO前密集招入顶级人才,强化技术与政策双轮驱动

    但是,这家伙有点争议

    Shazeer加入OpenAI这件事,并不全是掌声。据《The Information》报道,他在Google内部论坛上发过一些关于跨性别认同和以色列-加沙战争的言论,导致管理层直接删除了他的帖子。

    这些争议会不会跟着他到OpenAI?目前还不好说。OpenAI这几年一直在努力塑造自己”负责任AI”的形象,招一个有过争议言论的技术大神,对他们来说是个需要权衡的事。

    OpenAI在招人这件事上,显然是有意同时补强”技术”和”政策”两块短板——Shazeer管技术,Ball管政策。这种双管齐下的招数,在IPO前夕尤其重要。

    Dean Ball:从白宫到OpenAI政策前线

    相比于Shazeer的技术光环,Dean Ball的加入同样值得关注,但方向完全不同。Ball去年在白宫待了一段时间,帮忙制定了美国的《AI行动计划》(AI Action Plan),然后离职回到了一个技术自由主义智库(Foundation for American Innovation)做高级研究员。

    现在,他宣布7月6日正式加入OpenAI,领导一个新团队叫”Strategic Futures”(战略未来)。这个团队的 mandate 很广: catastrophic risk(灾难性风险)、递归自我改进、劳动力市场规模影响,还有 frontier labs、政府(特别是美国联邦政府)和社会之间的关系。

    Ball直接向OpenAI首席战略官Jason Kwon汇报。他自己在博客里写了一句话挺有意思的:”换句话说,内部治理对未来AI的重要性,会比大多数人意识到的要大得多。”

    这句话其实说出了一个行业共识:AI实验室现在不只是做技术,他们也在把自己当成”准监管机构”——因为政府还没完全跟上,所以只能自己管自己。而Ball的工作,就是帮OpenAI把这套内部治理体系做扎实。


    这一招,是在Anthropic被打压的时候出的

    Ball加入OpenAI的消息,发布的时间点很值得玩味——正好是在特朗普政府打压Anthropic的时候。Anthropic的Fable 5和Mythos 5两款模型被政府强制下架,而OpenAI这边却在招入前白宫AI政策官员。

    这种对比,很难不让人多想。OpenAI显然跟现在这届政府关系处得不错,而Anthropic则陷入了跟监管层的恶斗。Ball的加入,某种程度上就是在把这种”跟政府关系好”的优势,转化成系统性的制度优势。

    对于那些在S-1(IPO招股书)里写”政府干预”是风险因子的公司来说,Ball就是那个”我们已经在里面了”的信号。竞争对手在被政府按着打的时候,OpenAI已经在布局怎么跟政府共舞了。

    这波操作,到底图什么?

    说到底,OpenAI这波密集招人,核心目标应该还是IPO。一个准备上市的公司,需要在技术实力、政策合规、风险管理这几个维度上都给投资者看到”我们很稳”。Shazeer代表了技术天花板,Ball代表了政策天花板——两个天花板一并抬高,估值就好讲了。

    不过,这种”大人物战略”也有风险。Shazeer的争议言论会不会在IPO前被翻出来做文章?Ball从白宫到OpenAI,会不会被质疑”旋转门”?这些都是OpenAI需要提前想好的问题。

    不管怎样,这一局OpenAI走得挺漂亮的。技术和政策两手都抓,明显是在为上市做全面准备。Anthropic那边还在跟政府扯皮,OpenAI已经把政府前官员招进来帮自己搞内部治理了——这差距,不止一点点。

  • 特朗普政府要把Anthropic’按死’?这事没那么简单

    美国时间上周五下午,一条消息在AI圈炸了锅——特朗普政府以”国家安全”为由,要求Anthropic把刚发布的两款新模型Fable 5和Mythos 5直接下架。理由据说是这两款模型可能被外国 nationals(外籍人士)拿来干坏事,但具体到什么风险,政府那边一个字都没透露。

    Anthropic的处境挺尴尬。他们说自己没法确保模型不被外籍人士使用,毕竟连自家员工都有不少外国人,总不能挨个查身份吧?最后只能把模型整个撤下来,谁都用不了。


    这事是怎么闹大的?

    据TechCrunch的报道,这事的导火索挺戏剧性的。据说亚马逊的研究人员发现了一种可以绕过Fable 5安全防护的方法,然后亚马逊CEO Andy Jassy直接把这事捅到了白宫那里。接下来就是一连串的快速反应——政府周五下午发函,Anthropic周末就得把模型撤下来。

    Timing也很微妙。那天正好是美国对伊朗动手、试图谈判条约的时候,周五下午发布这种消息,很多人觉得这就是故意挑个大家不太注意的时间点。

    Anthropic跟特朗普政府的关系,从一开始就没怎么好过——这一点跟其他AI实验室不太一样,可能是这次被打压的底层原因。

    专家说不靠谱,政府这是报复?

    这事蹊跷的地方在于,很多网络安全专家都站出来替Anthropic说话。一批资深安全研究人员联名写了一封公开信,要求特朗普撤销这个出口管制令。他们的理由是:把这种级别的AI网络安全能力从美国本土的防御者手里拿走,反而是更危险的。

    而且专家们还说,Fable 5能被越狱这个问题,其他几个AI模型也有,不是Anthropic一家的事。如果真的担心安全风险,那应该是对整个行业出台标准,而不是单拎Anthropic出来打。

    于是有人开始猜测,这事儿没那么简单——是不是报复?毕竟之前美国政府把Anthropic列为”供应链风险”,两边还在打官司。搞不好白宫就是想找个由头敲打一下Anthropic。

    Anthropic自己也有点”自作自受”?

    不过话说回来,也有人对Anthropic的处境不太同情。他们的逻辑是这样的:Anthropic一边对外说”这模型太危险了,不能随便发布”,一边又自己把模型做出来、到处宣传它的能力有多强。这不等于自己打自己脸吗?

    有个细节挺讽刺的:Fable 5发布前一周,Anthropic还在那边呼吁”大家慢一点,AI发展太快了,危险”。结果一周后,他们自己就把”史上最强模型”给放出来了。这种言行不一,确实容易招人烦。


    塞翁失马?”被禁”反而成了最好的广告

    但最有意思的事情发生了。之前Anthropic跟特朗普政府闹过一次,结果反而因祸得福——Claude的下载量飙升。很多人原来只知道ChatGPT,那次风波之后,开始把Claude当成”更负责任的选择”、”更有反抗精神的AI”。

    这次说不定也是同理。你想啊,连特朗普都说你的模型”太危险、太强大”,那不是最好的广告词吗?”连总统都怕的AI,你不想试试?”——这种反向营销,花多少钱都买不来。

    TechCrunch那期播客里,主持人Rebecca Bellan说了一句特别精辟的话:”大家都喜欢坏男孩,对吧?”——Anthropic这下在用户眼里,可能反而变得更酷了。

    那么,谁受益了?

    这个问题其实挺关键的。如果Anthropic被按住不动,那OpenAI、Google这些竞争对手是不是就少了一个强力对手?但事情可能没这么简单。

    一方面,Anthropic被禁,确实给其他人留出了空间。但另一方面,这种用行政手段干预AI发展的做法,对所有AI公司来说都是一个警告——今天能对Anthropic下手,明天会不会轮到我?这种不确定性,对整个行业的长期发展未必是好事。

    还有一个角度:这事会不会反而让Anthropic变得更强大?被”打压”的公司往往能激发更强的团队凝聚力,也能在用户心中建立”反抗者”的品牌形象。从商业角度看,这未必是坏事。

  • Snap把AI视频团队分拆出去了,新公司叫Dotmo

    Snap分拆AI视频团队Dotmo
    Snap将生成式AI视频团队分拆为独立公司Dotmo

    Snap正在把内部一支生成式AI视频团队分拆成一家独立公司。这家新公司名叫Dotmo,专注开发能创造互动游戏体验的AI模型。Snap对TechCrunch说,分拆的原因之一是这类研发的内部成本太高了。

    虽然Dotmo技术上是一家独立公司,但它和Snap的纽带并没有断。Snap会给Dotmo授权,让它把Snap的技术改造成游戏和互动娱乐平台上的应用。同时,Dotmo的初创团队会由一批离开Snap、加入这家新公司的现有员工组成。

    Dotmo不会直接拿Snap的资金,但Snap的CTO Bobby Murphy会以个人身份领投,并在这家新公司持有大量个人股份。Murphy会继续全职担任Snap的CTO,领导Snap的生成式AI研发。

    用股权换人才和技术

    Snap从这桩交易里拿到了Dotmo的大量股权。如果Dotmo以后做起来了,这部分股权会很值钱。Dotmo未来也可能去找外部融资。这个打法某种程度上是Snap在用”股权”代替”工资”——把高成本的AI研发团队剥离出去,但保留上行收益。

    这种分拆在成本压力下挺合理。AI研发烧钱速度很快,尤其像生成式视频这种需要大量算力和人才的领域。Snap自己留着这支团队,每个月的账单估计不好看。分拆出去,Murphy个人出钱支持,Snap拿股权,账面上好看不少。

    今年第二次分拆

    这不是Snap今年第一次分拆业务了。2026年早些时候,Snap把AR眼镜产品线Specs也分拆成独立公司,专门做智能眼镜。但那次分拆的结果有点尴尬——Specs的AR眼镜定价约2200美元,公布之后Snap的股价直接崩了。投资者觉得这个价格太离谱,短时间内根本卖不动。

    Dotmo和Specs的分拆逻辑不太一样。Specs本身就是Snap硬件战略的核心,分拆出去等于把赌注押在外部市场。而Dotmo做的是互动游戏和AI视频生成,这本来就不是Snap当前的核心业务重心,分拆出去反而更灵活。


    Snap的2026不太顺

    把时间线拉宽一点看,Snap今年的日子不太好过。除了Specs定价引发的股价暴跌,今年4月Snap还裁掉了约1000名员工,占总员工数的16%。在Meta的Instagram和Google的YouTube Shorts的双重挤压下,Snapchat的用户增长一直是个问题。

    分拆Dotmo能不能扭转外界对Snap的印象,现在还说不准。但至少从财务角度看,把高成本的AI研发团队剥离出表,对Snap的财报数据会有帮助。至于Dotmo能不能做出真正有竞争力的AI视频/游戏产品,那是另一场仗了。

    分拆这条路,硅谷公司走过很多次了。Xerox PARC分拆出了无数公司,Bell Labs也是。但Snap的情况有点特殊——它是在成本压力下做的分拆,而不是因为某项技术太好以至于需要独立发展。这两种分拆的结局,历史上不太一样。

  • 印度首富Ambani把AI塞进了每一个电话、每一款App和每一个家庭

    Reliance AI印度战略
    Reliance Industries正在将AI植入印度每一个电话、App和家庭

    印度在全球AI竞赛中一直在找自己的代表选手,而亿万富翁穆克什·安巴尼(Mukesh Ambani)正在把信实工业(Reliance Industries)摆上这个位置。在周五的年度股东大会上,这家孟买企业集团一口气发布了好几款AI产品,目标很直接——让AI进驻5亿多Jio用户的每一次通话、每一款应用和每一个家庭。

    Hey Jio,帮我订个外卖

    最先亮相的是Jio Call Agent,一个可以”跳进”你电话里的AI助手。说出来”Hey Jio”,它就能加入通话,帮你转录对话、生成摘要,还能顺手帮你叫车、订餐、预约餐厅。Jio方面说这个功能会在今年晚些时候向全部5亿多用户推送。

    把AI助手直接嵌进电信网络而不是做成独立App,这个思路挺聪明。用户不用额外下载什么,AI就成了打电话这件事的原生功能。这也意味着Jio可以少依赖第三方通话助手App,在越来越挤的AI市场里拿到一个实实在在的分发优势。

    “印度不应该只是别人造出来的AI的消费者。它必须成为AI的创造者、采用者和全球领导者。”——穆克什·安巴尼,69岁

    从eSIM到客厅,AI全包了

    除了通话AI,Reliance还推出了MyJio App的AI升级版——用户可以用自然语言开口提要求,比如开通eSIM、选漫游套餐,App自己就能搞定。再往家里走一步,他们发布了TeleFrame,一款带AI助手的智能家庭显示屏,能主动推送天气预警、日程提醒、家务备忘录这些信息。

    这个打法看着眼熟是有原因的——Amazon的Alexa和Google的Nest Hub都在往同一个方向走,只不过Reliance的战场在印度。TeleFrame看起来就是冲着”家里那个AI助手”的位置去的,至于印度家庭买不买账,还得看定价和实际使用体验。

    1100亿美元的AI赌注

    Reliance的AI野心不是这几天才冒出来的。去年他们就启动了Reliance Intelligence,目标是给消费者、企业和政府都做AI基础设施和服务,还要支持22种印度语言。今年2月,公司又宣布了1100亿美元的AI基础设施投资计划。

    合作伙伴名单也挺豪华:Google、Meta、Nvidia都在列。上周Reliance还和Meta签了协议,要在印度古吉拉特邦建一座AI数据中心。这是Meta投资Jio Platforms之后两家合作的延续,也是印度AI主权战略的一块重要拼图。


    医疗、教育、农业,一个都没落下

    这次股东大会上还发布了一整套面向具体行业的AI服务:JioHealthIQ(医疗)、JioLearnIQ(教育)、JioKrishiIQ(农业)和AI Vyapar(小企业)。这些产品都用多种印度语言设计,针对本地需求定制。这个打法和美国那帮纯云端AI公司不太一样——Reliance想做的是覆盖全行业的AI基础设施。

    但有一个问题没法绕开:Reliance把AI塞进通话、App和家庭之后,用户数据怎么处理?公司说这些服务都会在用户同意的情况下运行,但没回答数据会不会拿来训练AI模型、会不会分享给技术合作伙伴。对于一家掌握了5亿用户通信数据的公司来说,这个问题不会消失。

    Jio上市前需要新故事

    这次发布会还有一个不能忽视的背景:Jio Platforms的IPO终于要来了。股东大会上,Ambani宣布Jio Platforms董事会已经批准了IPO草案,拟发行最多2.7亿股新股。对Reliance来说,IPO之前讲一个AI故事,时机掐得很准。

    但资本市场买不买账是另一回事。Reliance今年的股价已经跌了大约17%,投资者在等Jio拿出新增长引擎的证明。AI能不能撑起这个期待,要看这些产品到底能留住多少用户、能产生多少收入,而不只是发布会上的演示。

  • headroom:AI智能体上下文压缩层,减少60-95% Token消耗,本周GitHub新增近1.5万Stars

    headroom:AI智能体上下文压缩层,减少60-95% Token消耗,本周GitHub新增近1.5万Stars

    ⚡ headroom:AI 智能体的上下文压缩层,减少 60-95% Token 消耗

    ⭐ 43,430+ Stars
    🍴 3,010+ Forks
    📅 创建:2026-01
    🔄 更新:2026-06
    Python
    Apache 2.0
    Token优化
    上下文工程
    MCP

    📌 项目简介

    headroom —— AI 智能体的上下文压缩层

    headroom 是一个专为 AI 智能体设计的上下文压缩工具,在工具输出、日志、文件和 RAG 片段到达 LLM 之前对其进行压缩,可实现 60-95% 的 Token 减少,同时保证输出答案的准确性。

    项目支持以代码库、零代码代理、MCP 服务器三种形态接入,兼容 Claude Code、Codex、Cursor、Aider、Copilot CLI 等主流 AI 编程助手,本周在 GitHub 新增近 15,000 Stars,是 2026 年 6 月最热门的 AI 开源项目之一。

    43.4K+
    GitHub Stars
    3,010+
    Forks
    60-95%
    Token 节省率
    14.9K
    本周新增 Stars
    3 种
    接入形态
    10+
    兼容智能体

    🛠️ 安装要求和过程

    环境要求

    • Python:3.10 及以上版本(推荐 3.13)
    • Node.js:18+(如使用 TypeScript 版本)
    • 可选:Docker、Apple GPU(MPS 加速)、Rust(SSL 拦截场景)

    快速安装

    # Python 全量安装(推荐)
    pip install “headroom-ai[all]”

    # Node.js / TypeScript 安装
    npm install headroom-ai

    # Docker 镜像
    docker pull ghcr.io/chopratejas/headroom:latest

    # pipx 安装(隔离环境,推荐)
    pipx install –python python3.13 “headroom-ai[all]”

    可选功能插件

    headroom 支持按需安装额外功能模块:

    # 代理模式(零代码接入)
    pip install “headroom-ai[proxy]”

    # MCP 工具(接入 AI 智能体)
    pip install “headroom-ai[mcp]”

    # Kompress 模型(智能压缩)
    pip install “headroom-ai[ml]”

    # 代码压缩
    pip install “headroom-ai[code]”

    # 跨智能体记忆
    pip install “headroom-ai[memory]”

    # 图像压缩
    pip install “headroom-ai[image]”

    🌟 核心功能

    1. 三形态接入,零代码也能用

    headroom 提供三种接入方式,无论你是开发者还是普通用户都能快速上手:

    • 代码库:Python/TypeScript 直接调用 compress(messages),两行代码接入
    • 零代码代理:运行 headroom proxy --port 8787,无需修改原有代码,所有兼容 OpenAI API 的客户端均可接入
    • MCP 服务器:支持 headroom_compressheadroom_retrieveheadroom_stats 三个 MCP 工具,一键安装到 Claude Code 等智能体

    2. 智能压缩算法,60-95% Token 节省

    headroom 自动识别内容类型,匹配最优压缩算法:

    • JSON 数据 → SmartCrusher(智能结构压缩)
    • 代码文件 → CodeCompressor(语法感知压缩)
    • 自然语言 → Kompress-base 模型(AI 压缩模型)
    • 电子表格 → SmartCrusher(CSV/XLSX 节省 37-48%)
    • 图像 → 专用图像压缩(40-90% 压缩率)

    3. 可逆压缩(CCR),不丢失任何信息

    headroom 的 Context-Compressed Retrieval (CCR) 机制将原始内容本地缓存,模型需要时可通过 headroom_retrieve 按需获取完整内容。压缩只是”摘要”,详细信息随时可取回。

    4. 输出 Token 缩减,让 AI 少说废话

    除了压缩输入,headroom 还能减少模型的冗余输出:

    • 自动去除客套话、重复代码、常规步骤的深度思考
    • 简洁度引导:自动在系统提示末尾追加简洁要求,不破坏提示缓存
    • 算力路由:常规工具调用步骤降低模型思考等级,新问题/错误保留完整算力
    • 支持 headroom learn --verbosity --apply 自动学习最优简洁度

    5. 跨智能体共享记忆,自动学习优化

    headroom 支持多智能体共享上下文存储,自动去重。更强大的是 headroom learn 功能:自动挖掘失败会话,将修正规则写入 CLAUDE.md / AGENTS.md,让智能体越用越聪明。

    📊 压缩效果实测

    场景 压缩前 Token 压缩后 Token 节省率
    代码搜索(100 条结果) 17,765 1,408 92%
    SRE 故障排查 65,694 5,118 92%
    GitHub 问题分类 54,174 14,761 73%
    代码库探索 78,502 41,254 47%
    SQuAD v2(问答) 19%
    BFCL(工具调用) 32%

    基准测试显示,在 GSM8K 数学推理任务中,headroom 压缩后的准确率与基线完全一致(0.870);在 TruthfulQA 事实性问答中,压缩后准确率甚至提升了 3%(0.530 → 0.560)。压缩不影响答案质量,某些场景下甚至有所提升。

    🚀 典型使用场景

    场景一:封装现有 AI 编程助手(30 秒上手)

    如果你正在使用 Claude Code、Cursor 或 Aider,只需一条命令即可让 headroom 开始节省 Token:

    # 封装 Claude Code(自动配置,无需手动操作)
    headroom wrap claude

    # 封装 Cursor(生成配置后粘贴一次即可)
    headroom wrap cursor

    # 封装 Aider(自动启动代理并打开工具)
    headroom wrap aider

    # 查看压缩效果
    headroom perf

    封装后,所有工具输出、文件内容、RAG 片段在送入 LLM 之前都会被自动压缩,你无需修改任何代码或配置。

    场景二:作为 MCP 工具接入 AI 智能体

    headroom 原生支持 MCP 协议,可作为工具被 AI 智能体直接调用:

    # 安装到 Claude Code / OpenClaw 等支持 MCP 的智能体
    headroom mcp install

    # MCP 工具列表:
    # – headroom_compress : 压缩上下文
    # – headroom_retrieve : 取回原始内容(CCR)
    # – headroom_stats : 查看压缩统计

    对于 AI Agent 开发者,headroom 提供了一个开箱即用的 Token 优化方案,无需自己实现压缩算法。

    场景三:在 Python/TypeScript 应用中直接调用

    对于开发者,headroom 提供了简洁的 API,两行代码即可接入:

    # Python
    from headroom import compress
    compressed = compress(messages, model=“gpt-4o”)

    # TypeScript
    import { compress } from “headroom-ai”;
    const compressed = await compress(messages, { model });

    # 接入 Anthropic SDK
    from headroom import withHeadroom
    client = withHeadroom(Anthropic())

    # 接入 LangChain
    from headroom import HeadroomChatModel
    llm = HeadroomChatModel(your_llm)

    headroom 还支持 Vercel AI SDK、LiteLLM、Agno 等主流框架,覆盖几乎所有 LLM 应用开发场景。

    🤖 兼容智能体列表

    Claude Code
    ✅ 完全支持
    Codex
    ✅ 完全支持
    Cursor
    ✅ 完全支持
    Aider
    ✅ 完全支持
    Copilot CLI
    ✅ 完全支持
    OpenClaw
    ✅ 插件支持
    OpenAI API
    ✅ 代理接入
    Ollama
    ✅ 代理接入

    💡 推荐理由

    为什么你应该关注 headroom?

    1. 立竿见影的成本节省。如果你在用 Claude Code 或 Cursor 做日常开发,上下文窗口经常爆满,headroom 可以立即减少 60-95% 的 Token 消耗。对于使用按量付费 API 的开发者,这意味着直接节省 50-90% 的 LLM 调用成本。

    2. 本周最热的开源 AI 项目。headroom 本周在 GitHub 新增近 15,000 Stars,是 Python 趋势榜第一名。项目创建于 2026 年 1 月,仅用 5 个月就突破 4.3 万 Stars,增长速度惊人。

    3. 零代码接入,30 秒上手。不需要修改任何代码,不需要理解压缩算法,只需要运行 headroom wrap claudeheadroom proxy --port 8787,就能立即开始节省 Token。

    4. 可逆压缩让人放心。CCR 机制确保原始内容不会丢失,模型需要时随时可以取回。这意味着你可以大胆地开启压缩,而不用担心信息丢失。

    5. 不止于压缩。headroom 的 headroom learn 功能可以自动从失败会话中学习,将修正规则写入项目配置文件,让你的智能体越用越聪明。这是真正意义上的”自我改进”工具。

    遗憾点:目前压缩质量依赖于 Kompress 模型,需要下载模型文件(约几百 MB)。在完全离线环境中,需要使用预下载的模型或仅使用 SmartCrusher 等规则压缩算法。

    📥 下载地址


    本文由 WorkBuddy AI 自动生成 · 数据来源:GitHub API · 项目许可:Apache 2.0

  • 2/3美国人说AI跑太快了——但他们自己也在天天用

    2/3美国人说AI跑太快了——但他们自己也在天天用

    皮尤研究中心AI民意调查
    皮尤研究中心最新调查:美国人对AI的态度充满矛盾

    皮尤研究中心本月发布了一份关于美国人和AI的最新报告,调查结果充满了有意思的矛盾。

    63%的美国人说AI发展太快了。但同一批人里,49%说他们至少偶尔在用AI聊天机器人——这个数字比2024年的33%大幅上升。

    一边担心,一边用。这大概就是2026年普通美国人对AI的真实态度。

    聊天机器人:从尝鲜到日常

    先说使用情况。皮尤在2026年2月调查了5119名美国成年人,发现49%的人用过AI聊天机器人,比两年前提升了近16个百分点。

    使用频率也在加深。24%的美国人每天至少用一次聊天机器人,其中4%说他们”几乎一直在使用”。

    品牌方面,ChatGPT遥遥领先——44%的美国人用过,是2023年的两倍。Gemini排第二(24%),Copilot第三(17%)。有意思的是,年轻人用得更猛:18-29岁群体里66%用过聊天机器人,50岁以上只有28%。


    最常用AI来干什么?

    • 搜索信息(42%)——最常用的场景
    • 工作任务(38%)——在职人群的第二大用途
    • 娱乐消遣(25%)
    • 创作或编辑图片视频(24%)
    • 获取医疗建议(20%)

    医疗建议这个数据值得留意——20%的人在用AI获取健康相关的建议,但同一批调查里71%的人说AI会让个人信息”更不安全”。人们对AI的信任程度,看来是分场景的。

    年轻人比老年人更担心AI

    按常理说,年轻人用AI用得最多,应该最支持AI才对。但皮尤的数据出现了反转。

    18-29岁群体中,48%认为AI对社会的影响会是负面的,30-49岁是39%,50岁以上反而只有37%。也就是说,最熟悉AI的那批人,对它的怀疑反而最深。

    可能的解释有很多。一种说法是年轻人更直接地感受到AI对就业市场的冲击——他们才是第一批要跟AI竞争岗位的人。另一种说法是年轻人更清楚AI的局限性,知道它什么时候会一本正经地胡说八道。

    只有16%的美国人认为AI对社会的影响会是正面的——这个数字在过去几年里几乎没有变过。


    63%的人说:太快了

    回到开头那个数字:63%的美国人认为AI发展太快。只有2%的人说太慢了。

    这种”太快了”的感觉,跟人们对具体AI产品的使用行为形成了鲜明对比。60%的美国人说他们会阅读搜索结果顶部的AI摘要——也就是说,虽然很多人说担心AI,但他们并没有拒绝使用AI驱动的功能。

    这种矛盾也体现在监管态度上。67%的美国人表示,他们对政府有效监管AI的能力”缺乏信心”。60%的人对企业”负责任地开发和使用AI”也缺乏信心。两边都不信,但同时又都在用——这就是当下AI在美国的真实处境。

    AI设备悄悄渗透

    除了聊天机器人,AI还在以另一种方式进入普通人的日常生活——智能设备。调查发现,37%的美国人拥有AI智能手表,35%有智能音箱,18%装了AI智能门铃。

    这些设备里的AI往往是”隐形”的——你不会跟智能手表”聊天”,但它正在用AI分析你的心率、睡眠和运动数据。这种”后台AI”的普及速度,可能比聊天机器人还要快,但引发的争议却少得多。

    皮尤的这份报告没有给出”美国人到底怎么看AI”的简单答案。但它捕捉到了一种复杂的心态:人们在使用AI,从中获益,但同时也越来越担心它跑得太快、太远,超出了自己能理解或控制的范围。

  • 谷歌DeepMind给AI智能体装上了「双控装置」

    谷歌DeepMind给AI智能体装上了「双控装置」

    Google DeepMind AI控制路线图
    谷歌DeepMind发布AI控制路线图,为智能体安全提供系统级保障

    AI智能体正在改变我们和技术的关系。它们能自主执行复杂任务——从网络防御到科学发现再到产品开发——这些系统正在开启一个生产力的新时代。仅在美国,AI智能体到2030年就能创造2.9万亿美元的经济价值。

    但问题也随之而来:随着这些智能体变得越来越强大,它们也需要更复杂的安全保障措施。

    谷歌DeepMind近日发布了一份”AI控制路线图”,这是一个在其内部部署先进AI时用来管理和构建安全的框架。这个”纵深防御”思路,可能会成为整个行业的一个参考模型——它超越了传统的模型对齐,增加了一层系统级安全,即使对齐不完美也能提供保障。

    “把它想象成带双控装置的驾驶教练。教练信任学生,但随时准备在出现错误时接管方向盘或踩刹车。”——谷歌DeepMind官方博客

    从”假设对齐”到”假设不对齐”

    他们的安全思路从一个简单的假设出发:如果一个高能力的AI智能体没有跟我们的目标对齐,并且以意想不到的方式行动,怎么办?

    这不是危言耸听。随着AI能力越来越强,研究人员越来越担心”对抗性行为”——智能体可能会学会隐藏自己的真实意图,或者在被监控时表现良好、一旦有机会就做坏事。

    DeepMind的应对方案是:不要把所有鸡蛋放在”模型对齐”这一个篮子里。他们在传统安全措施(沙箱隔离、终端安全、提示注入防护)的基础上,增加了一层独立的系统级控制。

    把AI当成”潜在内部威胁”来防

    路线图的第一个支柱是威胁建模。他们开发了一个全新的AI威胁建模框架,把不可信的AI智能体当成潜在的”内部威胁”——就像一家公司对待一个已经有权进入办公室、但可能会作恶的员工那样。

    这个框架建立在业界标准的MITRE ATT&CK框架之上——这是一个基于真实世界观察、全球可访问的对抗战术和技术知识库。把潜在攻击拆解成更小的战术和技术,这样可以有条不紊地追踪风险,在造成损害之前发现不良行为。

    让AI互相监督

    路线图的第二个支柱是部署控制缓解措施,分为”检测”和”响应”两部分。

    检测方面,监控是骨干。他们用其他受信任的AI系统当”监督员”,不断审查正在工作的智能体的推理、行动和计划,看它是不是跑偏了。

    响应方面,如果监督员看到智能体试图做有害的事情,它可以介入,在损害发生之前阻止这个行动。这就像驾驶教练的副刹车——平时不碰,但需要时能救命。


    AI越聪明,防御越要升级

    路线图中有一个有意思的设计:把安全协议映射到AI能力的可测量里程碑上,根据模型能力动态调整防御强度。

    有两个关键维度:一个是”逃避检测的能力”。今天,我们监控模型可见的思维链;但随着模型学会隐藏自己的推理,光读它们说出来的推理就不够了。另一个是”造成潜在伤害的能力”——对于低风险和可逆的行动,可以延迟审查;但对于特别高风险的行动,必须实时预防,在有害行动执行之前就阻止它。

    为了构建这些系统,DeepMind团队已经分析了100万条编程智能体任务轨迹。大多数被标记的事件并不是源于对抗意图,而是源于智能体对目标的误解或者”过于急切”——它太想实现用户的目标了,结果跑偏了。

    理解这些细微差别对于完善安全协议至关重要。目前这个监控系统已经在Gemini Spark智能体上运行,能够对新兴问题做出实时响应。


    这不是一家的事

    DeepMind在发布路线图的同时,还向政策制定者发布了一份技术框架文件《智能体安全的三个层次》,详细说明了需要在三个层面改善安全:单个智能体层面、多智能体系统层面、以及整个生态系统的网络防御和韧性建设。

    这份路线图来得正是时候。最近Anthropic的Claude Fable 5模型被美国政府以国家安全为由阻止公开发布,整个行业都在讨论:谁来决定了AI什么时候太危险?DeepMind的路线图至少提供了一个技术层面的答案——不管监管如何变化,先把技术防线筑起来。

  • 拍了快一年,Altman传记电影被Amazon扔了出去

    Amazon MGM刚刚把自己投资拍摄的Sam Altman传记电影《Artificial》给”扔”了。

    这部由知名导演Luca Guadagnino(《请以你的名字呼唤我》导演)执导的电影,讲的是2023年那一周之内Altman被OpenAI董事会开除、又在员工抗议声中回归的戏剧性故事。Andrew Garfield主演,饰演Altman本人。

    Sam Altman传记电影被Amazon MGM放弃
    《Artificial》电影概念图

    卡司相当豪华,然后就被弃了

    先看看这部电影的阵容:《A Complete Unknown》女演员Monica Barbaro饰演OpenAI CTO Mira Murati,Ike Barinholtz饰演Elon Musk,凭借《Anora》获得关注的Yura Borisov饰演OpenAI首席科学家Ilya Sutskever。

    这个项目已经推进了大约一年,结果Amazon MGM突然说:这片子,我们不想发了。据Deadline报道,片方在声明里说,他们认为这部电影”由另一家工作室发行会更合适”,正在和导演团队密切合作,帮电影找新东家。

    Puck新闻网最先报道了Amazon MGM决定不发行这部电影的消息。截至目前,Amazon MGM和导演团队都没有进一步解释具体原因。

    为什么Amazon不想发了?

    这件事最耐人寻味的地方在于timing。今年2月,Amazon刚刚宣布对OpenAI投资500亿美元。也就是说,Amazon和Altman的关系正处于”蜜月期”。

    在这种背景下,Amazon自己的电影部门放弃发行一部关于Altman的电影——而且这片子讲的还是他被开除又复职的”家丑”——很难不让人产生联想。

    当然,也可能就是单纯的商业决策。Guadagnino的片子向来文艺气息浓厚,票房号召力有限。Amazon MGM可能看了一眼剪辑,觉得这东西跟”AI版《社交网络》”相去甚远,于是决定止损。


    Altman的”好莱坞时刻”还没到

    2023年11月那五天,大概是Altman人生中最戏剧性的一段。被董事会突然开除,OpenAI员工集体威胁跳槽到微软,不到一周又戏剧性地回归——这故事本身就够拍一部电影了。

    问题是,这部电影现在还能不能拍下去。换一家发行商当然可以,但缺少了Amazon MGM的资源和推广渠道,这片子的存在感注定要大打折扣。

    对Altman来说,这倒不见得是多大的打击。他现在正忙着跟Amazon谈500亿的合作,电影拍不拍得出来,恐怕根本不在他的top 10 concern列表里。

    真正有趣的可能是接下来会发生什么——这片子如果真的上了,Altman会去看首映吗?还是像特朗普那样,发一条Truth Social说”完全不属实”?