标签: AI

  • AI抢走了内存,苹果用户买单:MacBook Pro涨价300美元背后的供应链真相

    蒂姆·库克最近说了两句大实话。第一句:涨价”不可避免”。第二句:现在的定价模式”不可持续”。说出这话的时候,苹果刚刚把16英寸MacBook Pro的价格提高了300美元,11英寸iPad Air从599美元涨到749美元,连HomePod Mini也加了30美元,变成129美元。

    库克把原因直指AI行业。这话不假,但把锅全甩给AI也有点鸡贼——毕竟苹果自己也在大举投资AI。不过从供应链的角度看,他说的是事实。

    RAMageddon来了

    卡内基梅隆大学泰珀商学院的营销与战略副教授蒂姆·德登格(Tim Derdenger)说得很直白:这是”基础经济学”。科技行业争相打赢AI战争,”RAM的价格飙升,因为内存制造商把生产线重新分配,转去生产AI数据中心需要的新款HBM内存,消费级DDR5的生产被砍掉了。”

    组件成本上涨,企业就会把成本转嫁给消费者。这本来是教科书级别的因果关系,但这次的不同之处在于:这不是一次性的供应链波动,而是结构性变化。

    纽约大学斯特恩商学院的教授斯里坎特·贾加巴特拉(Srikanth Jagabathula)说得更直接:”同一块芯片,放在AI服务器里赚的钱远比放在消费设备里多得多。”所以制造商毫不犹豫地选择了数据中心客户,把普通买家排在了后面。

    AI导致消费电子产品涨价
    内存短缺推高消费电子产品价格,AI数据中心是幕后推手

    不只是苹果

    苹果不是第一个涨价的,也不会是最后一个。Xbox的价格已经涨了将近25%(取决于型号),PC和游戏主机早就感受到了”RAMageddon”的冲击。甚至Nothing都取消了一整款手机的发布——原因就是组件成本太高。

    真正值得玩味的是权力反转。过去几十年,消费电子市场是内存厂商最大的客户,订单量大、稳定、可预期。现在,AI数据中心扔出来的订单又大又急,而且出价更高。内存厂商当然用脚投票。


    70亿人补贴AI竞赛

    这里有个让人不太舒服的问题:消费者在为AI竞赛买单,但AI竞赛的成果,消费者并不总是能享受到。你花更多钱买了一台MacBook Pro,但涨价的原因是HBM内存短缺——而HBM是你这台电脑根本用不上的东西。

    换句话说,普通消费者正在通过更高的设备价格,间接补贴科技巨头的AI军备竞赛。而这场竞赛的回报——更强大的AI模型、更智能的Agent——初期主要服务于企业客户和开发者,不是普通消费者。

    连Sam Altman都承认,现在AI领域有泡沫。OpenAI、谷歌、微软砸进去的钱是前所未有的规模,它们用这些钱把内存和存储的价格抬到了苹果都觉得”不可持续”的程度。泡沫什么时候破,没人知道。但消费者买到手的设备越来越贵,这件事在泡沫破之前只会愈演愈烈。

  • Anthropic的Mythos 5回来了,但只向网络防御者开放——Fable 5还在等

    6月26日,美国商务部部长霍华德·卢特尼克(Howard Lutnick)给Anthropic联合创始人汤姆·布朗(Tom Brown)发了一封信。这封信的日期是6月26日,内容是关于Mythos 5模型的解禁——但只是部分解禁。

    两周过山车

    过去两周,Anthropic一直在和特朗普政府谈判。过程像过山车一样,走走停停,最后勉强谈出了一个折中方案。根据The Verge拿到的政府信件内容,商务部同意”修订许可要求”,理由是Anthropic”近期与美国政府合作,解决了与Mythos 5和Fable 5相关的风险”。

    但这个结果只能说勉强及格。Mythos 5——Anthropic最强的网络安全模型——被允许重新部署给”一小群网络防御者和基础设施提供商”。至于面向公众的Fable 5系列,目前仍处于悬而未决的状态,没有任何上线时间表。

    Anthropic发言人丹妮尔·吉列里(Danielle Ghiglieri)对The Verge表示:”我们已收到美国政府通知,Mythos 5——我们最强的网络安全模型——可以重新部署给一小群网络防御者和基础设施提供商。我们正在努力为获批的提供商群体恢复Mythos 5的访问权限,并继续与政府合作,扩大Mythos 5的访问范围,让Fable 5再次面向大众开放。”

    Anthropic Mythos 5 部分解禁
    Mythos 5经历两周谈判后终于部分恢复访问

    出口管制并没有解除

    需要明确的是,美国政府并没有撤销两周前对Anthropic下达的出口管制令。那道命令禁止任何外国国民访问Mythos 5或Fable 5(包括Anthropic自己的员工)。这次的”修订”本质上是为Mythos 5开了一个口子——允许特定类型的组织访问,方式和之前OpenAI的GPT-5.6被”逐客户审批”如出一辙。

    也就是说,出口管制的大框架还在,只是Mythos 5拿到了一个例外。Fable 5呢?没有任何消息。普通用户想用上Fable 5,恐怕还得等上一段时间。


    中美AI监管的不同路径

    这件事更大的背景是:美国和中国的AI监管路径正在出现明显分化。美国这边,政府直接介入模型发布审批——哪家公司能发什么模型、能卖给谁,商务部说了算。中国那边,监管更多集中在内容安全、数据合规和算法备案上,对模型发布本身没有直接审批机制。

    Anthropic这次的谈判由汤姆·布朗亲自牵头,说明公司高层对这件事的重视程度。毕竟,Mythos 5是Anthropic当前最强的模型,被卡住出口对任何AI公司来说都是重大打击。部分解禁至少让Anthropic能继续服务一部分核心客户,但距离”正常状态”还差得很远。

  • 美国要把芯片战打到ASML门口,欧洲不干了

    美国要把芯片战打到ASML门口,欧洲不干了

    欧洲反击美国芯片战概念图
    ASML的光刻机是这场博弈的核心

    荷兰贸易大臣 Sjoerd Sjoerdsma 本周出现在华盛顿,会见美国商务部长 Howard Lutnick 和国会议员。他的目的很直接:反对《MATCH 法案》。

    这份今年 4 月提出的法案,要是生效,会禁止中国芯片制造商使用西方半导体设备。打到哪里呢——直接打到 ASML 的大门口。

    全欧洲最有价值的公司,卡在中间

    ASML 坐在本国荷兰,却是整个欧洲市值最高的公司,也是全世界唯一能制造尖端光刻机的企业。那种用来做最先进 AI 芯片的光刻机,别无分号。

    中国目前占 ASML 系统销售净额的 19%。这个比例不小。MATCH 法案比现有的管制还要往前走一步——不光继续禁售最先进的极紫外(EUV)设备给中国,还要把深紫外浸没式(DUV)设备也列入禁区。

    “我这次来这里向国会全面说明我们的关切,这种情况很不寻常。对荷兰来说,赌注可能非常高。”

    Sjoerdsma 在会谈结束后对彭博社说了这番话。

    中国现在能买到的,已经是十年前的机器

    ASML 首席执行官 Christophe Fouquet 今年 5 月对 TechCrunch 说过一句话:中国目前能买到的,是上一代的深紫外设备——大概十年前就出货的那种。MATCH 法案现在想把这些也划成禁区。

    换句话说,美国想做的,是把围堵中国芯片能力的网收紧到极限——连十年前的老设备都不让卖。

    欧洲这边不干,原因很朴素:ASML 的生意要紧。19% 的销售额不是小数目,把这块市场硬切掉,损失的不是别人,是欧洲自己。

    法案还没过关,但信号已经发出去了

    MATCH 法案目前还没有经过众议院或参议院的全院投票。彭博社的报道指出,它可能需要被塞进一个更大的法案包裹里,才有机会通过。

    但荷兰贸易大臣亲自飞到华盛顿去游说,本身就是一个信号:欧洲不打算 silently 跟进美国的每一步棋。

    这件事更大的背景是:美国近年来一直在推动盟友共同参与对中国芯片行业的封锁,从日本到荷兰,多管齐下。但盟友有自己的算盘——日本的东京电子、荷兰的 ASML,都是各自国家半导体产业链里的皇冠明珠,丢掉中国市场的代价,华盛顿可能不会帮它们承担。


    这场博弈还没有定论。MATCH 法案的前途、ASML 在中国的生意能否保住、欧洲和美国在芯片战上的裂缝会不会继续扩大——接下来几个月会有更多动作。

  • 一个健身狂创业者突然查出淋巴瘤,他把Claude当第二诊疗意见用

    一个健身狂创业者突然查出淋巴瘤,他把Claude当第二诊疗意见用

    AI辅助癌症治疗概念图
    AI正在成为患者自我管理的工具之一

    Conno Christou 是个对自己身体很较真的人。35岁,正在做第二家公司,睡眠用 Whoop 手环追踪,还交叉比对 Oura 戒指的数据,每年花大价钱做将近 100 项生物标志物检测。他跟着 Peter Attia、Rhonda Patrick 这些长寿研究者的方案走,补剂、昼夜节律、蛋白质摄入量,样样都要优化。

    2025 年的体检报告,每一项都是绿灯。”那是我几年来最好的一次”,他说。

    然后,一次健身之后,他的手臂肿了。

    起初没当回事。拖了一个星期才去看医生,查出来静脉里有两个血栓,安排了手术。但术前检查把一切全改变了——医生走回房间,告诉他手术做不了。

    “我们在你的胸骨后面发现了一个 11×11×8 厘米的肿块。”

    活检结果证实了一个他从未想过的诊断:侵袭性非霍奇金淋巴瘤,一种罕见的恶性肿瘤,发病率大约是 42 万分之一,由随机基因突变引起,跟生活方式、饮食、压力都没有关系。

    肿瘤只存在了大约三个月。再过三个星期,就会发展到第四期。

    两个世界级的医生,给出了完全相反的建议

    Christou 的第一个肿瘤科医生是一位知名专家,推荐的方案是两种可用化疗方案中较温和的那个。Christou 约了三天后做第一次输液。

    然后,在输液前一天晚上,他去找了第二个医生要第二诊疗意见。

    那个医生没有犹豫。他推荐了更激进的方案——住院连续输液,每三周一周期,持续六个月。依据是 Christou 的具体病理类型。较温和的方案对他的病例成功率大约 60%,激进方案能把这个数字推到 85% 左右。

    两个世界级专家,截然相反的建议。

    “作为创始人,我们握着方向盘”,Christou 这样形容很多人盲目接受医生建议的习惯——而他选择不这么做。”你会听到很多说法,但不一定非要照着第一个建议走。”

    但他也没有直接照着第二个建议做。接下来两天,他一共问了 12 个医生的意见——动用职业人脉,联系美国和海外的血液肿瘤专家,能用的关系全用上了。11 比 1,投票结果支持激进方案。他选了那个方案。

    这个决定在他口中不是勇敢,而是逻辑。”当赌注是生存的时候,你要收集数据。”

    他把化疗当成开店在跑

    六个月的疗程,Christou 用经营公司的方式对待化疗:一场由若干短跑组成的马拉松,每一个周期都是有限的,每一周都填满数据点。他 18 岁时在塞浦路斯做过 25 个月的强制兵役,那段经验也用上了。他告诉自己要当一个好士兵,相信流程,六个周期,扛过去。

    整个期间他一直戴着 Whoop,发现它预测免疫力低谷日的准确度惊人,有时候症状还没出现就提前报警了。他用语音转文字记症状日记,每一次体温变化、每一个副作用、每一剂药和对应的对抗药物,全记下来。

    他把注意力收缩到三个变量:睡眠、营养,以及——排在第一位的——心理状态。”它的作用比什么都大”,Christou 说,”我从来没有问过’为什么是我’——一次都没有。那个问题没有有用的答案。”

    Claude 读片

    他把所有东西——验血结果、扫描数据、可穿戴设备输出、日记条目——全部喂给了 Claude。

    他远不是唯一一个转向聊天机器人寻求医疗指导的人。凯撒家庭基金会今年 3 月发布的民意调查显示,三分之一的美国成年人已经在用 AI 获取健康信息和建议。网上积累的故事显示,对某些病人来说,AI 正在交付现有医疗系统交付不了的东西。

    专家们当然会提醒谨慎。麻省总医院布里格姆医疗系统的数据科学与 AI 临床负责人 Danielle Bitterman 近几个月告诉《纽约时报》,通用聊天机器人经常出错,针对个性化诊断”还没有经过充分评估”。Christou 不反对这个说法。

    “它没有替代医生”,他说,”但它帮我问对了问题。”

    对于一个像他这样罕见的病症——一个肿瘤科医生可能一年才见到一次——能够访问一个吸收了全部医学文献的模型,他说,这和谷歌搜索完全不是一回事。

    这个区别在治疗结束时变得至关重要。他最后一次 PET 扫描——用来检测活跃病灶的影像学手段——结果模棱两可。他的肿瘤科医生开始讨论第二轮治疗方案,可能涉及放疗,位置靠近心脏和肺部。这是一个令人心惊的发展。

    Christou 再次做了功课。他读到,对于他这种具体的淋巴瘤,治疗结束时的 PET 扫描假阳性率大约是 60%——这个统计数字至今让他感到震惊。”现在是 2026 年”,他说,”百分之六十。”

    他把全部三次 PET 扫描和 MRI 影像喂给 Claude,模型标记出了一个已知但容易被忽略的现象:40 岁以下的患者在化疗后康复期间,胸腺可能会重新激活,在影像上看起来像活跃病灶。考虑到他的年龄和具体扫描特征,模型判断这种现象的概率大约是 90%。

    他又找了三个医生咨询。第四个医生确认了:胸腺反弹。没有活跃病灶。不需要放疗。他干净了。

    “不是十年后,是今天”

    Christou 还在消化过去一年对他意味着什么——对他的健康,对他工作的方式,对他看待时间的方式。这场变故发生前,他已经在做 Keragon,一家用 AI 帮助医疗机构自动化行政操作的平台。

    但作为病人走了一遍医疗系统,给了他新的视角。他看到护士和医生被跟护理毫无关系的任务埋没。他接受的化疗方案和一位 80 岁老太太一模一样,副作用通过一连串追加药物来管理,每一种都会引发自己的问题。他说,未来的人回头看这个时代的治疗方式,会感到尴尬。

    他现在尽量把星期天空出来。努力活在当下——跟朋友吃午饭、在家跟狗待着、参与那些曾经觉得是工作干扰的对话。一位 VC 朋友几年前跟他说过一句话,他说治疗期间一直在脑子里回放:现在就快乐。他说这是最难做到的事情之一,但他终于开始理解它的重要性了。


    他说,如果有其他人正在经历类似的事情,愿意分享笔记、比对经验,他很乐意交流。说这话的时候,看起来是认真的。

    “AI 能做到这些,不是十年后的事。是今天。”

  • Anthropic被禁出口,中日AI公司趁机推出了自己的平替

    Anthropic被禁出口,中日AI公司趁机推出了自己的平替

    两周前,美国政府一纸禁令,把Anthropic的Mythos和Fable 5模型对非美国人关上了门。这件事在AI圈炸了锅,但很快,中日两国的AI公司就给出了自己的答案——不是抗议,而是直接推出了替代品。

    中国的”神话”对抗”神话”

    本周三,中国网络安全公司360正式发布了”屠龙锋”(Tulongfeng),一款专门用于网络安全领域的AI工具。360的说法很直接:这款工具能和Anthropic的Mythos正面对抗。Mythos是什么?它是Anthropic专门针对网络安全场景打造的AI模型,能力强到让特朗普政府不得不对它实施出口管制。

    亚洲AI公司推出Mythos替代品概念图
    中日AI公司趁Anthropic出口禁令,推出本土化AI模型

    360没止步于此,同时还发布了另一款工具”一天真”(Yitianzhen),专注自动化网络防御和事件响应。360创始人周鸿祎在发布会上说了一句话,挺值得玩味:漏洞发现AI是”国家战略资产”,他担心的是”单向透明”——有些玩家能用上先进的漏洞检测能力,有些则被挡在门外。

    “漏洞发现AI是国家战略资产,我们需要警惕’单向透明’的风险。”
    ——周鸿祎,360创始人

    日本的”河豚”游得挺快

    差不多同一时间,东京的AI初创公司Sakana AI发布了Fugu(日文”河豚”的意思)。这家公司说,Fugu的性能可以”和Anthropic的Fable 5、Mythos Preview肩并肩”。Fugu不只是跟风,它有一个挺有意思的设计思路:编排模型(Orchestration Model)。简单说,它能协调调用多个其他AI模型,通过API把它们的能力串起来,而不是只靠自己。

    Sakana的联合创始人David Ha在X上写了一段话,说出了很多人的心声:”对单一供应商的依赖,是国家基础设施的风险。出口管制让大家意识到,这种风险是真实存在的。访问顶级模型的权利可能一夜之间消失,集体智能才是对抗权力集中的实用对冲。”

    Sakana是哪来的底气?这家公司2023年由前谷歌研究员Ren Ito、Llion Jones和David Ha联合创立,去年11月完成了1.35亿美元B轮融资,估值26.5亿美元。他们的主打方向是便宜好用的生成式AI模型,专门为日语和日本文化优化,在小数据集上也能跑得不错。

    时机”纯属巧合”?

    Sakana对外的说法是,Fugu的发布”纯属巧合”,研发从去年就开始了,相关研究今年春天还在ICLR上发表过。但他们的网站广告语写的是”提供前沿能力,没有出口管制风险”——这话说得挺直白的。

    Sakana的联合创始人Ren Ito上周在G7峰会边会上也谈到了这个话题。他写了一篇专栏文章,呼吁美国联邦政府”把保持盟友的访问权限作为第一优先级”,他的观点是”AI不应该成为一种被囤积的技术,而应该是共同开发的”。


    这两家公司,一个在中国,一个在日本,面对Anthropic的出口禁令,给出了两种不同的回应方式。360是直接硬刚,做一款同场景的替代品;Sakana则是做一个”保险”,让你在失去访问权限的时候还有别的选择。哪种思路更管用,现在还不好说。但有一件事是确定的:Anthropic五月份刚刚宣布年化收入突破470亿美元,其中有多少来自亚洲企业客户,外界不得而知。但禁令生效这几周,东京和北京各有一家公司站出来填了这个空缺。就算哪天禁令取消了,本地替代品已经在这里了,而且它们更懂本地语言和文化。这场博弈,才刚刚开始。

  • 英伟达把AI数据中心的用水量打到接近零,办法有点反直觉

    英伟达把AI数据中心的用水量打到接近零,办法有点反直觉

    AI数据中心烧钱又烧水,这事大家都知道。但英伟达最近说,他们找到办法了——把数据中心的用水量降到”接近零”。办法听起来有点反直觉:把服务器跑得更热。

    液冷+高温,英伟达的”节水密码”

    英伟达在本周的一篇博客里详细解释了这件事。他们新一代Rubin架构的参考设计,全面采用液冷方案,同时把服务器的运行温度提高到45摄氏度(113华氏度)。这两个改动加在一起,号称能把用水量从传统冷却塔系统的每年每兆瓦260万加仑,降到接近零——降幅最高可达100%。

    英伟达AI数据中心液冷系统概念图
    英伟达Rubin架构数据中心参考设计,全面液冷方案大幅降低用水量

    具体怎么做到的?英伟达的可持续发展负责人Josh Parker解释,热量直接在芯片上被捕获,然后通过液冷回路传输,回路的工作温度可以设得比较高,这样室外的干式冷却器一年里大部分时间都能高效散热,对气温的适应范围也宽得多。

    “从传统冷却塔系统每年每兆瓦约260万加仑的用水量,到接近零——最高可实现100%的削减。”
    ——Josh Parker,英伟达可持续发展负责人

    亚马逊也在做类似的事

    英伟达不是唯一一个在这条路上走的。亚马逊在上个月的一份报告里也提到,通过提高数据中心的温度容忍度,让主要以风冷为主的数据中心变得更高效。逻辑是一样的:服务器能扛更高的温度,冷却系统就不用那么卖力地干活,水也就省下来了。

    但事情没那么简单。Gizmodo指出,英伟达的博客里没提这种数据中心的建设成本——全液冷方案肯定比传统风冷要贵。不过英伟达方面声称,”每一个为Rubin架构建设的云服务商和数据中心运营商都在做这个转型”。如果是真的,规模效应最终会把成本降下来。

    问题没全部解决

    把水省了是好事,但AI数据中心的其他问题没被这个方案解决。比如建设阶段的环境影响,还有这些庞然大物运行所需的电力供应——这才是真正的耗能大户。

    美国各地最近冒出来很多AI数据中心项目,当地居民的抗议声也越来越大。大家担心的不仅仅是水,还有电、噪音、以及对周边社区的长期影响。英伟达的液冷方案是一个技术进步,但它只是AI基础设施这个大拼图中的一块。


    回过头看,这件事其实反映了一个更大的趋势:AI的算力需求还在涨,但社会和监管对数据中心的容忍度在下降。省水只是一个开始,接下来省电、省地、减少社区冲突,每一关都不好过。英伟达这一次至少证明了一件事:技术方案是存在的,剩下的就是看整个行业愿不愿意为之买单了。

  • cognee:为AI智能体打造的开源记忆平台,跨会话持久记忆+自托管知识图谱,23K+Stars让AI真正拥有长期记忆

    cognee:为AI智能体打造的开源记忆平台,跨会话持久记忆+自托管知识图谱,23K+Stars让AI真正拥有长期记忆

    🧠 项目简介

    Cognee 是为 AI 智能体打造的开源记忆平台,通过自托管知识图谱引擎,为智能体提供跨会话的持久长期记忆。它支持任意格式的数据摄入,构建可动态演进的知识图谱,让智能体能够基于完整上下文进行回忆、关联和行动。结合向量嵌入、图推理和认知科学基础的本体生成能力,Cognee 让文档既支持语义搜索,又能通过关系关联,且知识图谱会随知识积累动态演进。


    📦 安装要求和过程

    环境要求

    • Python:3.10 ~ 3.14
    • 可选:Docker(用于本地 MCP 服务或完整部署)
    • LLM API Key:默认支持 OpenAI,也可对接其他 LLM 提供商

    快速安装

    # 使用 uv 安装(推荐)
    uv pip install cognee
    
    # 使用 pip 安装
    pip install cognee
    
    # 如需使用 Postgres 作为后端,安装对应依赖
    pip install "cognee[postgres]"
    

    环境配置

    # 复制环境变量模板
    cp .env.template .env
    
    # 配置 LLM API Key(默认 OpenAI)
    echo 'LLM_API_KEY="your_openai_api_key"' > .env
    

    Docker 一键部署

    # 克隆仓库并配置
    git clone https://github.com/topoteretes/cognee.git
    cd cognee
    cp .env.template .env
    
    # 启动 API 服务(默认端口 8000)
    docker compose up
    
    # 同时启动前端(端口 3000)
    docker compose --profile ui up
    
    # 启动 MCP 服务(端口 8001)
    docker compose --profile mcp up
    

    ⭐ 核心功能

    1. 跨会话持久记忆

    AI 智能体的记忆不会随会话结束而丢失。Cognee 提供两种存储模式:永久存储(直接写入知识图谱,执行完整处理流程)和会话存储(先写入快速缓存,后台异步同步到知识图谱)。

    2. 自托管知识图谱引擎

    知识关系可动态演进,随知识积累自动更新。Cognee 1.0 支持在单个 Postgres 实例上运行完整记忆层(关系存储 + 向量嵌入 + 会话缓存 + 元数据存储),无需维护多组件栈,性能比分离式图+向量方案快约 10%。

    3. 多后端支持

    默认使用 Postgres 全栈运行记忆层,也可按需切换 Neo4j、Neptune、Redis、Qdrant 等专用后端。灵活适配不同规模的部署需求。

    4. 多语言官方客户端

    除 Python 主客户端外,还提供 Rust(cognee-rs,可通过 cargo add cognee 安装)和 TypeScript(@cognee/cognee-ts,可通过 npm install 安装)官方客户端,覆盖更多开发场景。

    5. 多智能体工具集成

    支持 Claude Code、OpenClaw 等智能体工具集成,也支持对接 Cognee Cloud 托管服务。提供 MCP 服务器原生支持,可无缝接入 AI 编程助手。


    🚀 典型使用场景

    场景一:客服智能体

    目标:结合用户的金融、客服、产品历史等个人数据,解决客户问题。

    示例交互

    • 用户提问:”我的发票有问题,而且问题一直没解决”
    • 智能体响应:”我找到 2 个上个月解决的类似账单问题,原因是支付和发票系统同步延迟,我们已经在你的账户上应用了修复方案。”

    底层逻辑:统一整合企业多渠道数据源 → 重建交互时间线 → 检索相似已解决案例 → 匹配最优解决方案 → 执行后更新记忆。

    场景二:专家知识蒸馏(SQL 助手)

    目标:帮助初级分析师复用专家的查询、模式和推理逻辑,完成数据分析任务。

    示例交互

    • 用户提问:”我该怎么为这个数据集计算客户留存率?”
    • 智能体响应:”这是高级分析师解决类似留存查询的方法,Cognee 将你的数据表结构和已知结构做了匹配,把专家的逻辑适配到了你的数据集上。”

    底层逻辑:提取并存储专家 SQL 查询 → 将当前数据表结构映射到已识别的结构 → 检索相似任务和成功实现方案 → 将专家推理逻辑适配到当前上下文。


    💡 推荐理由

    Cognee 解决了 AI 智能体领域一个根本性问题:如何让智能体拥有持久、可演进的记忆。在大模型应用从”单次对话”走向”长期协作”的今天,记忆层已成为 AI 智能体不可或缺的基础设施。

    最打动我的几点

    • Single Postgres 架构:Cognee 1.0 的巧妙设计让整个记忆层运行在单个 Postgres 实例上,极大降低了运维复杂度,同时性能不输专用分离方案。
    • 动态演进的知识图谱:不同于静态 RAG,Cognee 的知识图谱会随知识积累自动更新关系,真正实现”越用越聪明”。
    • 基准测试领先:在长上下文记忆基准测试 BEAM 中,Cognee 得分 0.79(开启按问题路由后 >0.8),优于之前的 SOTA 方案(0.735)和 RAG 基线(~0.33)。
    • 多语言客户端:同时提供 Python、Rust、TypeScript 官方客户端,覆盖从 AI 应用开发到高性能系统集成的全场景。
    • 活跃社区:8426+ 次提交,304 个开放 Issues(说明使用人数多、反馈活跃),Apache-2.0 永久开源。

    如果你正在构建需要”记住用户”的 AI 应用——无论是客服机器人、个人助手还是企业知识助手,Cognee 值得一试。23K+ Stars 和本周新增 5000+ Stars 的趋势,已经说明了开发者的认可。


    📥 下载地址


    📌 许可协议:Apache License 2.0(永久开源,可自由使用、修改和分发)

    👥 维护团队:topotherete 社区(8426+ 次提交,活跃开发中)

    📄 相关研究Optimizing the Interface Between Knowledge Graphs and LLMs for Complex Reasoning(arXiv 2025)

  • AI预算雪崩:员工用AI转PDF花掉几十亿,Accenture急了

    AI预算雪崩:员工用AI转PDF花掉几十亿,Accenture急了

    AI预算雪崩:员工用AI转PDF花掉几十亿,Accenture急了
    文章配图

    几个月前,AI行业还在鼓励大家”把AI预算用光”——用得越多越好,最好全公司都tokenmaxxing。现在风向突然变了:公司发现账单高得离谱,而员工用AI做的事情,基本上是在浪费钱。

    我们正进入”token配给制”时代。

    Accenture的”token末日”

    最近404 Media曝光了一段Accenture内部会议的录音,内容相当尴尬。这家全球最大的咨询公司之一,正在试图阻止员工把公司的AI token额度花光——而员工干的事情包括:用AI把PDF转成PPT。

    讽刺的是,就在不久之前,Accenture还在威胁员工:不用AI就别想升职。现在反过来求员工别用那么猛。

    Accenture代理AI战略负责人Justice Kwak在内部会议上说:”AI正在成为成本结构中的重要组成部分,支出变得非常不可预测;CFO、COO、CIO们还在问一个问题——我们花的这些钱,到底值不值?”

    从”越多越好”到”越少越好”

    这段反转背后,是整个AI商业模式的一次大考。年初的时候,AI公司和很多企业客户都在鼓吹”tokenmaxxing”——尽量多用AI,把每一分预算都花掉,因为用得越多,模型就越好(至少营销是这样说的)。

    有些公司甚至搞了内部排行榜,看哪个部门用的token最多。Amazon后来悄悄删掉了自家的排行榜,因为有人发现这东西本质上是在奖励浪费。

    现在来看,那些排行榜奖励的不是生产力,而是谁最能烧钱。

    市场已经开始用脚投票

    token成本失控的问题,已经不只是某一家公司内部的事了。最近几天,AI相关股票出现了一轮明显的抛售——媒体称之为”AI抛售”(AI selloff),内存芯片制造商跌得尤其狠。

    投资者的逻辑很简单:如果AI的最大企业客户都开始认真管控token支出,那AI公司的营收预期就得重新算。而这直接影响上游——买多少GPU、建多少数据中心,都取决于企业端的需求是不是真的、是不是可持续的。


    AI得证明自己值这个价

    这段故事最有意思的地方在于:AI行业已经过了”新奇阶段”,现在必须证明实际价值。员工用AI转PDF、写无关紧要的邮件、生成一堆没人看的摘要——这些用法或许能刷排行榜,但对公司底线没有贡献。

    Accenture的困境,其实是整个行业正在面对的问题。AI工具确实强大,但”强大”不等于”用得越多越好”。怎么把AI用在真正产生价值的地方,同时把成本控制在合理范围内——这个问题,2026年下半年每一家用了AI的公司都得认真回答。

    而那些还在鼓吹”无限制使用AI”的厂商,可能很快就要面对一群拿着账单问问题的CFO了。

  • AI监管变天:Anthropic和OpenAI突然站在了同一艘船上

    AI监管变天:Anthropic和OpenAI突然站在了同一艘船上

    AI监管变天:Anthropic和OpenAI突然站在了同一艘船上
    文章配图

    这两周AI圈子发生了一件挺有意思的事——Anthropic的Fable和Mythos两个模型被美国政府强制下架,而OpenAI刚准备发布的GPT-5.6,眼看也要走进同一个”审批死角”。

    两家公司打得不可开交,结果现在被同一把剑悬在头顶。竞争格局突然变了。

    审批”死角”到底有多深

    事情要从两周前说起。美国政府对Anthropic施压,导致Fable和Mythos两个模型被撤出一般发布渠道。当时很多人的第一反应是:这是Anthropic自己搞的,还是别人告的?

    现在答案逐渐清晰——不管谁起的头,结果吃亏的是整个行业。OpenAI的GPT-5.6据传只做”有限预览”,而且每一个企业客户要使用,都得政府先批。据The Information报道,这种”逐客户审批”的模式可能会持续几周甚至更久。

    Mythos已经在预览状态卡了好几个月,没有任何迹象表明它会在短期内进入一般发布。哪怕GPT-5.6的延迟只有”几周”,对于砸了几十亿美元训练成本的AI实验室来说,这也是真金白银的损失。

    问题远不止”慢几周”

    模型发布的节奏一旦被打乱,连锁反应会很快传导到数据中心建设、融资计划、甚至整个行业的信心。如果每一个前沿模型的发布都要先过政府这道关,而且没有清晰的审批标准,那AI公司怎么规划产品路线图?

    更棘手的是,美国政府目前根本没有能力做这种审批。GMU研究员、即将入职OpenAI的Dean Ball在一篇分析文章里说得很直白:监管方既没有明确的安全评估框架,也说不清楚到底在防什么风险。

    网络安全、生物风险、模型对齐——这些都是真实存在的关切,但不能靠”先拖几个月再说”来解决。

    行业需要联合,而不是互咬

    这件事最有意思的地方在于:Anthropic和OpenAI突然有了完全相同的利益。之前大家都在看热闹,觉得是不是Anthropic用监管手段打压OpenAI,或者OpenAI跟特朗普政府走得太近、把对手挤出去。

    但现在的情况很清楚——不管你跟政府关系多好,审批的刀随时可能落下来。今天卡的是Anthropic,明天可能就是OpenAI,后天 maybe 是Google。

    Russell Brandom在TechCrunch的文章里说得很明白:这已经不是Anthropic vs OpenAI的故事了,而是整个AI行业跟政府监管之间的博弈。如果行业不联合起来推动一个合理的审批框架,而是各自想着怎么利用监管打击对手,最后大家一起完蛋。


    接下来会怎样

    未来几周,AI公司面临的选择很明确:是继续把安全审查当成竞争工具,还是联手推动一个透明的、可预期的审批流程?

    从商业角度看,后者的难度显然更大——意味着要跟竞争对手合作,意味着要接受某种形式的行业自律。但从整个行业的长期发展来看,这可能是唯一不把大家都拖死的办法。

    AI模型的能力已经强到让政府不得不插手。这是好事还是坏事,取决于行业怎么应对。

  • Adobe把Topaz Labs买了:AI图像视频增强这块,它不想再让别人沾手

    Adobe这周宣布收购Topaz Labs,一家做了二十多年图像和视频增强工具的公司。表面上这是个”整合互补技术”的常规操作,但实际上Adobe在堵一个口子:不想让用户在AI增强这块跑去用别的软件。

    Topaz Labs可能不是普通用户最熟悉的品牌,但在专业圈子里口碑很稳。他们家的视频超分、图像降噪、画质修复工具,很多后期剪辑师和摄影师是真的在天天用。

    拿了艾美奖的技术

    Topaz去年拿了一个艾美奖(技术类),表彰他们在视频增强技术上的贡献。具体产品有两个核心:Astra做AI视频超分,Wonder做图像修图和增强。

    Adobe收购Topaz Labs概念图
    Adobe生态整合Topaz AI增强技术

    最近他们还搞了一个叫NeuroStream的技术,核心是让大模型能在消费级GPU上跑起来——这跟Adobe的”本地AI处理”策略对得上。Adobe一直在推Firefly的本地化能力,不想所有计算都依赖云端。

    “Topaz Labs在优化大型复杂AI模型以直接在设备上运行方面拥有深厚专业知识,这将使Adobe能够为客户提供更快速、更响应的体验,并使高级AI对创意人员来说更可及、更具成本效益。” —— Adobe创意云产品营销副总裁 Deepa Subramaniam

    Adobe在防什么

    现在做创意软件的公司,竞争比原来激烈太多了。Canva在抢小白用户,Blackmagic Design(DaVinci Resolve的东家)在抢专业剪辑师,加上一堆AI原生工具在抢”AI优先”这个叙事。

    Adobe的应对策略很直接:把有用的技术买进来,塞进自己的生态里,让用户没有理由出去。Topaz的工具已经有一部分在Creative Cloud里能用到,现在直接整个买下来,整合进Firefly AI助手和Premiere、Illustrator这些主力应用。

    收购完成后,Topaz的产品还会继续作为独立服务在自家网站上卖,但核心模型和技术会逐步整合进Adobe全家桶。

    交易细节

    具体收购金额两家公司都没披露。交易预计在2026年下半年完成。

    对Topaz来说,背靠Adobe意味着更大的用户触达和更多的计算资源。对Adobe来说,这是守住创意软件生态的又一步棋。


    对普通用户来说,接下来能看到的变化大概是:Premiere里的视频增强更强大了,Photoshop里的降噪和超分更准确了,而且这些都直接在本地跑,不用等云端排队。

    至于能不能扛住Canva和Blackmagic的围攻,得看Adobe能把买来的技术整合到什么程度。