分类： AI资讯

聚焦前沿人工智能动态，速览行业热点、技术突破、产业风向与实用 AI 干货，紧跟科技潮流，第一时间掌握 AI 最新趋势。

Google DeepMind憋了个大招：AI不再只陪你聊天，开始帮你搞科研了
前两天刷到Google DeepMind的一条消息，说他们搞了个叫Co-Scientist的东西——多智能体AI系统，专门给科研人员用的。我第一反应是：又来一个”AI助力科研”的PPT项目？但仔细看完，发现这次有点不一样。

Co-Scientist：基于Gemini构建的多智能体科研助手

从”搜索工具”到”科研搭档”，这步跨得挺大

以往AI在科研里的角色，说白了就是个高级搜索引擎——你问它”XXX领域有什么进展”，它给你列一堆文献摘要，然后你自己去啃。

Co-Scientist想做的事不一样。它的定位是：假设生成、讨论、验证的协同伙伴。核心架构是”生成-讨论-验证”三阶段，多个AI智能体互相抬杠、互相验证，最后给你一个它觉得靠谱的假设方向。

传统科研里，一个有价值的研究假设，往往需要研究者花几个月甚至几年去打磨。Co-Scientist的目标，是把这个”灵感孵化”的过程，压缩到几天甚至几个小时。

它到底强在哪？不是参数多，是”会自己纠偏”

DeepMind在介绍里特意强调了一点：Co-Scientist强化了准确引用专业文献和自我修正逻辑矛盾的能力。

这话什么意思？你去用用现在市面上的大模型，让它帮你梳理一个研究假设，十有八九会出现”编造引用”（hallucinated references）或者”前后逻辑打脸”的情况。Co-Scientist针对这个痛点做了强化，目标是让AI在科研场景里不乱说话。

当然，现在它还处在实验性开放阶段，主要面向研究机构，不是你我去网页上就能白嫖的。但它透露出的方向很明确：AI不再只是”知识的搬运工”，而是开始涉足”知识的创造过程”。

瞄准的是哪些科研领域？生物学、化学，还有那些”人类搞了几十年还没搞明白”的难题

DeepMind在展望里点名了几个方向：
- ALS（肌萎缩侧索硬化症）治疗：这个病折腾了科学界几十年，AI能不能帮忙找到新的药物靶点或者治疗路径？Co-Scientist想试试。
- 衰老研究：衰老机制极其复杂，假设空间巨大，人工筛选成本极高。AI介入后，可能会开辟一些人类研究者还没想到的角度。
- 化学分子设计：新药物、新材料的分子结构搜索，本质上是超高维空间的探索问题，AI”生成-验证”的循环在这里很有优势。
未来DeepMind还打算把Co-Scientist跟实验自动化系统整合起来。到那时候，AI不只是帮你”想”，还能指挥实验室里的机器人去”做”，再把结果喂回来继续迭代。这个闭环一旦跑通，科研效率的跃升会是数量级的。

跟OpenAI证明数学猜想那件事，其实是同一个信号

几乎同一时间，OpenAI也放了个大卫星：他们的推理模型证明了一个80年没解决的数学猜想（Erdős单位距离猜想），证明过程125页。

这两件事放在一起看，信号就很清楚了：2026年的AI，已经从”帮我总结一下”进化到”帮我证明/帮我发现”了。这不是简单的参数堆砌，而是推理能力、文献理解、逻辑自洽性这几件事同时到了一个临界点。

科研人员如果还在把AI当”高级搜索引擎”用，可能真的有点亏了。下一步值得关注的，是这些科研AI智能体能不能真正加速重大发现，而不只是在已有假设上修修补补。

📎 原文来源：Google DeepMind官方博客 – Co-Scientist
2026年5月25日
阿里千问又放大招：Qwen3.7-Max能让AI连干35小时不卡壳
前几天刷到一条消息，阿里千问偷偷把Qwen3.7-Max放出来了。说实话，这次更新有点东西，不是那种换汤不换药的版本号游戏。

Qwen3.7-Max：阿里千问新一代全能智能体基座

35小时、1000次工具调用，它真顶得住？

最让我意外的一个测试数据：Qwen3.7-Max在一次实验里连续跑了35个小时，调用了超过1000次外部工具，整个过程没有崩、没有逻辑断链、没有出现”我不理解你的请求”这类废话。

这是什么概念？你去问问任何一个用过AI辅助编程的朋友，大多数模型在复杂多步任务里，撑个两三个小时就开始”幻觉叠加”、前后矛盾、或者干脆装死。Qwen3.7-Max这个表现，说明它在长上下文推理和多轮工具调用这两个硬骨头上，确实啃下来了。

“全能智能体基座”——阿里的定位很明确，不是做一个只会聊天的模型，而是做一个能陪你把事情干完的底层引擎。

编程、办公、长任务，一个都不放过

Qwen3.7-Max现在的覆盖范围挺全的：
- 编程场景：从前端原型到复杂多文件工程，它都能接。这意味着你可以用它来重构代码库、跨文件修Bug、甚至帮你从零搭一个项目的骨架。
- 办公生产力：多智能体协作 + 工作流自动化。说白了，它不只是帮你写邮件，而是能理解你的业务流程，然后自己跑去调用各种工具把活干完。
- 长周期任务：这才是真正的门槛。35小时不间断，意味着它可以陪你跑完一个完整的软件发布周期，或者帮你盯一个持续集成流水线的全部过程。
已经在阿里云上百炼上线，还能跑在Claude Code上

有一点挺关键的：Qwen3.7-Max不是只给千问App用户玩的，它已经接进了阿里云百炼平台，开发者可以直接调用API。

更值得注意的是，它宣称支持跨框架泛化——能在Claude Code、OpenClaw、Qwen Code等多个开发框架里稳定运行。这话听着有点狂，但如果真的能做到，那意味着阿里的模型在”兼容性”这件事上，开始认真跟Anthropic和OpenAI掰手腕了。

用户现在可以把千问App更新到6.9.7以上版本，在应用里直接切换到Qwen3.7-Max。PC端和网页端也同步开放了。

国产大模型，这次真的在拼”实用”了

回过头看，2026年这几个月，国产大模型的节奏明显变了。以前大家比的是”我有多少参数””我在哪个榜单上刷了第一”，现在比的更多是：你的模型到底能不能帮用户把活干完？

Qwen3.7-Max打的就是这个痛点。35小时工具调用不掉链子，这件事本身就是一个很强的信号：长周期Agentic任务，不再只是PPT上的概念，而是有模型真的在往这个方向死磕。

至于它能不能真的在实际生产环境里顶住，还得看接下来几个月开发者的反馈。但至少从目前已经放出来的信息看，阿里千问这一步，走得不虚。

📎 原文来源：AITOP100 – 2026年5月25日AI资讯
2026年5月25日
谷歌搜索25年来最大改版：10条蓝链终结

谷歌搜索终于动手了，25年来最大的一次改版

用了25年的谷歌搜索，这回真的变了。不是小修小补，是把底层逻辑给重构了。

你现在在谷歌搜索框里输入一个复杂问题——比如”比较过去20年主要经济体的碳排放趋势和GDP增速的关系”——出来的不再是一串蓝色链接让你自己点进去找答案，而是直接生成一个可交互的图表，数据整合了全网多个来源，你可以在搜索结果页直接操作这个图表。

谷歌搜索产品副总裁Robby Stein表示，这次升级的核心目标是适应用户搜索行为的变化：人们现在问的问题更长、更复杂，整个互联网往往没有现成的完整答案。

“10条蓝链”死了

从1998年谷歌成立到现在，”10条蓝色链接”的搜索结果模式基本没变过。用户输入关键词，谷歌返回一串链接，用户自己点进去找答案。这个模式现在正式宣告终结。

新版本的搜索结果页可以直接生成定制可视化内容、交互图表、甚至迷你应用。你问”怎么规划一次去日本的3周行程”，搜索结果页直接给你出一个可交互的行程规划器，而不是让你自己去点15个旅行博客。

SEO行业炸了

这个变化对SEO从业者来说是个地震级事件。过去20年，SEO的核心逻辑是”让我的链接排在前面，让用户点进来”。现在用户可能在搜索结果页直接拿到了答案，根本不会点你的链接。

新的优化方向是让自家内容被谷歌的AI概览（AI Overviews）引用。你的内容不需要被用户点击，但需要被AI在生成答案时引用为来源。这是两套完全不同的优化逻辑。

谷歌为什么要这么做

背后的推动力很简单：ChatGPT、Perplexity这些AI搜索工具正在吃掉谷歌的午餐。用户发现，有些问题直接问AI比在谷歌上点10个链接效率高得多。

谷歌的选择是：如果打不过，就把自己变成AI搜索平台。它有足够的优势——拥有YouTube、Gmail、安卓等30亿日活产品，这些数据喂给AI搜索的质量是任何竞争对手都比不了的。

今年I/O大会上谷歌没有发布对标Claude Mythos的超级模型，而是推了更快更便宜的Gemini 3.5 Flash。CEO皮查伊的战略很明确：不跟Anthropic和OpenAI比基准测试分数，而是把足够好的模型铺到尽可能多的用户产品里。

对普通用户意味着什么

短期来看是好事。搜索体验确实会变好，尤其是那些需要整合多个信息源才能回答的复杂问题。你不用再开10个标签页来回切换了。

长期的影响还不好说。如果所有人都不点链接了，靠流量生存的那些网站（媒体、博客、论坛）的商业模式会受到严重冲击。互联网的内容生产机制可能因为这次改版而发生结构性变化。

📎 原文来源：AI News Today (May 25, 2026): Top AI Stories & Headlines

2026年5月25日
Anthropic拿到300亿美元，估值飙到9000亿

Anthropic拿到300亿美元，估值飙到9000亿

这周AI圈最炸的新闻，是Anthropic正在敲定一笔最高300亿美元的融资，估值直接干到9000亿美元以上。完成后，它将正式把OpenAI从”全球最有价值AI公司”的宝座上拉下来——要知道OpenAI今年3月的估值才8520亿美元。

更夸张的是，这家公司今年2月的估值还只有3800亿美元。不到4个月，估值直接翻倍。背后支撑这个数字是真金白银的营收：Anthropic预计2026年Q2营收达到109亿美元，比Q1的48亿美元增长了130%。换句话说，它第一次实现了季度运营盈利。

Anthropic Q2 2026营收预计109亿美元，较Q1增长130%，首次实现季度运营盈利。投资机构看好其18个月内年营收突破500亿美元。

谁在投？

这一轮由红杉、Dragoneer、Greenoaks、Altimeter联合领投。这些名字在硅谷创投圈都是顶级玩家，他们下注的逻辑很简单：Anthropic的Claude模型在企业市场打得OpenAI有点招架不住，而且Anthropic的安全叙事在监管趋严的大环境下反而成了竞争优势。

还有一个细节值得玩味：SpaceX的IPO招股书里披露，Anthropic将向SpaceX支付每月12.5亿美元的GPU算力费用，2029年5月前总计450亿美元。马斯克一边公开怼Anthropic，一边自己的公司收着Anthropic的算力支票，这个画面有点意思。

卡帕西加入了

融资消息之外，另一个信号是Andrej Karpathy宣布加入Anthropic，负责重建预训练研究团队。作为OpenAI联合创始人、前特斯拉自动驾驶负责人，Karpathy在AI研究圈的分量不用多说。他的去向本身就是对Anthropic研究方向的背书。

教皇也来站台

更有意思的是，教皇良十四世发布了首份AI通谕《Magnifica Humanitas（壮丽的人类）》，主题是在AI时代保护人类个体尊严。这份通谕由Anthropic联合创始人Christopher Olah共同发布。教皇选择跟Anthropic合作而不是谷歌或OpenAI，释放的信号很明确：梵蒂冈认可Anthropic的AI安全理念。

这件事的象征意义大于实际影响，但对于一家AI公司来说，被天主教会选为AI伦理的对话伙伴，在品牌层面是相当大的加分项。

OpenAI这边在干嘛

就在Anthropic融资消息刷屏的同时，OpenAI向SEC提交了保密的IPO申请（S-1文件），计划在2026年Q4到2027年初上市。两家公司的路径开始分化：Anthropic在一级市场拿钱拿到手软，OpenAI则准备去公开市场接受考验。

不过OpenAI也不是没有动作。据报道，五角大楼正在测试OpenAI和谷歌的模型，考虑把它们加入到涉密工作流中。此前Anthropic因为是国防部首选AI供应商，但今年初Anthropic因为伦理原因拒绝了一份国防部合同，于是五角大楼开始找备选方案。

📎 原文来源：AI News Today (May 25, 2026): Top AI Stories & Headlines

2026年5月25日
OpenAI要上市了，估值1万亿美元，这数字什么概念？

OpenAI这次是真的要上市了。据多家媒体报道，他们这周就要向美国证监会（SEC）秘密提交IPO招股书，目标是在2026年9月完成公开上市，估值可能超过1万亿美元。

OpenAI IPO计划引发业界关注（图源：opentools.ai）

1万亿美元估值，地球上还没几家公司做到

目前私营阶段OpenAI的最新估值是8520亿美元，这是历史最大规模的私募融资轮。如果IPO估值真的冲到1万亿美元以上，OpenAI将成为人类历史上规模最大的IPO之一，超过沙特阿美石油公司2019年创下的2560亿美元纪录（按市值算）。

问题是，OpenAI现在还在亏钱。截至2026年2月，他们的年化营收是250亿美元，用户周活9亿，但这些数字背后的成本是惊人的——算力、人才、数据中心，每一个都是吞金兽。

OpenAI给投资者的故事是：我们拥有高端模型护城河。但问题是，中国出来的低成本模型正在吃掉这个护城河——人家能做到你90%的能力，价格却只有几分之一。

一个障碍刚被扫清：马斯克输了官司

数日前，马斯克针对OpenAI的诉讼被陪审团裁定「诉讼时效过期」而驳回。这场官司折腾了快两年，马斯克声称OpenAI背离了最初的非营利使命，要求法院阻止其转为营利性公司。

官司没了，OpenAI上市最大的法律障碍就消失了。与此同时，Anthropic也在准备IPO，估值谈到了9000亿美元，原本计划10月上市。但现在OpenAI抢跑，预测市场显示OpenAI先于Anthropic上市的概率从32%飙到83%。

上市对普通开发者的意义

如果你是靠OpenAI API吃饭的开发者，这件事跟你有关。上市公司面临季度财报压力，大概率会推动API涨价，或者把更多资源向企业级用户倾斜。

OpenAI已经推出了「Guaranteed Capacity（容量保障）」计划，释放的信号很明确：想获得稳定算力？签多年合同。中小开发者如果只靠按量付费，未来可能只能拿到剩余算力配额。

一个有趣的花絮：CEO Sam Altman在IPO申请前夕，突然宣布向所有Y Combinator当前批次的初创公司提供200万美元的OpenAI API额度，条件是换取对方股权。这操作被外界解读为：在上市前的监管审视期，先锁定一批未来的需求方。至于这是不是违反YC条款或者OpenAI自己的利益冲突政策，目前还没人说清楚。

不管怎样，AI行业从私募资本主导转向公开市场的时代，算是正式开始了。

📎 原文来源：OpenTools – OpenAI Prepares Confidential IPO Filing, Targets September Public Debut

2026年5月25日
Anthropic要盈利了，AI烧钱的时代真的结束了？

这话还得从Anthropic最新泄露的财务数据说起。2026年第二季度，这家公司的营收预计冲到109亿美元——什么概念？比去年同期的几亿美元翻了不知道多少倍，而且这季度还要首次实现运营盈利，大概5.59亿美元。

Anthropic CEO Dario Amodei（图源：CNBC）

钱从哪来？

核心答案就两个字：Claude。准确说，是Claude Code——他们的编程助手产品。这款东西的年化营收已经跑到25亿美元了，而且第一季度营收同比增幅是80倍，你没看错，80倍。

企业和开发者对Claude的需求暴涨，直接导致Anthropic的基础设施绷不住了。公司自己在4月承认，算力”不可避免的紧张”，然后赶紧签了一堆算力采购协议。其中最夸张的是跟SpaceX签的那个——租下SpaceX在孟菲斯的Colossus 1数据中心全部算力，每个月付12.5亿美元，合同签到2029年5月，总金额450亿美元。

450亿美元，这是目前AI行业公开的最大算力采购合同，没有之一。

估值竞赛：Anthropic vs OpenAI

Anthropic现在正在谈新一轮融资，投后估值预计9000亿美元。而它的老对手OpenAI最新私募估值大概是8500亿美元。这两家原本是一家人——Anthropic是2021年从OpenAI出走的高管和研究人员创立的，原因是对OpenAI的发展方向不满。

现在两家还在赛跑另一个东西：IPO。Anthropic之前说考虑2026年上市，OpenAI更激进，据说这周就要秘密提交IPO招股书，目标9月公开上市，估值可能超过1万亿美元。

一个有趣的转折

Anthropic之前因为拒绝向美国军方开放所有合法用途的模型访问权限，被美国国防部拉黑了。结果4月他们推出了一个具备高级网络安全能力的Claude Mythos Preview模型，然后国防部那边又说”有可能”合作了。特朗普4月还公开表示支持，这事儿就这么戏剧性地反转了。

回头看，Anthropic这个故事最有意思的地方在于：它证明了一件事，做AI基础模型不一定非要一直烧钱，只要产品找对了方向，企业级市场是愿意买单的。Claude Code这25亿美元的年化营收就是最好的证据。

当然，代价是每个月要付SpaceX 12.5亿美元的算力账单。这生意到底划不划算，可能得等IPO之后看财报才知道。

📎 原文来源：CNBC – Anthropic set to hit $10.9 billion in revenue during second quarter

2026年5月25日
三部门发文规范AI智能体：70%普及率目标背后的信号
AI智能体有了”游戏规则”

既要求智能体的安全规范，又推动智能体创新发展。近日，国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》，这份文件给正在狂飙的AI Agent行业，立了一套清晰的游戏规则。

智能体是啥？文件给了一个清晰的定义：具备自主感知、记忆、决策、交互与执行能力的智能系统。随着大模型等新一代人工智能技术迅猛发展，智能体正加速与网络空间、物理世界深度融合，深刻改变人类生产生活方式和社会治理模式。

这份《意见》其实在回答一个核心问题：当AI开始替人做决策、执行任务，边界到底在哪里？

四大举措，既划红线又给空间

《意见》明确智能体发展要坚持安全可控、规范有序、创新驱动、应用牵引四大基本原则，并提出了4个方面的重要举措：

一是夯实发展基础。完善技术底座，构建标准协议。这意味着国家层面会推动智能体相关的技术标准、通信协议、评价体系等基础设施的建设。

二是守牢安全底线。明确产品准则，防范安全风险，完善治理体系，强化行业自律。智能体如果乱用、滥用，风险不小——比如自主决策导致经济损失、隐私泄露、甚至物理世界的伤害（如果是机器人智能体）。

三是强化应用牵引。围绕科学研究、产业发展、提振消费、民生福祉、社会治理等方向，提出19个典型应用场景。国家不仅在管，更在推——给智能体找真实场景、落地产值。

四是建设创新生态。促进产业合作，强化应用推广。智能体不是一家公司在做的，需要整个产业链协同。

权限边界：谁来决策？

对于智能体接管工作后的权限和边界，《意见》提出了一个很关键的要求：在遵守法律法规、尊重社会公德和伦理规范前提下，厘清三类决策方式的合理边界及所需权限：
- 仅限用户本人决策——涉及重大利益、人身安全的，必须人来做最终决定
- 需由用户授权决策——AI可以建议、可以执行，但关键节点要让人确认
- 智能体自主决策——低风险、高频、规则清晰的，可以让AI自己跑
这个划分其实非常务实。智能体不是要完全取代人，而是要在合适的边界内，最大化释放自动化价值。

70%普及率目标，智能体要进千家万户

《意见》支持落实新一代智能终端、智能体等应用普及率超70%的阶段性目标。这个数字很有意思——70%的普及率，意味着智能体要从”科技圈炒作概念”，变成”普通人也天天在用”的真实基础设施。

对比一下：智能手机在中国的普及率大概是80%左右。也就是说，国家把智能体的战略地位，放到了和智能手机类似的量级。

要达到70%普及率，光靠ToB的企业市场肯定不够，必须进入ToC消费场景——比如手机里的AI助手、家里的智能管家、车里的智能座舱、甚至是穿戴设备上的AI Agent。

三部门联合发文，释放的信号非常明确：智能体不是”野生的”、不是”法外之地”，但国家也不想一管就死。规范和创新，要并举。

对行业意味着什么？

这份文件对AI智能体行业的影响，可能比很多人想象的更深远：

对大模型公司来说，光有模型能力不够了，得想清楚智能体的安全边界怎么设计、用户授权机制怎么做、决策日志怎么留痕。

对应用开发来说，19个典型应用场景相当于国家帮你想好了”往哪发力”——科研、产业、消费、民生、治理，都是真金白银的投入方向。

对投资人来说，70%普及率目标是一个清晰的市场信号——智能体不是短期风口，而是中长期的国家战略方向。

过去两年，AI行业讨论最多的是”谁的模型更聪明”。但智能体这个赛道，比的不是Benchmark分数，而是谁更懂场景、谁更安全可信、谁能让用户放心把任务交出去。

这份《意见》，算是给这个竞争维度，正式按下了加速键。

📎 原文来源：三部门发文规范AI智能体发展规范与创新并举
2026年5月25日
Google I/O 2026：Agent时代正式开启，OpenAI最大对手回来了

Google I/O 2026：从聊天机器人到数字分身

过去几年Google I/O的主角，通常是某个模型、某个参数量、某个Benchmark。但今年不一样。整场两个多小时发布会，Google其实只反复讲了一件事：Agent。

不是聊天机器人，不是”帮你回答问题”的AI，而是真正开始替用户持续执行任务的AI Agent。Google想做的，是把Gemini从一个App，彻底变成Google所有入口背后的操作系统。

Google I/O 2026全面押注AI Agent（图源：谷歌）

Gemini Spark：你的24小时数字分身

这次发布会上，Google几乎把整个产品体系全部Agent化了。最核心的新产品，是Gemini Spark。你可以把它理解成Google版”全天候数字分身”。它运行在Google Cloud虚拟机上，7×24小时在线。即便你关掉电脑、合上手机，它依然会在后台继续工作。

Google现场演示了一个典型场景：用户正在组织社区派对，Spark会自动汇总邮件回复、统计每个人带什么东西、追踪谁还没确认、生成提醒邮件、同步Google Sheets，再自动做一份Google Slides宣传页，整个过程几乎不需要用户手动操作。

Gemini Spark本质上正在把Agent从”问答工具”，变成”长期运行的执行系统”。过去的大模型，更像即时响应；现在的Agent，则开始拥有持续状态、任务记忆和跨应用执行能力。

Gemini 3.5 Flash：把Agent成本打下来

Agent最大的难点，从来都不只是能力，而是成本。因为Agent实在太烧Token了。Google披露的数据非常夸张：目前Google自家产品每月处理的Token，已经达到3200万亿个，同比增长7倍。

于是，Gemini 3.5 Flash出现了。这可能是今年Google最关键的模型。因为它不再单纯强调”最强”，而是开始强调”最适合跑Agent”。Pichai现场直接算了一笔账：如果一家头部企业每天处理1万亿Token，把80%的工作负载从其它前沿模型迁移到Gemini 3.5 Flash，一年能省超过10亿美元。

性能接近顶级前沿模型，输出速度快4倍，而成本只有同类模型的一半甚至更低。Google现在反复强调一句话：”你不需要再在质量和速度之间二选一。”因为Agent时代，比拼的已经不是一次回答，而是持续运行能力。

Antigravity 2.0：93个Agent协作搭建操作系统

如果说Flash负责”让Agent更便宜”，那Antigravity 2.0负责的，就是”让Agent真正开始干活”。它原本只是个AI Coding工具，现在Google直接把它升级成了多Agent协作平台。

开发者可以同时调度多个Agent：一个写代码，一个生成设计素材，一个规划产品架构，一个测试漏洞，一个修Bug。Google现场甚至演示了一个极其夸张的案例：93个Agent并行协作，从零开始搭建一个可运行的操作系统。

整个过程持续12小时，处理26亿Token，最终居然真的跑起来了，甚至还能运行Doom。而整个API成本不到1000美元。Google显然是在正面硬刚Claude Code和Codex。

搜索彻底变了：从链接到执行结果

Google这次还对搜索动了最大的一刀。Pichai说，这是Google搜索框25年来最大升级。因为搜索不再只是”搜答案”，而是开始”生成执行结果”。

比如用户问：”黑洞如何影响时空？”以前搜索会给你十条蓝链，现在Google直接生成一个交互式可视化界面，你甚至可以拖动参数、实时观察变化。搜索开始变成实时生成式UI。

Google还把Agent正式塞进搜索。用户未来可以创建Information Agent，让它24小时后台监控信息，比如跟踪股票、监控租房、盯球鞋发售、观察行业动态、追踪价格变化。Agent会自己搜、自己总结、自己更新。

Google最恐怖的其实是生态

但整场发布会真正最危险的地方，其实不是模型，而是Google的生态。因为OpenAI现在最强的，是模型能力；但Google最强的，是入口。

搜索、Chrome、Android、YouTube、Gmail、Maps、Workspace……这些产品加起来，本身就是全球最大的互联网流量系统之一。而现在，Google正在把Gemini嵌入所有入口。

这意味着，别人还在想办法”获取用户”，Google已经开始直接给几十亿用户发Agent。这是完全不同的战争维度。

甚至连智能眼镜，Google也重新杀回来了。今年发布的Android XR眼镜，可以直接通过Gemini完成导航、下单、消息总结，用户甚至不用掏手机。

Google正在试图让Gemini变成未来所有设备背后的默认智能层。搜索是入口，Chrome是入口，手机是入口，眼镜也是入口。Gemini则开始变成背后的统一大脑。

AI行业开始进入”运营时代”

今年Google I/O还有个特别明显的信号：AI行业正在从”模型竞赛”，进入”运营竞赛”。过去两年，行业核心是”谁更聪明”；现在开始变成谁更稳定、谁更便宜、谁更能规模化、谁更能真正接管工作流。

Google今年资本支出预计高达1800亿~1900亿美元，第八代TPU开始拆成训练芯片和推理芯片。Google甚至公开强调：”我们要把最强AI，变成最便宜的AI。”这已经不是单纯的技术竞争，而是一次基础设施战争。

过去几年，大家一直在讨论：AI到底什么时候能真正”替人做事”。Google这次给出的答案是：现在。而且它不准备只做一个聊天机器人。它想做的是，一个全天候运行、跨应用协作、持续执行任务、存在于所有入口里的超级Agent系统。

Google迟到了。但现在，它终于开始全面开卷Agent。

📎 原文来源：谷歌I/O炸场：Agent时代正式开打，OpenAI最大对手回来了

2026年5月25日
Google DeepMind搞了个AI科研搭档，科学家要失业了？

Google DeepMind搞了个”AI科研搭档”

科学家做研究，最花时间的是啥？不是做实验，是”想假设”和”查文献”。一个靠谱的假设，往往要读几百篇论文、反复试错几个月甚至几年。Google DeepMind最近发布了一个叫Co-Scientist的多智能体系统，目标是让AI来干这件事。

这个系统基于Gemini构建，但跟普通的聊天机器人不一样。它不是你问它答，而是真的在”做科研”——生成假设、跟自己”讨论”、再去文献里找证据验证，然后反复迭代，直到假设站得住脚。

普通LLM的问题在于：它不确定时会瞎编，而且不会主动承认”这个结论有矛盾”。Co-Scientist的核心是，它能在多个专业智能体之间制造”争论”，让它们在讨论中发现逻辑漏洞，然后自己去文献里找证据修补。

三个步骤，模拟科学家的思考过程

Co-Scientist的运作分三个阶段：生成、讨论、验证。

生成阶段，系统会根据你给的研究方向，产生一批可能的假设。这些假设不是随机生成的，而是基于已有的科学文献和数据库。

讨论阶段最有意思。系统里有好几个”智能体”，每个扮演不同的角色——有的负责挑刺，有的负责找支持证据，有的负责检查逻辑一致性。它们会互相”吵架”，直到对某个假设达成一致意见。

验证阶段，系统会去查文献，看看这个假设跟已知的研究是否矛盾，有没有实验数据支持。如果有矛盾，它会回过头去修正假设，然后重新走一遍流程。

已经在用的场景

Google已经在跟Google Cloud和Google Labs合作，让研究人员试用这个系统。目前的反馈是，它在”假设筛选”这个环节特别有用——人类科学家往往靠直觉和经验来判断一个假设值不值得深究，但直觉会出错，经验有盲区。Co-Scientist能把这些假设结构化地过一遍，帮人更快地找到值得深挖的方向。

特别值得关注的是，Google正在把它应用到ALS（肌萎缩侧索硬化症）的疗法开发，还有衰老研究。这两个领域都有一个共同点：数据极其复杂，变量极多，人类研究者很难把所有线索串起来。AI的优势正好在这里——它能同时处理海量文献，发现人眼看不到的模式。

下一步是跟实验自动化打通

现在的Co-Scientist还停留在”纸上谈兵”阶段——它能生成和验证假设，但验证完了，还得人类去做实验。Google的下一步计划，是把这个系统跟实验自动化系统整合起来，让AI生成的假设能直接在实验室里被验证。

如果这一步实现了，科研的效率提升会是数量级的。现在从一个假设到发表论文，往往要几年。如果假设生成、验证、实验、数据分析全都能由AI加速，可能几个月就能走完。

当然，这里有个绕不开的问题：AI生成的假设，如果连人类都理解不了为啥它对，那还敢不敢照着做实验？这个问题，可能比技术本身更难回答。

📎 原文来源：Co-Scientist: A multi-agent AI partner to accelerate research

2026年5月25日
Anthropic拿到300亿美元，估值冲破9000亿

Anthropic拿到300亿美元，估值冲破9000亿

今天AI圈被一条消息刷屏了——Anthropic正在完成一轮300亿美元的融资，估值超过9000亿美元。要知道，就在今年2月，Anthropic的估值还是3800亿美元。不到三个月，直接翻倍。

这轮融资由红杉、Dragoneer、Greenoaks和Altimeter联合领投，预计本周内就能完成交割。如果按上限估值落地，Anthropic将首次超过OpenAI在2026年3月创下的8520亿美元估值，成为AI赛道新的估值王者。

Anthropic的估值暴涨不是靠”讲故事”。他们刚刚披露，2026年第二季度营收预计达到109亿美元，相比第一季度的48亿美元增长了130%，而且首次实现季度运营盈利。投资者看中的不是概念，是真金白银的营收增长。

钱从哪里来，花到哪里去

你可能好奇，Anthropic哪来这么多钱烧？答案在SpaceX的IPO招股书里。Anthropic跟SpaceX签了一份算力合同，每月支付12.5亿美元，一直持续到2029年5月，总价值450亿美元。

光是给SpaceX的算力费，一年就是150亿美元。加上训练模型、养团队、建数据中心，300亿美元其实撑不了太久。但投资者愿意买单，是因为他们相信Anthropic能在18个月内把年营收做到500亿美元以上。

有意思的是，Anthropic还在跟微软谈，打算用微软定制的Maia 200 AI芯片来跑Claude。加上已经合作的英伟达、AWS Trainium、谷歌TPU、SpaceX算力，Anthropic成了行业里第一个实现多芯片供应商布局的前沿AI实验室。

教皇也来站台

今天还有一个挺有意思的新闻。教皇良十四世发布了一份关于AI的通谕《Magnifica Humanitas（卓越人性）》，发布仪式上站在他旁边的，是Anthropic的联合创始人Christopher Olah。

这份通谕的核心是说”人工智能时代要保护人的尊严”。选在《新事（Rerum Novarum）》发布135周年的日子签署，故意把AI类比为”第二次工业革命”。梵蒂冈没有选谷歌或者OpenAI，而是跟Anthropic同台，这个信号挺明确的——在AI安全这件事上，梵蒂冈把Anthropic视为最可信的合作伙伴。

OpenAI那边也没闲着

这边Anthropic融资如火如荼，OpenAI也没闲着。他们已经准备向美国SEC提交保密的S-1文件，预计2026年第四季度或者2027年初正式上市。

两大AI实验室，一个刚拿完钱、估值冲上云端，一个准备上市、接受公开市场检验。2026年的AI赛道，已经从”谁能做出更好的模型”变成了”谁能先把AI变成一门赚钱的生意”。

从目前的财务数据看，Anthropic暂时领先半个身位。但OpenAI有微软背书、有GPT的生态粘性，上市之后的融资能力不容小觑。这场仗，才刚刚开始。

📎 原文来源：AI News Today (May 25, 2026): Top AI Stories & Headlines

2026年5月25日

分类： AI资讯

从”搜索工具”到”科研搭档”，这步跨得挺大

它到底强在哪？不是参数多，是”会自己纠偏”

瞄准的是哪些科研领域？生物学、化学，还有那些”人类搞了几十年还没搞明白”的难题

跟OpenAI证明数学猜想那件事，其实是同一个信号

35小时、1000次工具调用，它真顶得住？

编程、办公、长任务，一个都不放过

已经在阿里云上百炼上线，还能跑在Claude Code上

国产大模型，这次真的在拼”实用”了

谷歌搜索终于动手了，25年来最大的一次改版

“10条蓝链”死了

SEO行业炸了

谷歌为什么要这么做

对普通用户意味着什么

Anthropic拿到300亿美元，估值飙到9000亿

谁在投？

卡帕西加入了

教皇也来站台

OpenAI这边在干嘛

1万亿美元估值，地球上还没几家公司做到

一个障碍刚被扫清：马斯克输了官司

上市对普通开发者的意义

钱从哪来？

估值竞赛：Anthropic vs OpenAI

一个有趣的转折

AI智能体有了”游戏规则”

四大举措，既划红线又给空间

权限边界：谁来决策？

70%普及率目标，智能体要进千家万户

对行业意味着什么？

Google I/O 2026：从聊天机器人到数字分身

Gemini Spark：你的24小时数字分身

Gemini 3.5 Flash：把Agent成本打下来

Antigravity 2.0：93个Agent协作搭建操作系统

搜索彻底变了：从链接到执行结果

Google最恐怖的其实是生态

AI行业开始进入”运营时代”

Google DeepMind搞了个”AI科研搭档”

三个步骤，模拟科学家的思考过程

已经在用的场景

下一步是跟实验自动化打通

Anthropic拿到300亿美元，估值冲破9000亿

钱从哪里来，花到哪里去

教皇也来站台

OpenAI那边也没闲着