分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • Google DeepMind憋了个大招:AI不再只陪你聊天,开始帮你搞科研了

    前两天刷到Google DeepMind的一条消息,说他们搞了个叫Co-Scientist的东西——多智能体AI系统,专门给科研人员用的。我第一反应是:又来一个”AI助力科研”的PPT项目?但仔细看完,发现这次有点不一样。

    Google DeepMind Co-Scientist AI系统
    Co-Scientist:基于Gemini构建的多智能体科研助手

    从”搜索工具”到”科研搭档”,这步跨得挺大

    以往AI在科研里的角色,说白了就是个高级搜索引擎——你问它”XXX领域有什么进展”,它给你列一堆文献摘要,然后你自己去啃。

    Co-Scientist想做的事不一样。它的定位是:假设生成、讨论、验证的协同伙伴。核心架构是”生成-讨论-验证”三阶段,多个AI智能体互相抬杠、互相验证,最后给你一个它觉得靠谱的假设方向。

    传统科研里,一个有价值的研究假设,往往需要研究者花几个月甚至几年去打磨。Co-Scientist的目标,是把这个”灵感孵化”的过程,压缩到几天甚至几个小时。

    它到底强在哪?不是参数多,是”会自己纠偏”

    DeepMind在介绍里特意强调了一点:Co-Scientist强化了准确引用专业文献自我修正逻辑矛盾的能力。

    这话什么意思?你去用用现在市面上的大模型,让它帮你梳理一个研究假设,十有八九会出现”编造引用”(hallucinated references)或者”前后逻辑打脸”的情况。Co-Scientist针对这个痛点做了强化,目标是让AI在科研场景里不乱说话

    当然,现在它还处在实验性开放阶段,主要面向研究机构,不是你我去网页上就能白嫖的。但它透露出的方向很明确:AI不再只是”知识的搬运工”,而是开始涉足”知识的创造过程”。


    瞄准的是哪些科研领域?生物学、化学,还有那些”人类搞了几十年还没搞明白”的难题

    DeepMind在展望里点名了几个方向:

    • ALS(肌萎缩侧索硬化症)治疗:这个病折腾了科学界几十年,AI能不能帮忙找到新的药物靶点或者治疗路径?Co-Scientist想试试。
    • 衰老研究:衰老机制极其复杂,假设空间巨大,人工筛选成本极高。AI介入后,可能会开辟一些人类研究者还没想到的角度。
    • 化学分子设计:新药物、新材料的分子结构搜索,本质上是超高维空间的探索问题,AI”生成-验证”的循环在这里很有优势。

    未来DeepMind还打算把Co-Scientist跟实验自动化系统整合起来。到那时候,AI不只是帮你”想”,还能指挥实验室里的机器人去”做”,再把结果喂回来继续迭代。这个闭环一旦跑通,科研效率的跃升会是数量级的。

    跟OpenAI证明数学猜想那件事,其实是同一个信号

    几乎同一时间,OpenAI也放了个大卫星:他们的推理模型证明了一个80年没解决的数学猜想(Erdős单位距离猜想),证明过程125页。

    这两件事放在一起看,信号就很清楚了:2026年的AI,已经从”帮我总结一下”进化到”帮我证明/帮我发现”了。这不是简单的参数堆砌,而是推理能力、文献理解、逻辑自洽性这几件事同时到了一个临界点。

    科研人员如果还在把AI当”高级搜索引擎”用,可能真的有点亏了。下一步值得关注的,是这些科研AI智能体能不能真正加速重大发现,而不只是在已有假设上修修补补。

  • 阿里千问又放大招:Qwen3.7-Max能让AI连干35小时不卡壳

    前几天刷到一条消息,阿里千问偷偷把Qwen3.7-Max放出来了。说实话,这次更新有点东西,不是那种换汤不换药的版本号游戏。

    Qwen3.7-Max模型架构图
    Qwen3.7-Max:阿里千问新一代全能智能体基座

    35小时、1000次工具调用,它真顶得住?

    最让我意外的一个测试数据:Qwen3.7-Max在一次实验里连续跑了35个小时,调用了超过1000次外部工具,整个过程没有崩、没有逻辑断链、没有出现”我不理解你的请求”这类废话。

    这是什么概念?你去问问任何一个用过AI辅助编程的朋友,大多数模型在复杂多步任务里,撑个两三个小时就开始”幻觉叠加”、前后矛盾、或者干脆装死。Qwen3.7-Max这个表现,说明它在长上下文推理多轮工具调用这两个硬骨头上,确实啃下来了。

    “全能智能体基座”——阿里的定位很明确,不是做一个只会聊天的模型,而是做一个能陪你把事情干完的底层引擎。

    编程、办公、长任务,一个都不放过

    Qwen3.7-Max现在的覆盖范围挺全的:

    • 编程场景:从前端原型到复杂多文件工程,它都能接。这意味着你可以用它来重构代码库、跨文件修Bug、甚至帮你从零搭一个项目的骨架。
    • 办公生产力:多智能体协作 + 工作流自动化。说白了,它不只是帮你写邮件,而是能理解你的业务流程,然后自己跑去调用各种工具把活干完。
    • 长周期任务:这才是真正的门槛。35小时不间断,意味着它可以陪你跑完一个完整的软件发布周期,或者帮你盯一个持续集成流水线的全部过程。

    已经在阿里云上百炼上线,还能跑在Claude Code上

    有一点挺关键的:Qwen3.7-Max不是只给千问App用户玩的,它已经接进了阿里云百炼平台,开发者可以直接调用API。

    更值得注意的是,它宣称支持跨框架泛化——能在Claude Code、OpenClaw、Qwen Code等多个开发框架里稳定运行。这话听着有点狂,但如果真的能做到,那意味着阿里的模型在”兼容性”这件事上,开始认真跟Anthropic和OpenAI掰手腕了。

    用户现在可以把千问App更新到6.9.7以上版本,在应用里直接切换到Qwen3.7-Max。PC端和网页端也同步开放了。

    国产大模型,这次真的在拼”实用”了

    回过头看,2026年这几个月,国产大模型的节奏明显变了。以前大家比的是”我有多少参数””我在哪个榜单上刷了第一”,现在比的更多是:你的模型到底能不能帮用户把活干完?

    Qwen3.7-Max打的就是这个痛点。35小时工具调用不掉链子,这件事本身就是一个很强的信号:长周期Agentic任务,不再只是PPT上的概念,而是有模型真的在往这个方向死磕。

    至于它能不能真的在实际生产环境里顶住,还得看接下来几个月开发者的反馈。但至少从目前已经放出来的信息看,阿里千问这一步,走得不虚。

  • 谷歌搜索25年来最大改版:10条蓝链终结

    谷歌搜索终于动手了,25年来最大的一次改版

    用了25年的谷歌搜索,这回真的变了。不是小修小补,是把底层逻辑给重构了。

    你现在在谷歌搜索框里输入一个复杂问题——比如”比较过去20年主要经济体的碳排放趋势和GDP增速的关系”——出来的不再是一串蓝色链接让你自己点进去找答案,而是直接生成一个可交互的图表,数据整合了全网多个来源,你可以在搜索结果页直接操作这个图表。

    谷歌搜索产品副总裁Robby Stein表示,这次升级的核心目标是适应用户搜索行为的变化:人们现在问的问题更长、更复杂,整个互联网往往没有现成的完整答案。

    “10条蓝链”死了

    从1998年谷歌成立到现在,”10条蓝色链接”的搜索结果模式基本没变过。用户输入关键词,谷歌返回一串链接,用户自己点进去找答案。这个模式现在正式宣告终结。

    新版本的搜索结果页可以直接生成定制可视化内容、交互图表、甚至迷你应用。你问”怎么规划一次去日本的3周行程”,搜索结果页直接给你出一个可交互的行程规划器,而不是让你自己去点15个旅行博客。

    SEO行业炸了

    这个变化对SEO从业者来说是个地震级事件。过去20年,SEO的核心逻辑是”让我的链接排在前面,让用户点进来”。现在用户可能在搜索结果页直接拿到了答案,根本不会点你的链接。

    新的优化方向是让自家内容被谷歌的AI概览(AI Overviews)引用。你的内容不需要被用户点击,但需要被AI在生成答案时引用为来源。这是两套完全不同的优化逻辑。


    谷歌为什么要这么做

    背后的推动力很简单:ChatGPT、Perplexity这些AI搜索工具正在吃掉谷歌的午餐。用户发现,有些问题直接问AI比在谷歌上点10个链接效率高得多。

    谷歌的选择是:如果打不过,就把自己变成AI搜索平台。它有足够的优势——拥有YouTube、Gmail、安卓等30亿日活产品,这些数据喂给AI搜索的质量是任何竞争对手都比不了的。

    今年I/O大会上谷歌没有发布对标Claude Mythos的超级模型,而是推了更快更便宜的Gemini 3.5 Flash。CEO皮查伊的战略很明确:不跟Anthropic和OpenAI比基准测试分数,而是把足够好的模型铺到尽可能多的用户产品里。

    对普通用户意味着什么

    短期来看是好事。搜索体验确实会变好,尤其是那些需要整合多个信息源才能回答的复杂问题。你不用再开10个标签页来回切换了。

    长期的影响还不好说。如果所有人都不点链接了,靠流量生存的那些网站(媒体、博客、论坛)的商业模式会受到严重冲击。互联网的内容生产机制可能因为这次改版而发生结构性变化。

  • Anthropic拿到300亿美元,估值飙到9000亿

    Anthropic拿到300亿美元,估值飙到9000亿

    这周AI圈最炸的新闻,是Anthropic正在敲定一笔最高300亿美元的融资,估值直接干到9000亿美元以上。完成后,它将正式把OpenAI从”全球最有价值AI公司”的宝座上拉下来——要知道OpenAI今年3月的估值才8520亿美元。

    更夸张的是,这家公司今年2月的估值还只有3800亿美元。不到4个月,估值直接翻倍。背后支撑这个数字是真金白银的营收:Anthropic预计2026年Q2营收达到109亿美元,比Q1的48亿美元增长了130%。换句话说,它第一次实现了季度运营盈利。

    Anthropic Q2 2026营收预计109亿美元,较Q1增长130%,首次实现季度运营盈利。投资机构看好其18个月内年营收突破500亿美元。

    谁在投?

    这一轮由红杉、Dragoneer、Greenoaks、Altimeter联合领投。这些名字在硅谷创投圈都是顶级玩家,他们下注的逻辑很简单:Anthropic的Claude模型在企业市场打得OpenAI有点招架不住,而且Anthropic的安全叙事在监管趋严的大环境下反而成了竞争优势。

    还有一个细节值得玩味:SpaceX的IPO招股书里披露,Anthropic将向SpaceX支付每月12.5亿美元的GPU算力费用,2029年5月前总计450亿美元。马斯克一边公开怼Anthropic,一边自己的公司收着Anthropic的算力支票,这个画面有点意思。

    卡帕西加入了

    融资消息之外,另一个信号是Andrej Karpathy宣布加入Anthropic,负责重建预训练研究团队。作为OpenAI联合创始人、前特斯拉自动驾驶负责人,Karpathy在AI研究圈的分量不用多说。他的去向本身就是对Anthropic研究方向的背书。


    教皇也来站台

    更有意思的是,教皇良十四世发布了首份AI通谕《Magnifica Humanitas(壮丽的人类)》,主题是在AI时代保护人类个体尊严。这份通谕由Anthropic联合创始人Christopher Olah共同发布。教皇选择跟Anthropic合作而不是谷歌或OpenAI,释放的信号很明确:梵蒂冈认可Anthropic的AI安全理念。

    这件事的象征意义大于实际影响,但对于一家AI公司来说,被天主教会选为AI伦理的对话伙伴,在品牌层面是相当大的加分项。

    OpenAI这边在干嘛

    就在Anthropic融资消息刷屏的同时,OpenAI向SEC提交了保密的IPO申请(S-1文件),计划在2026年Q4到2027年初上市。两家公司的路径开始分化:Anthropic在一级市场拿钱拿到手软,OpenAI则准备去公开市场接受考验。

    不过OpenAI也不是没有动作。据报道,五角大楼正在测试OpenAI和谷歌的模型,考虑把它们加入到涉密工作流中。此前Anthropic因为是国防部首选AI供应商,但今年初Anthropic因为伦理原因拒绝了一份国防部合同,于是五角大楼开始找备选方案。

  • OpenAI要上市了,估值1万亿美元,这数字什么概念?

    OpenAI这次是真的要上市了。据多家媒体报道,他们这周就要向美国证监会(SEC)秘密提交IPO招股书,目标是在2026年9月完成公开上市,估值可能超过1万亿美元。

    OpenAI IPO Plan
    OpenAI IPO计划引发业界关注(图源:opentools.ai)

    1万亿美元估值,地球上还没几家公司做到

    目前私营阶段OpenAI的最新估值是8520亿美元,这是历史最大规模的私募融资轮。如果IPO估值真的冲到1万亿美元以上,OpenAI将成为人类历史上规模最大的IPO之一,超过沙特阿美石油公司2019年创下的2560亿美元纪录(按市值算)。

    问题是,OpenAI现在还在亏钱。截至2026年2月,他们的年化营收是250亿美元,用户周活9亿,但这些数字背后的成本是惊人的——算力、人才、数据中心,每一个都是吞金兽。

    OpenAI给投资者的故事是:我们拥有高端模型护城河。但问题是,中国出来的低成本模型正在吃掉这个护城河——人家能做到你90%的能力,价格却只有几分之一。

    一个障碍刚被扫清:马斯克输了官司

    数日前,马斯克针对OpenAI的诉讼被陪审团裁定「诉讼时效过期」而驳回。这场官司折腾了快两年,马斯克声称OpenAI背离了最初的非营利使命,要求法院阻止其转为营利性公司。

    官司没了,OpenAI上市最大的法律障碍就消失了。与此同时,Anthropic也在准备IPO,估值谈到了9000亿美元,原本计划10月上市。但现在OpenAI抢跑,预测市场显示OpenAI先于Anthropic上市的概率从32%飙到83%。

    上市对普通开发者的意义

    如果你是靠OpenAI API吃饭的开发者,这件事跟你有关。上市公司面临季度财报压力,大概率会推动API涨价,或者把更多资源向企业级用户倾斜。

    OpenAI已经推出了「Guaranteed Capacity(容量保障)」计划,释放的信号很明确:想获得稳定算力?签多年合同。中小开发者如果只靠按量付费,未来可能只能拿到剩余算力配额。


    一个有趣的花絮:CEO Sam Altman在IPO申请前夕,突然宣布向所有Y Combinator当前批次的初创公司提供200万美元的OpenAI API额度,条件是换取对方股权。这操作被外界解读为:在上市前的监管审视期,先锁定一批未来的需求方。至于这是不是违反YC条款或者OpenAI自己的利益冲突政策,目前还没人说清楚。

    不管怎样,AI行业从私募资本主导转向公开市场的时代,算是正式开始了。

  • Anthropic要盈利了,AI烧钱的时代真的结束了?

    这话还得从Anthropic最新泄露的财务数据说起。2026年第二季度,这家公司的营收预计冲到109亿美元——什么概念?比去年同期的几亿美元翻了不知道多少倍,而且这季度还要首次实现运营盈利,大概5.59亿美元。

    Anthropic CEO Dario Amodei
    Anthropic CEO Dario Amodei(图源:CNBC)

    钱从哪来?

    核心答案就两个字:Claude。准确说,是Claude Code——他们的编程助手产品。这款东西的年化营收已经跑到25亿美元了,而且第一季度营收同比增幅是80倍,你没看错,80倍。

    企业和开发者对Claude的需求暴涨,直接导致Anthropic的基础设施绷不住了。公司自己在4月承认,算力”不可避免的紧张”,然后赶紧签了一堆算力采购协议。其中最夸张的是跟SpaceX签的那个——租下SpaceX在孟菲斯的Colossus 1数据中心全部算力,每个月付12.5亿美元,合同签到2029年5月,总金额450亿美元。

    450亿美元,这是目前AI行业公开的最大算力采购合同,没有之一。

    估值竞赛:Anthropic vs OpenAI

    Anthropic现在正在谈新一轮融资,投后估值预计9000亿美元。而它的老对手OpenAI最新私募估值大概是8500亿美元。这两家原本是一家人——Anthropic是2021年从OpenAI出走的高管和研究人员创立的,原因是对OpenAI的发展方向不满。

    现在两家还在赛跑另一个东西:IPO。Anthropic之前说考虑2026年上市,OpenAI更激进,据说这周就要秘密提交IPO招股书,目标9月公开上市,估值可能超过1万亿美元。

    一个有趣的转折

    Anthropic之前因为拒绝向美国军方开放所有合法用途的模型访问权限,被美国国防部拉黑了。结果4月他们推出了一个具备高级网络安全能力的Claude Mythos Preview模型,然后国防部那边又说”有可能”合作了。特朗普4月还公开表示支持,这事儿就这么戏剧性地反转了。


    回头看,Anthropic这个故事最有意思的地方在于:它证明了一件事,做AI基础模型不一定非要一直烧钱,只要产品找对了方向,企业级市场是愿意买单的。Claude Code这25亿美元的年化营收就是最好的证据。

    当然,代价是每个月要付SpaceX 12.5亿美元的算力账单。这生意到底划不划算,可能得等IPO之后看财报才知道。

  • 三部门发文规范AI智能体:70%普及率目标背后的信号

    AI智能体有了”游戏规则”

    既要求智能体的安全规范,又推动智能体创新发展。近日,国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》,这份文件给正在狂飙的AI Agent行业,立了一套清晰的游戏规则。

    智能体是啥?文件给了一个清晰的定义:具备自主感知、记忆、决策、交互与执行能力的智能系统。随着大模型等新一代人工智能技术迅猛发展,智能体正加速与网络空间、物理世界深度融合,深刻改变人类生产生活方式和社会治理模式。

    这份《意见》其实在回答一个核心问题:当AI开始替人做决策、执行任务,边界到底在哪里?

    四大举措,既划红线又给空间

    《意见》明确智能体发展要坚持安全可控、规范有序、创新驱动、应用牵引四大基本原则,并提出了4个方面的重要举措:

    一是夯实发展基础。完善技术底座,构建标准协议。这意味着国家层面会推动智能体相关的技术标准、通信协议、评价体系等基础设施的建设。

    二是守牢安全底线。明确产品准则,防范安全风险,完善治理体系,强化行业自律。智能体如果乱用、滥用,风险不小——比如自主决策导致经济损失、隐私泄露、甚至物理世界的伤害(如果是机器人智能体)。

    三是强化应用牵引。围绕科学研究、产业发展、提振消费、民生福祉、社会治理等方向,提出19个典型应用场景。国家不仅在管,更在推——给智能体找真实场景、落地产值。

    四是建设创新生态。促进产业合作,强化应用推广。智能体不是一家公司在做的,需要整个产业链协同。

    权限边界:谁来决策?

    对于智能体接管工作后的权限和边界,《意见》提出了一个很关键的要求:在遵守法律法规、尊重社会公德和伦理规范前提下,厘清三类决策方式的合理边界及所需权限:

    • 仅限用户本人决策——涉及重大利益、人身安全的,必须人来做最终决定
    • 需由用户授权决策——AI可以建议、可以执行,但关键节点要让人确认
    • 智能体自主决策——低风险、高频、规则清晰的,可以让AI自己跑

    这个划分其实非常务实。智能体不是要完全取代人,而是要在合适的边界内,最大化释放自动化价值。


    70%普及率目标,智能体要进千家万户

    《意见》支持落实新一代智能终端、智能体等应用普及率超70%的阶段性目标。这个数字很有意思——70%的普及率,意味着智能体要从”科技圈炒作概念”,变成”普通人也天天在用”的真实基础设施。

    对比一下:智能手机在中国的普及率大概是80%左右。也就是说,国家把智能体的战略地位,放到了和智能手机类似的量级。

    要达到70%普及率,光靠ToB的企业市场肯定不够,必须进入ToC消费场景——比如手机里的AI助手、家里的智能管家、车里的智能座舱、甚至是穿戴设备上的AI Agent。

    三部门联合发文,释放的信号非常明确:智能体不是”野生的”、不是”法外之地”,但国家也不想一管就死。规范和创新,要并举。

    对行业意味着什么?

    这份文件对AI智能体行业的影响,可能比很多人想象的更深远:

    对大模型公司来说,光有模型能力不够了,得想清楚智能体的安全边界怎么设计、用户授权机制怎么做、决策日志怎么留痕。

    对应用开发来说,19个典型应用场景相当于国家帮你想好了”往哪发力”——科研、产业、消费、民生、治理,都是真金白银的投入方向。

    对投资人来说,70%普及率目标是一个清晰的市场信号——智能体不是短期风口,而是中长期的国家战略方向。

    过去两年,AI行业讨论最多的是”谁的模型更聪明”。但智能体这个赛道,比的不是Benchmark分数,而是谁更懂场景、谁更安全可信、谁能让用户放心把任务交出去。

    这份《意见》,算是给这个竞争维度,正式按下了加速键。

  • Google I/O 2026:Agent时代正式开启,OpenAI最大对手回来了

    Google I/O 2026:从聊天机器人到数字分身

    过去几年Google I/O的主角,通常是某个模型、某个参数量、某个Benchmark。但今年不一样。整场两个多小时发布会,Google其实只反复讲了一件事:Agent。

    不是聊天机器人,不是”帮你回答问题”的AI,而是真正开始替用户持续执行任务的AI Agent。Google想做的,是把Gemini从一个App,彻底变成Google所有入口背后的操作系统。

    Google I/O 2026发布会
    Google I/O 2026全面押注AI Agent(图源:谷歌)

    Gemini Spark:你的24小时数字分身

    这次发布会上,Google几乎把整个产品体系全部Agent化了。最核心的新产品,是Gemini Spark。你可以把它理解成Google版”全天候数字分身”。它运行在Google Cloud虚拟机上,7×24小时在线。即便你关掉电脑、合上手机,它依然会在后台继续工作。

    Google现场演示了一个典型场景:用户正在组织社区派对,Spark会自动汇总邮件回复、统计每个人带什么东西、追踪谁还没确认、生成提醒邮件、同步Google Sheets,再自动做一份Google Slides宣传页,整个过程几乎不需要用户手动操作。

    Gemini Spark本质上正在把Agent从”问答工具”,变成”长期运行的执行系统”。过去的大模型,更像即时响应;现在的Agent,则开始拥有持续状态、任务记忆和跨应用执行能力。

    Gemini 3.5 Flash:把Agent成本打下来

    Agent最大的难点,从来都不只是能力,而是成本。因为Agent实在太烧Token了。Google披露的数据非常夸张:目前Google自家产品每月处理的Token,已经达到3200万亿个,同比增长7倍。

    于是,Gemini 3.5 Flash出现了。这可能是今年Google最关键的模型。因为它不再单纯强调”最强”,而是开始强调”最适合跑Agent”。Pichai现场直接算了一笔账:如果一家头部企业每天处理1万亿Token,把80%的工作负载从其它前沿模型迁移到Gemini 3.5 Flash,一年能省超过10亿美元。

    性能接近顶级前沿模型,输出速度快4倍,而成本只有同类模型的一半甚至更低。Google现在反复强调一句话:”你不需要再在质量和速度之间二选一。”因为Agent时代,比拼的已经不是一次回答,而是持续运行能力。

    Antigravity 2.0:93个Agent协作搭建操作系统

    如果说Flash负责”让Agent更便宜”,那Antigravity 2.0负责的,就是”让Agent真正开始干活”。它原本只是个AI Coding工具,现在Google直接把它升级成了多Agent协作平台。

    开发者可以同时调度多个Agent:一个写代码,一个生成设计素材,一个规划产品架构,一个测试漏洞,一个修Bug。Google现场甚至演示了一个极其夸张的案例:93个Agent并行协作,从零开始搭建一个可运行的操作系统。

    整个过程持续12小时,处理26亿Token,最终居然真的跑起来了,甚至还能运行Doom。而整个API成本不到1000美元。Google显然是在正面硬刚Claude Code和Codex。

    搜索彻底变了:从链接到执行结果

    Google这次还对搜索动了最大的一刀。Pichai说,这是Google搜索框25年来最大升级。因为搜索不再只是”搜答案”,而是开始”生成执行结果”。

    比如用户问:”黑洞如何影响时空?”以前搜索会给你十条蓝链,现在Google直接生成一个交互式可视化界面,你甚至可以拖动参数、实时观察变化。搜索开始变成实时生成式UI。

    Google还把Agent正式塞进搜索。用户未来可以创建Information Agent,让它24小时后台监控信息,比如跟踪股票、监控租房、盯球鞋发售、观察行业动态、追踪价格变化。Agent会自己搜、自己总结、自己更新。


    Google最恐怖的其实是生态

    但整场发布会真正最危险的地方,其实不是模型,而是Google的生态。因为OpenAI现在最强的,是模型能力;但Google最强的,是入口。

    搜索、Chrome、Android、YouTube、Gmail、Maps、Workspace……这些产品加起来,本身就是全球最大的互联网流量系统之一。而现在,Google正在把Gemini嵌入所有入口。

    这意味着,别人还在想办法”获取用户”,Google已经开始直接给几十亿用户发Agent。这是完全不同的战争维度。

    甚至连智能眼镜,Google也重新杀回来了。今年发布的Android XR眼镜,可以直接通过Gemini完成导航、下单、消息总结,用户甚至不用掏手机。

    Google正在试图让Gemini变成未来所有设备背后的默认智能层。搜索是入口,Chrome是入口,手机是入口,眼镜也是入口。Gemini则开始变成背后的统一大脑。

    AI行业开始进入”运营时代”

    今年Google I/O还有个特别明显的信号:AI行业正在从”模型竞赛”,进入”运营竞赛”。过去两年,行业核心是”谁更聪明”;现在开始变成谁更稳定、谁更便宜、谁更能规模化、谁更能真正接管工作流。

    Google今年资本支出预计高达1800亿~1900亿美元,第八代TPU开始拆成训练芯片和推理芯片。Google甚至公开强调:”我们要把最强AI,变成最便宜的AI。”这已经不是单纯的技术竞争,而是一次基础设施战争。


    过去几年,大家一直在讨论:AI到底什么时候能真正”替人做事”。Google这次给出的答案是:现在。而且它不准备只做一个聊天机器人。它想做的是,一个全天候运行、跨应用协作、持续执行任务、存在于所有入口里的超级Agent系统。

    Google迟到了。但现在,它终于开始全面开卷Agent。

  • Google DeepMind搞了个AI科研搭档,科学家要失业了?

    Google DeepMind搞了个”AI科研搭档”

    科学家做研究,最花时间的是啥?不是做实验,是”想假设”和”查文献”。一个靠谱的假设,往往要读几百篇论文、反复试错几个月甚至几年。Google DeepMind最近发布了一个叫Co-Scientist的多智能体系统,目标是让AI来干这件事。

    这个系统基于Gemini构建,但跟普通的聊天机器人不一样。它不是你问它答,而是真的在”做科研”——生成假设、跟自己”讨论”、再去文献里找证据验证,然后反复迭代,直到假设站得住脚。

    普通LLM的问题在于:它不确定时会瞎编,而且不会主动承认”这个结论有矛盾”。Co-Scientist的核心是,它能在多个专业智能体之间制造”争论”,让它们在讨论中发现逻辑漏洞,然后自己去文献里找证据修补。

    三个步骤,模拟科学家的思考过程

    Co-Scientist的运作分三个阶段:生成、讨论、验证。

    生成阶段,系统会根据你给的研究方向,产生一批可能的假设。这些假设不是随机生成的,而是基于已有的科学文献和数据库。

    讨论阶段最有意思。系统里有好几个”智能体”,每个扮演不同的角色——有的负责挑刺,有的负责找支持证据,有的负责检查逻辑一致性。它们会互相”吵架”,直到对某个假设达成一致意见。

    验证阶段,系统会去查文献,看看这个假设跟已知的研究是否矛盾,有没有实验数据支持。如果有矛盾,它会回过头去修正假设,然后重新走一遍流程。

    已经在用的场景

    Google已经在跟Google Cloud和Google Labs合作,让研究人员试用这个系统。目前的反馈是,它在”假设筛选”这个环节特别有用——人类科学家往往靠直觉和经验来判断一个假设值不值得深究,但直觉会出错,经验有盲区。Co-Scientist能把这些假设结构化地过一遍,帮人更快地找到值得深挖的方向。

    特别值得关注的是,Google正在把它应用到ALS(肌萎缩侧索硬化症)的疗法开发,还有衰老研究。这两个领域都有一个共同点:数据极其复杂,变量极多,人类研究者很难把所有线索串起来。AI的优势正好在这里——它能同时处理海量文献,发现人眼看不到的模式。

    下一步是跟实验自动化打通

    现在的Co-Scientist还停留在”纸上谈兵”阶段——它能生成和验证假设,但验证完了,还得人类去做实验。Google的下一步计划,是把这个系统跟实验自动化系统整合起来,让AI生成的假设能直接在实验室里被验证。

    如果这一步实现了,科研的效率提升会是数量级的。现在从一个假设到发表论文,往往要几年。如果假设生成、验证、实验、数据分析全都能由AI加速,可能几个月就能走完。

    当然,这里有个绕不开的问题:AI生成的假设,如果连人类都理解不了为啥它对,那还敢不敢照着做实验?这个问题,可能比技术本身更难回答。


  • Anthropic拿到300亿美元,估值冲破9000亿

    Anthropic拿到300亿美元,估值冲破9000亿

    今天AI圈被一条消息刷屏了——Anthropic正在完成一轮300亿美元的融资,估值超过9000亿美元。要知道,就在今年2月,Anthropic的估值还是3800亿美元。不到三个月,直接翻倍。

    这轮融资由红杉、Dragoneer、Greenoaks和Altimeter联合领投,预计本周内就能完成交割。如果按上限估值落地,Anthropic将首次超过OpenAI在2026年3月创下的8520亿美元估值,成为AI赛道新的估值王者。

    Anthropic的估值暴涨不是靠”讲故事”。他们刚刚披露,2026年第二季度营收预计达到109亿美元,相比第一季度的48亿美元增长了130%,而且首次实现季度运营盈利。投资者看中的不是概念,是真金白银的营收增长。

    钱从哪里来,花到哪里去

    你可能好奇,Anthropic哪来这么多钱烧?答案在SpaceX的IPO招股书里。Anthropic跟SpaceX签了一份算力合同,每月支付12.5亿美元,一直持续到2029年5月,总价值450亿美元。

    光是给SpaceX的算力费,一年就是150亿美元。加上训练模型、养团队、建数据中心,300亿美元其实撑不了太久。但投资者愿意买单,是因为他们相信Anthropic能在18个月内把年营收做到500亿美元以上。

    有意思的是,Anthropic还在跟微软谈,打算用微软定制的Maia 200 AI芯片来跑Claude。加上已经合作的英伟达、AWS Trainium、谷歌TPU、SpaceX算力,Anthropic成了行业里第一个实现多芯片供应商布局的前沿AI实验室。

    教皇也来站台

    今天还有一个挺有意思的新闻。教皇良十四世发布了一份关于AI的通谕《Magnifica Humanitas(卓越人性)》,发布仪式上站在他旁边的,是Anthropic的联合创始人Christopher Olah。

    这份通谕的核心是说”人工智能时代要保护人的尊严”。选在《新事(Rerum Novarum)》发布135周年的日子签署,故意把AI类比为”第二次工业革命”。梵蒂冈没有选谷歌或者OpenAI,而是跟Anthropic同台,这个信号挺明确的——在AI安全这件事上,梵蒂冈把Anthropic视为最可信的合作伙伴。

    OpenAI那边也没闲着

    这边Anthropic融资如火如荼,OpenAI也没闲着。他们已经准备向美国SEC提交保密的S-1文件,预计2026年第四季度或者2027年初正式上市。

    两大AI实验室,一个刚拿完钱、估值冲上云端,一个准备上市、接受公开市场检验。2026年的AI赛道,已经从”谁能做出更好的模型”变成了”谁能先把AI变成一门赚钱的生意”。

    从目前的财务数据看,Anthropic暂时领先半个身位。但OpenAI有微软背书、有GPT的生态粘性,上市之后的融资能力不容小觑。这场仗,才刚刚开始。