标签: AI智能体

  • AI智能体这事儿,终于从”能聊”变成”能干活”了

    AI智能体这事儿,终于从”能聊”变成”能干活”了

    2026年有个明显的变化,AI不再只是坐在那里跟你聊天、回答问题,而是开始真正动手干活。这个转折点是个叫OpenClaw(龙虾)的开源AI代理框架,它的出现让整个行业都坐不住了,百度、阿里巴巴、腾讯、字节、智谱、月之暗面这些巨头公司一下子全都冲了进来。

    就在这个节骨眼上,5月份国家网信办、国家发展改革委、工业和信息化部三家联合印发了《智能体规范应用与创新发展实施意见》,给这个新兴领域立了规矩。

    智能体到底是个啥?

    按官方说法,智能体是”具备自主感知、记忆、决策、交互与执行能力的智能系统”。说人话就是:以前的大模型像个只会纸上谈兵的军师,你问它啥它都能跟你掰扯半天,但真要它动手干活,它就傻眼了。

    现在的智能体不一样,它能看屏幕、点鼠标、自动执行任务。百度创始人李彦宏说得挺直白:”智能体出圈了,第一次,AI的主角不是模型,而是应用。过去几年竞争核心是模型能力,现在用户真正买单的是’你能不能帮我把事做完’。”

    衡量一个AI平台有没有戏,李彦宏提出要看DAA(日活智能体数),而不是DAU(日活用户数)。意思是,有多少Agent在给人类干活并交付结果,这才是真实的价值。

    技术底座:从”大脑”到”执行”

    要让智能体真正能干活,光有个”聪明的大脑”不够,还得有完整的感知、规划、执行、验证链路。月之暗面(Moonshot AI)的Kimi就是个典型例子,他们自研了大语言模型,总参数量达到1万亿,每次推理时激活约320亿参数,配备了384个细粒度领域专家。

    这个模型用了MLA多头潜在注意力机制,把显存占用降到了传统架构的1/8,还引入了多Token预测目标来提升生成效率。这些技术细节听着枯燥,但实际效果就是:智能体能处理更长、更复杂的任务,而且不容易”掉链子”。

    科研场景:从翻遍文献到一键出报告

    《实施意见》里列出了19个智能体典型应用场景,科学研究排在第一位。2025年7月,上海交通大学和深势科技推出了通用科研智能体”SciMaster”,这个东西能干嘛呢?

    你扔给它一个科学问题,比如”分子动力学在药物筛选中的典型流程是怎样的?”,它能把问题拆成多个子任务,全网搜文献、整合资讯、数据、论文、专利,最后给你生成一份能落地的深度调研报告。

    AI智能体科研应用
    AI智能体正在深度赋能科研场景

    在药物研发领域,智能体能把跨靶点的研究证据整合进知识图谱;在新材料领域,像电解液、固体电解质有机合成这些方向,也有智能体研发辅助产品。据湘汉智库的研究报告,智能体已经深度渗透材料化学、基因组生物信息、生物医学健康等核心科研领域。

    电商场景:”一句话点外卖”成真

    今年初,淘宝闪购跟千问智能体打通了。5月11日,千问与淘宝全面打通,这标志着全球超大规模电商平台与智能体应用的深度融合。

    现在你可以直接跟智能体说”帮我点杯咖啡,不加冰”、”两份米线,其中一份加辣不要豆芽”,它能自动识别你的意图、位置和偏好,然后推荐可下单的商品。这个合作已经覆盖了全国300多个地级市和超过3000个区县,品类涵盖餐饮外卖、超市便利、生鲜蔬果、鲜花绿植、医药健康、手机数码等等。

    有个挺有意思的细节:AI在帮忙选品时,还可能做出”劝退”动作。比如你试图让智能体买个”量子水杯”,它可能会直接给你科普一波,告诉你这玩意儿不靠谱。这种”反销售”功能,倒是挺接地气的。

    金融和教育:秒读财报、梳理文献

    以前券商研究员做行业研究,得泡在海量研报、财报、新闻里,翻遍资料,2-3天才能攒出一份初稿。现在把研究主题丢给Kimi,它立刻自动全网检索、逐页精读财报、提炼核心观点,一气呵成输出结构化分析草稿。原先2-3天的”苦活儿”,现在2-3小时就搞定。

    教育领域也是一样,文献”大山”一直是高校师生的头号痛点。现在只需一次对话,智能体就能一口气读完所有文献,自动完成分类归档、提炼核心观点,梳理出包含研究脉络、争议焦点、未来方向的完整综述框架。博士生过去要熬2-3周才能啃完的文献梳理,现在1-2天就能拿出初版,而且内容更全面、更系统。


    安全问题:智能体也需要”纠偏”

    智能体当然不是完美无缺的,”满嘴跑火车”的幻觉问题、决策跑偏、执行掉链子,都是行业面对的难题。为了给智能体”纠偏”,研发端从技术上打响了”精准纠错战”。

    深势科技的CTO廖若雪说得很实在:科学场景对于事实的准确性和推理的可溯源性要求极高。首先,智能体的知识需要是结构化的,而不是完全依赖模型去记忆知识;其次,智能体的推理过程也要通过特定算法进行置信度校验;此外还需强调验证,关键的科学论断不能只由智能体自行评估,得通过实际运行结果来验证结论是否真实。

    360 AI安全研究院最近发布了《AI安全系列报告》,指出随着智能体加速进入企业办公、研发、运维、客服等核心业务场景,AI安全的核心问题正在从”生成风险”转向”执行风险”。他们提出了两条解决路径:一是用AI加持传统安全防护,提高漏洞发现、入侵研判、样本分析和响应处置效率;二是让不确定性任务在安全约束下执行,让智能体可以做事,但不能越界。

    清华大学文科资深教授、苏世民书院院长薛澜认为,《实施意见》通过设定全链条安全要求,系统性预防智能体技术滥用、决策失控等风险,为智能体技术在全社会规模化应用建立必要的安全信任基础。

    写在最后

    智能体的崛起,既是技术迭代的必然,更是时代发展的趋势。这不是简单的技术升级,而是工作方式、商业逻辑、生活体验的全面重构。政策护航、技术成熟、场景落地,多重力量正推动智能体从行业探索走向深度赋能。

    根据《AI智能体赋能行业决策:趋势与实践白皮书(2026)》,智能体在制造、金融、政务等行业的渗透率已经超过50%。这个数字背后,是无数工作场景正在发生的真实变革。

  • 英伟达搞出AI PC专用芯片,要抢2000亿美元CPU市场

    英伟达最近又放了个大招,在台北电脑展上发布了一款专门给AI PC用的CPU芯片,名字叫RTX Spark,直接把消费级PC的算力拉到了1 petaflop(每秒千万亿次浮点运算),目标很明确:要抢总共2000亿美元的CPU市场份额。

    英伟达已联合华硕、戴尔、惠普、联想、微软Surface等厂商,首批产品定于2026年秋季开售。

    产品核心亮点

    这款芯片的核心定位是支持AI智能体安全高效运行,英伟达和微软专门合作开发了安全沙箱机制,能让OpenClaw、Hermes Agent这类AI智能体在本地安全运行,不用把所有数据都传到云端。同时芯片搭配的CPU、GPU、内存以及底层CUDA软件,都支持大语言模型本地化部署,现在已经有超过1000款游戏和应用支持RTX的AI功能了。

    英伟达CEO黄仁勋
    英伟达CEO黄仁勋(来源:TechCrunch)

    行业影响与挑战

    • 英伟达CEO黄仁勋表示,未来全球会出现数十亿个AI智能体,将带来海量CPU需求
    • 微软已推出搭载该芯片的Surface Laptop Ultra,称其为“有史以来最强大的Surface笔记本电脑”
    • 目前已有超过100家Windows软件厂商宣布支持RTX Spark芯片,覆盖Adobe、Blender、Riot Games等头部产品
    • 英伟达曾在2013年尝试推出ARM架构Windows设备,最终失败计提9亿美元减值,本次产品市场表现仍存不确定性

  • Anthropic悄悄交了IPO申请,Claude的东家要上市了

    最近AI圈又有大动静了——Claude背后的公司Anthropic,偷偷向美国SEC提交了IPO申请,准备上市了。这家成立才5年的公司,现在估值已经接近1万亿美元,算是AI赛道里最靠近公开市场的头部玩家之一。

    Anthropic刚完成65亿美元H轮融资,投后估值9650亿美元,上市筹备已进入实质阶段。

    从融资到IPO的节奏

    就在提交IPO申请前不到一周,Anthropic刚完成65亿美元的H轮融资,推动其估值达到9650亿美元。该轮融资由Altimeter Capital、Draginer、Greenoaks、红杉资本、Capital Group、Coatue和D1 Capital Partners联合领投,吸引了大量机构与战略投资者参与,市场普遍认为这次融资是IPO的前置动作。

    Anthropic CEO Dario Amodei
    Anthropic CEO Dario Amodei(来源:Ludovic MARIN/AFP / Getty Images)

    核心信息梳理

    • 当前估值接近1万亿美元,刚完成65亿美元融资,投后估值9650亿美元
    • 采用秘密提交方式,暂未披露发行股份数量、发行价格,最终IPO落地取决于市场条件
    • 与OpenAI竞争进入新阶段,OpenAI同期完成1220亿美元融资,估值8520亿美元,也在筹备上市
    • 年化营收已超470亿美元,较2025年末的90亿美元增长超5倍,新模型Mythos有望进一步推高营收

  • Meta 悄悄做了一款 AI 吊坠,想让 Reality Labs 不再每个季度亏 40 亿美元

    Meta 正在开发一款 AI 吊坠设备,计划明年开始测试。这个消息来自 The Information 看到的一份内部备忘录。简单来说,这就是一个可以别在衬衫上、或者当项链戴的小装置,核心功能是记录你的对话,然后由 AI 进行处理和回应。

    Meta AI 概念图
    Meta 的 AI 硬件野心不止于眼镜(图源:TechCrunch)

    这个设备的技术底子来自 Meta 在 2025 年底收购的 AI 可穿戴初创公司 Limitless。那家公司之前就在做几乎一样的东西——一个挂在脖子上的 AI 吊坠,持续录音,然后帮你整理记忆、提取待办、总结对话。Meta 当时说这笔收购是为了”加速 AI 可穿戴设备的开发”,现在看来,吊坠形态确实是他们想推的方向之一。

    AI 吊坠这个品类之前已经有很多公司试过,基本都没掀起什么水花。隐私顾虑、营销不走心,或者产品本身就没那么有用——原因可能是其中任何一个。

    Meta 的真实算盘

    这份备忘录还透露了两个配套动作:Meta 计划扩展 AI 眼镜产品线,同时推出一个名为 Wearables for Work 的企业订阅服务。把这几件事放在一起看,Meta 的意图相当明确——用硬件矩阵把 Reality Labs 从每个季度亏 40 亿美元的泥潭里拉出来。

    2026 年第一季度,Reality Labs 亏了 40 亿美元。这个数字已经不是新闻,而是某种常态。Meta 在 VR/AR 硬件上砸了超过 10 年,到现在还没看到真正的规模化盈利。AI 吊坠能不能改变这个局面?说实话,机会不大,但 Meta 也没有更好的选择了。


    AI 可穿戴这个赛道到底行不行

    吊坠形态有个天然优势:比眼镜门槛低。眼镜需要度数适配、外形接受度、社交压力,吊坠只要别在衣服上就行。但劣势也很明显——存在感太弱反而可能是个问题,用户凭什么要一直戴着它?

    OpenAI 也没放弃这个方向,说明大厂们普遍觉得”贴身 AI”是个值得押注的交互入口。只不过从产品史来看,记录一切对话这个卖点最容易卡在隐私上——你愿意让一个随时在录音的设备贴身戴着吗?这个问题 Limitless 没答对,Meta 也不一定行。

    • 设备形态:AI 吊坠,可别在衬衫或当项链佩戴
    • 技术来源:基于 2025 年收购的 Limitless 团队
    • 测试时间:最早 2027 年开始内部测试
    • 配套计划:扩展 AI 眼镜产品线 + Wearables for Work 企业订阅
    • 战略目标:扭转 Reality Labs 每季度 40 亿美元亏损
  • MIT TR 盘点:2026 年 AI 领域最值得关注的 10 件事

    MIT Technology Review 最近做了一件有意思的事——他们第一次把”当下 AI 领域最重要的事”整理成了一份清单。不是那种泛泛而谈的趋势预测,而是编辑团队基于多年追踪,认真挑出来的 10 个方向。

    这份清单里有些内容你可能已经耳熟能详,但也有几个方向,连很多业内人士都还没认真想过。挑几个最有意思的聊聊。

    人形机器人的”数据饥渴”

    训练大语言模型需要海量文本,那训练人形机器人需要什么?答案是:海量”人类动作视频”。现在已经有公司在专门搭建巨型”训练中心”,让工人重复完成各种任务,用摄像头把整个过程录下来。更夸张的是”提线木偶”模式——让海外陌生人通过远程操控的方式,实时”驾驶”机器人做各种动作,以此收集训练数据。

    这套打法有没有用,现在还不好说。但逻辑是通的:想让机器人学会”把杯子拿起来”,先得让它看几万遍人类是怎么拿杯子的。

    “世界模型”可能是下一个大突破

    大语言模型擅长处理文字,但要让 AI 真正理解物理世界,还需要别的东西。这就是”世界模型”(World Models)的由来——AI 公司希望构建能够理解外部物理世界的系统,而不只是预测下一个 token。

    如果世界模型取得成功,AI 将克服大语言模型的局限性,真正进入物理环境——而不只是停留在屏幕里和你聊天。

    AI 智能体开始”组队协作”了

    第一波 AI 智能体只能做单件任务——运行一个浏览器、写几行代码,而且各自为战。下一阶段的智能体将能够”组队”,多个代理协作完成复杂得多的目标。这就像从”单打独斗”进化到”团队协作”,能力上限会完全不一样。

    中国的开源赌注,全球已经在用

    中国实验室把前沿模型免费开放,这件事在全球范围内获得了大量开发者的好感。现在的问题是:这种模式财务上是否可持续?没人能给出确定答案。但一个事实已经形成——全球开发者已经在基于中国的开源基础模型构建应用了。


    这份清单里还有几个方向也值得关注:AI 加持下的诈骗正在升级、武器化的深度伪造已经成为现实、全球范围内对 AI 的抵制浪潮正在形成。MIT Technology Review 这份清单的价值不在于”预测”,而在于它把那些真正在发生的、会被写进历史的变化挑了出来。

  • AI 代理正在重塑互联网基础设施,AWS、微软、Cloudflare 纷纷入局

    最近有个变化正在发生,可能很多人还没注意到——互联网的基础设施,正在从为”人”设计,转向为”机器”设计。

    这么说可能有点抽象,具体来看就很有意思了。Cloudflare 的数据显示,过去半年里,非人类流量(主要是爬虫、AI 助手、自动化代理)已经占到整体 HTTP 流量的 31%,其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测,非人类流量将在 2027 年上半年超过人类流量。

    AI 代理的流量模式,彻底打破了旧规则

    这背后是 AI 代理(agent)的崛起。和人类用户稳定的浏览、点击、滚动行为不同,AI 代理的行为模式完全不同:它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用,然后像出现时一样迅速消失。这种”突发式”的流量模式,是传统云基础设施没有设计过的。

    “代理会从实验阶段进入生产环境,它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值,也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

    AI agents digital concept
    AI 助手的数字生成图像,象征人工智能系统的分布式与并行处理能力(图片来源:TechCrunch)

    AWS、微软、Cloudflare 都在重新造轮子

    本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦,可以根据代理流量的峰值在几秒内自动扩容,也可以在代理空闲时缩容到零——换句话说,不用为空闲的计算资源付费了。

    用个通俗的比喻:以前的 Serverless 版本就像你无论用不用车,都得付固定停车费;新版更像是按实际停放时间计费的智能停车位。

    类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”;微软推出了针对 Azure 的更新,专门处理 AI 代理的流量突发并在代理之间共享记忆;Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。


    这个趋势值得关注,因为它意味着两件事:一是 AI 代理的规模化部署正在倒逼基础设施升级;二是当这套新基础设施成熟后,代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说,这是个好消息。

  • AI 代理正在重塑互联网基础设施,AWS、微软、Cloudflare 纷纷入局

    最近有个变化正在发生,可能很多人还没注意到——互联网的基础设施,正在从为”人”设计,转向为”机器”设计。

    这么说可能有点抽象,具体来看就很有意思了。Cloudflare 的数据显示,过去半年里,非人类流量(主要是爬虫、AI 助手、自动化代理)已经占到整体 HTTP 流量的 31%,其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测,非人类流量将在 2027 年上半年超过人类流量。

    AI 代理的流量模式,彻底打破了旧规则

    这背后是 AI 代理(agent)的崛起。和人类用户稳定的浏览、点击、滚动行为不同,AI 代理的行为模式完全不同:它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用,然后像出现时一样迅速消失。这种”突发式”的流量模式,是传统云基础设施根本没有设计过的。

    “代理会从实验阶段进入生产环境,它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值,也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

    AI agents digital concept
    AI 助手的数字生成图像,象征人工智能系统的分布式与并行处理能力(图片来源:TechCrunch)

    AWS、微软、Cloudflare 都在重新造轮子

    本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦,可以根据代理流量的峰值在几秒内自动扩容,也可以在代理空闲时缩容到零——换句话说,不用为空闲的计算资源付费了。

    用个通俗的比喻:以前的 Serverless 版本就像你无论用不用车,都得付固定停车费;新版更像是按实际停放时间计费的智能停车位。

    类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”;微软推出了针对 Azure 的更新,专门处理 AI 代理的流量突发并在代理之间共享记忆;Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。


    这个趋势值得关注,因为它意味着两件事:一是 AI 代理的规模化部署正在倒逼基础设施升级;二是当这套新基础设施成熟后,代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说,这是个好消息。

  • 微软正在打造AI超级应用——把Copilot全家桶装进一个入口

    据《财富》杂志报道,微软正在开发一款AI”超级应用”——把现在散落在各处的AI能力全部整合到同一个入口。具体来说,这款应用会把GitHub Copilot、Copilot聊天机器人、Copilot Cowork,以及一个内部代号为”Autopilot”的新智能体工作流能力,全部塞进一个App里。

    这个思路听起来很熟悉,对吧?OpenAI已经在走这条路了——把对话、搜索、代码、智能体编排全部整合进ChatGPT,让它成为一个真正的”超级应用”入口。现在微软想做同样的事,只不过依托的是自己整个Copilot产品线。

    微软的打法其实很清晰:它拥有全链路的产品布局——从代码编辑器里的Copilot,到Microsoft 365里的Copilot,再到独立发布的Copilot Cowork智能体平台。唯一缺的就是一个把它们串起来的”总控制台”。

    可能在Build大会上亮相

    《财富》的报道推测,这款超级应用可能会在近期举办的Microsoft Build开发者大会上亮相。Build是微软每年最重要的开发者活动,通常是发布重磅AI战略更新的场合。如果这款产品真的在Build上出现,基本等于微软官方确认了”超级应用”战略。

    值得一提的是,微软过去一年在Copilot品牌上投入极大,但用户体验一直是碎片化状态——写代码要用GitHub Copilot,处理文档要用Microsoft 365 Copilot,管理智能体工作流要用Copilot Cowork,三者之间的数据和上下文并不打通。这款超级应用如果成真,最直接的价值就是解决这个问题。

    和OpenAI的超级应用有什么不同?

    OpenAI的”超级应用”路线是围绕ChatGPT构建的——所有能力都收敛到一个对话窗口里,用户跟AI交互的主要方式还是”说话”和”看结果”。微软的路线则更偏向”工作流”——它继承的是Office、Azure、GitHub这套企业生产力生态,AI超级应用更像是一个”智能工作操作系统”。

    两套打法背后的逻辑不太一样。OpenAI是从消费者往上打,微软是从企业往下打。最终谁能先把”超级应用”这件事做成,很大程度上取决于谁能先把多智能体协作、跨应用上下文传递、以及企业数据安全这三个问题解决掉。


    目前微软官方还没有确认这款产品的存在,按照惯例,在Build大会之前所有消息都只是传闻。但如果《财富》的报道方向是对的,这会是微软在AI应用层最重要的一次产品整合,也意味着”Copilot”作为一个独立品牌,正在从”功能”升级为”平台”。

  • 互联网正在为机器重构——AI智能体正在改写整个网络基础设施

    过去二十年,互联网一直是围绕人类行为设计的。人们搜索、点击、滚动、串流,这些动作有规律、可预测。但AI智能体不这么干活。它们能在几秒钟内发起一连串突发请求,同时调出十几个子智能体,疯狂查询数据库、检索文档、调用API,然后突然全部消失。这种流量模式,人类的网络基础设施从来没为它设计过。

    AWS悄悄改写了搜索数据库的底层的

    本周,亚马逊云科技(AWS)发布新一代OpenSearch Serverless——一个专门面向AI智能体负载设计的托管搜索和向量数据库。最核心的变化是:计算和存储解耦了。智能体发起任务时,算力可以在几秒内弹性扩容;智能体 idle 时,算力可以缩到零。客户不用再为空闲的计算资源付费。

    “智能体正从实验阶段走向生产环境,它们产生的流量模式,是之前的基础设施根本没考虑过的。”
    ——Tia White,亚马逊OpenSearch服务总经理

    之前的Serverless版本也有弹性,但存储和计算是绑定的,你至少得保留一个运行中的实例。说白了就是:哪怕你没在用,也得一直付停车费。新一代相当于改成了计时停车位——来了才计费,走了就归零。

    AI智能体概念图
    AI智能体正在改变互联网流量结构(图片来源:Getty Images)

    机器流量已经超过你想象

    Cloudflare的数据很说明问题:过去六个月, bots 流量已经占到整体HTTP流量的31%。其中AI爬虫、搜索引擎和AI助手加起来,约占所有bot请求的25%。Cloudflare高级产品经理Lai Yi Ohlsen预计,2027年上半年,非人类流量就会超过人类流量。

    这不只是在抢带宽。智能体的检索模式跟人类完全不一样——它们会并发查询数百个数据源,对延迟极度敏感,而且流量峰值毫无规律。传统的基础设施假设用户是”逐步浏览”的,但智能体是”瞬间爆发”的。

    整个行业都在跟

    AWS不是唯一一个在干这件事的。Databricks和Snowflake正在把自己重新定位为企业AI内存和检索系统;微软Azure最近也推出了针对AI智能体突发流量和多智能体共享内存的更新;Cloudflare上个月发布了面向智能体的持久化环境和即时扩展基础设施。

    Google I/O上周也释放了信号:用户很快就能把购物研究、行程预订、网页浏览等任务委派给AI系统。不管是面向消费者的AI智能体,还是企业内外部部署的智能体,机器对机器的流量正在指数级增长。


    这场基础设施的重构,本质上是为下一个十年做准备。当智能体成为互联网的主要”用户”,整个堆栈——从数据库到CDN,从API网关到身份认证——都得重新思考。目前看,大的云厂商已经跑起来了,但这一步才刚刚开始。

  • MIT发布2026年AI十大趋势:从人形机器人训练到反AI运动

    人形机器人训练数据:动作捕捉的新战场

    就像人类的文字成了大语言模型的养料,现在连人类怎么动、怎么走路、怎么搬东西,都被大规模收集起来训练人形机器人。这事儿听起来有点怪,但确实在发生——有公司专门建了”训练中心”,让工人一遍遍重复同样的动作,就为了给机器人提供学习素材。还有更离谱的”提线木偶”模式:远方的人类通过远程操控,手把手教机器人怎么做事。

    这种做法投入巨大,但没人能保证一定成功。可资本还是在砸钱,因为这可能是让机器人真正”活过来”的唯一路径。


    大语言模型没有死,它正在进化

    去年大家还在感叹大语言模型”改变了世界”,今年从业者已经在琢磨下一个突破在哪里。容易摘的果子已经摘完了,模型的提升越来越难,但这不意味着LLM要退出历史舞台。

    相反,它正在往两个方向走:一个是把现有的能力压榨到极致,另一个是在寻找全新的架构突破。这条路不好走,但走通了就是下一个时代。


    AI让诈骗变得便宜又高效

    以前想搞网络诈骗,还得学点技术、花点钱买工具。现在有了生成式AI,门槛几乎降到了地板上。黑客可以用AI批量生成钓鱼邮件,连语法错误都不一定有;换脸视频让冒充别人变得轻而易举;甚至连打电话诈骗都有AI语音代劳。

    AI正在让网络犯罪变得更便宜、更快、更容易——这对普通人来说不是什么好消息。


    世界模型:让AI理解物理世界

    大语言模型擅长处理文字,但要让AI进入真实物理世界——比如让机器人知道”杯子掉地上会碎”这种常识——就需要”世界模型”。这类系统试图让AI理解外部世界的运作规律,而不仅仅是预测下一个词。

    如果这条路走通了,AI就不再只是聊天工具,而是能真正在现实世界里做事情的智能体。这可能是下一波AI浪潮最核心的突破点。


    智能体编排:从单打独斗到团队协作

    早期的AI智能体只能干一件事——比如帮你订个外卖,或者写段代码。但现实世界里的问题往往是复杂的,需要多个步骤、多种能力配合。

    现在的方向是”智能体团队”:一个负责搜索、一个负责推理、一个负责执行,像人类团队一样分工协作。这比单个超级智能体更灵活,也更容易落地。很多公司已经在往这个方向押注了。


    中国的开源赌注:免费模型赢来的全球影响力

    DeepSeek、通义千问、智谱……中国实验室过去一年里密集开源了一大批高质量模型,而且真的好用。这让全球开发者突然意识到:原来不用OpenAI也能做出厉害的东西。

    但这种”免费送”的策略能不能持续,没人说得准。训练模型太烧钱了,光靠口碑和开发者好感,账算得过来吗?不管怎样,全世界已经在基于中国的基础模型搞开发了,这本身就已经改变了格局。


    AI科学家:当AI开始做科研

    有些公司已经在开发能自主做科研的AI——不是帮你查文献,而是真的能设计实验、分析数据、甚至提出新假设。支持者说,这种AI合作者有一天可能会达到诺贝尔奖的水平。

    这话听起来夸张,但想想十年前大家也觉得”AI下围棋赢人类”是天方夜谭。科学发现的门槛正在被重新定义。


    反AI运动:当大家开始说”够了”

    过去几年AI基本上是想怎么发展就怎么发展,监管跟不上,大家也沉浸在”新技术好厉害”的兴奋里。但现在这股浪潮遇到了真正的阻力。

    艺术家不满自己的作品被拿来训练模型,工会担心AI抢走工作,保守派和自由派居然在”限制AI”这件事上找到了共同点。这股反对力量还在早期,但已经在一些具体问题上取得了小胜利。AI的无约束时代,可能正在走向终点。


    写在最后

    MIT Technology Review这份清单的价值不在于预测未来,而在于帮我们看清当下——哪些方向是真的在动,哪些只是炒作。人形机器人、世界模型、智能体编排,这些是当前最值得盯着的变化;而AI安全、监管反弹、开源商业化困境,则是这个行业必须面对的考题。

    2026年的AI,已经不再是”能不能做出来”的问题,而是”应该怎么用、谁来管、往哪里去”的问题。