标签： AI智能体

AI智能体这事儿，终于从”能聊”变成”能干活”了

AI智能体这事儿，终于从”能聊”变成”能干活”了

2026年有个明显的变化，AI不再只是坐在那里跟你聊天、回答问题，而是开始真正动手干活。这个转折点是个叫OpenClaw（龙虾）的开源AI代理框架，它的出现让整个行业都坐不住了，百度、阿里巴巴、腾讯、字节、智谱、月之暗面这些巨头公司一下子全都冲了进来。

就在这个节骨眼上，5月份国家网信办、国家发展改革委、工业和信息化部三家联合印发了《智能体规范应用与创新发展实施意见》，给这个新兴领域立了规矩。

智能体到底是个啥？

按官方说法，智能体是”具备自主感知、记忆、决策、交互与执行能力的智能系统”。说人话就是：以前的大模型像个只会纸上谈兵的军师，你问它啥它都能跟你掰扯半天，但真要它动手干活，它就傻眼了。

现在的智能体不一样，它能看屏幕、点鼠标、自动执行任务。百度创始人李彦宏说得挺直白：”智能体出圈了，第一次，AI的主角不是模型，而是应用。过去几年竞争核心是模型能力，现在用户真正买单的是’你能不能帮我把事做完’。”

衡量一个AI平台有没有戏，李彦宏提出要看DAA（日活智能体数），而不是DAU（日活用户数）。意思是，有多少Agent在给人类干活并交付结果，这才是真实的价值。

技术底座：从”大脑”到”执行”

要让智能体真正能干活，光有个”聪明的大脑”不够，还得有完整的感知、规划、执行、验证链路。月之暗面（Moonshot AI）的Kimi就是个典型例子，他们自研了大语言模型，总参数量达到1万亿，每次推理时激活约320亿参数，配备了384个细粒度领域专家。

这个模型用了MLA多头潜在注意力机制，把显存占用降到了传统架构的1/8，还引入了多Token预测目标来提升生成效率。这些技术细节听着枯燥，但实际效果就是：智能体能处理更长、更复杂的任务，而且不容易”掉链子”。

科研场景：从翻遍文献到一键出报告

《实施意见》里列出了19个智能体典型应用场景，科学研究排在第一位。2025年7月，上海交通大学和深势科技推出了通用科研智能体”SciMaster”，这个东西能干嘛呢？

你扔给它一个科学问题，比如”分子动力学在药物筛选中的典型流程是怎样的？”，它能把问题拆成多个子任务，全网搜文献、整合资讯、数据、论文、专利，最后给你生成一份能落地的深度调研报告。

AI智能体正在深度赋能科研场景

在药物研发领域，智能体能把跨靶点的研究证据整合进知识图谱；在新材料领域，像电解液、固体电解质有机合成这些方向，也有智能体研发辅助产品。据湘汉智库的研究报告，智能体已经深度渗透材料化学、基因组生物信息、生物医学健康等核心科研领域。

电商场景：”一句话点外卖”成真

今年初，淘宝闪购跟千问智能体打通了。5月11日，千问与淘宝全面打通，这标志着全球超大规模电商平台与智能体应用的深度融合。

现在你可以直接跟智能体说”帮我点杯咖啡，不加冰”、”两份米线，其中一份加辣不要豆芽”，它能自动识别你的意图、位置和偏好，然后推荐可下单的商品。这个合作已经覆盖了全国300多个地级市和超过3000个区县，品类涵盖餐饮外卖、超市便利、生鲜蔬果、鲜花绿植、医药健康、手机数码等等。

有个挺有意思的细节：AI在帮忙选品时，还可能做出”劝退”动作。比如你试图让智能体买个”量子水杯”，它可能会直接给你科普一波，告诉你这玩意儿不靠谱。这种”反销售”功能，倒是挺接地气的。

金融和教育：秒读财报、梳理文献

以前券商研究员做行业研究，得泡在海量研报、财报、新闻里，翻遍资料，2-3天才能攒出一份初稿。现在把研究主题丢给Kimi，它立刻自动全网检索、逐页精读财报、提炼核心观点，一气呵成输出结构化分析草稿。原先2-3天的”苦活儿”，现在2-3小时就搞定。

教育领域也是一样，文献”大山”一直是高校师生的头号痛点。现在只需一次对话，智能体就能一口气读完所有文献，自动完成分类归档、提炼核心观点，梳理出包含研究脉络、争议焦点、未来方向的完整综述框架。博士生过去要熬2-3周才能啃完的文献梳理，现在1-2天就能拿出初版，而且内容更全面、更系统。

安全问题：智能体也需要”纠偏”

智能体当然不是完美无缺的，”满嘴跑火车”的幻觉问题、决策跑偏、执行掉链子，都是行业面对的难题。为了给智能体”纠偏”，研发端从技术上打响了”精准纠错战”。

深势科技的CTO廖若雪说得很实在：科学场景对于事实的准确性和推理的可溯源性要求极高。首先，智能体的知识需要是结构化的，而不是完全依赖模型去记忆知识；其次，智能体的推理过程也要通过特定算法进行置信度校验；此外还需强调验证，关键的科学论断不能只由智能体自行评估，得通过实际运行结果来验证结论是否真实。

360 AI安全研究院最近发布了《AI安全系列报告》，指出随着智能体加速进入企业办公、研发、运维、客服等核心业务场景，AI安全的核心问题正在从”生成风险”转向”执行风险”。他们提出了两条解决路径：一是用AI加持传统安全防护，提高漏洞发现、入侵研判、样本分析和响应处置效率；二是让不确定性任务在安全约束下执行，让智能体可以做事，但不能越界。

清华大学文科资深教授、苏世民书院院长薛澜认为，《实施意见》通过设定全链条安全要求，系统性预防智能体技术滥用、决策失控等风险，为智能体技术在全社会规模化应用建立必要的安全信任基础。

写在最后

智能体的崛起，既是技术迭代的必然，更是时代发展的趋势。这不是简单的技术升级，而是工作方式、商业逻辑、生活体验的全面重构。政策护航、技术成熟、场景落地，多重力量正推动智能体从行业探索走向深度赋能。

根据《AI智能体赋能行业决策：趋势与实践白皮书（2026）》，智能体在制造、金融、政务等行业的渗透率已经超过50%。这个数字背后，是无数工作场景正在发生的真实变革。

📎 原文来源：新华网 – AI智能体：不止聊天，真能干活

2026年6月2日
英伟达搞出AI PC专用芯片，要抢2000亿美元CPU市场
英伟达最近又放了个大招，在台北电脑展上发布了一款专门给AI PC用的CPU芯片，名字叫RTX Spark，直接把消费级PC的算力拉到了1 petaflop（每秒千万亿次浮点运算），目标很明确：要抢总共2000亿美元的CPU市场份额。

英伟达已联合华硕、戴尔、惠普、联想、微软Surface等厂商，首批产品定于2026年秋季开售。

产品核心亮点

这款芯片的核心定位是支持AI智能体安全高效运行，英伟达和微软专门合作开发了安全沙箱机制，能让OpenClaw、Hermes Agent这类AI智能体在本地安全运行，不用把所有数据都传到云端。同时芯片搭配的CPU、GPU、内存以及底层CUDA软件，都支持大语言模型本地化部署，现在已经有超过1000款游戏和应用支持RTX的AI功能了。

英伟达CEO黄仁勋（来源：TechCrunch）

行业影响与挑战
- 英伟达CEO黄仁勋表示，未来全球会出现数十亿个AI智能体，将带来海量CPU需求
- 微软已推出搭载该芯片的Surface Laptop Ultra，称其为“有史以来最强大的Surface笔记本电脑”
- 目前已有超过100家Windows软件厂商宣布支持RTX Spark芯片，覆盖Adobe、Blender、Riot Games等头部产品
- 英伟达曾在2013年尝试推出ARM架构Windows设备，最终失败计提9亿美元减值，本次产品市场表现仍存不确定性
📎 原文来源：Nvidia chases $200B CPU market with AI agent PCs from Microsoft, Dell, and HP | TechCrunch
2026年6月2日
Anthropic悄悄交了IPO申请，Claude的东家要上市了
最近AI圈又有大动静了——Claude背后的公司Anthropic，偷偷向美国SEC提交了IPO申请，准备上市了。这家成立才5年的公司，现在估值已经接近1万亿美元，算是AI赛道里最靠近公开市场的头部玩家之一。

Anthropic刚完成65亿美元H轮融资，投后估值9650亿美元，上市筹备已进入实质阶段。

从融资到IPO的节奏

就在提交IPO申请前不到一周，Anthropic刚完成65亿美元的H轮融资，推动其估值达到9650亿美元。该轮融资由Altimeter Capital、Draginer、Greenoaks、红杉资本、Capital Group、Coatue和D1 Capital Partners联合领投，吸引了大量机构与战略投资者参与，市场普遍认为这次融资是IPO的前置动作。

Anthropic CEO Dario Amodei（来源：Ludovic MARIN/AFP / Getty Images）

核心信息梳理
- 当前估值接近1万亿美元，刚完成65亿美元融资，投后估值9650亿美元
- 采用秘密提交方式，暂未披露发行股份数量、发行价格，最终IPO落地取决于市场条件
- 与OpenAI竞争进入新阶段，OpenAI同期完成1220亿美元融资，估值8520亿美元，也在筹备上市
- 年化营收已超470亿美元，较2025年末的90亿美元增长超5倍，新模型Mythos有望进一步推高营收
📎 原文来源：Anthropic files to go public | TechCrunch
2026年6月2日
Meta 悄悄做了一款 AI 吊坠，想让 Reality Labs 不再每个季度亏 40 亿美元
Meta 正在开发一款 AI 吊坠设备，计划明年开始测试。这个消息来自 The Information 看到的一份内部备忘录。简单来说，这就是一个可以别在衬衫上、或者当项链戴的小装置，核心功能是记录你的对话，然后由 AI 进行处理和回应。

Meta 的 AI 硬件野心不止于眼镜（图源：TechCrunch）

这个设备的技术底子来自 Meta 在 2025 年底收购的 AI 可穿戴初创公司 Limitless。那家公司之前就在做几乎一样的东西——一个挂在脖子上的 AI 吊坠，持续录音，然后帮你整理记忆、提取待办、总结对话。Meta 当时说这笔收购是为了”加速 AI 可穿戴设备的开发”，现在看来，吊坠形态确实是他们想推的方向之一。

AI 吊坠这个品类之前已经有很多公司试过，基本都没掀起什么水花。隐私顾虑、营销不走心，或者产品本身就没那么有用——原因可能是其中任何一个。

Meta 的真实算盘

这份备忘录还透露了两个配套动作：Meta 计划扩展 AI 眼镜产品线，同时推出一个名为 Wearables for Work 的企业订阅服务。把这几件事放在一起看，Meta 的意图相当明确——用硬件矩阵把 Reality Labs 从每个季度亏 40 亿美元的泥潭里拉出来。

2026 年第一季度，Reality Labs 亏了 40 亿美元。这个数字已经不是新闻，而是某种常态。Meta 在 VR/AR 硬件上砸了超过 10 年，到现在还没看到真正的规模化盈利。AI 吊坠能不能改变这个局面？说实话，机会不大，但 Meta 也没有更好的选择了。

AI 可穿戴这个赛道到底行不行

吊坠形态有个天然优势：比眼镜门槛低。眼镜需要度数适配、外形接受度、社交压力，吊坠只要别在衣服上就行。但劣势也很明显——存在感太弱反而可能是个问题，用户凭什么要一直戴着它？

OpenAI 也没放弃这个方向，说明大厂们普遍觉得”贴身 AI”是个值得押注的交互入口。只不过从产品史来看，记录一切对话这个卖点最容易卡在隐私上——你愿意让一个随时在录音的设备贴身戴着吗？这个问题 Limitless 没答对，Meta 也不一定行。
- 设备形态：AI 吊坠，可别在衬衫或当项链佩戴
- 技术来源：基于 2025 年收购的 Limitless 团队
- 测试时间：最早 2027 年开始内部测试
- 配套计划：扩展 AI 眼镜产品线 + Wearables for Work 企业订阅
- 战略目标：扭转 Reality Labs 每季度 40 亿美元亏损
📎 原文来源：Meta is reportedly developing an AI pendant — TechCrunch
2026年5月31日
MIT TR 盘点：2026 年 AI 领域最值得关注的 10 件事

MIT Technology Review 最近做了一件有意思的事——他们第一次把”当下 AI 领域最重要的事”整理成了一份清单。不是那种泛泛而谈的趋势预测，而是编辑团队基于多年追踪，认真挑出来的 10 个方向。

这份清单里有些内容你可能已经耳熟能详，但也有几个方向，连很多业内人士都还没认真想过。挑几个最有意思的聊聊。

人形机器人的”数据饥渴”

训练大语言模型需要海量文本，那训练人形机器人需要什么？答案是：海量”人类动作视频”。现在已经有公司在专门搭建巨型”训练中心”，让工人重复完成各种任务，用摄像头把整个过程录下来。更夸张的是”提线木偶”模式——让海外陌生人通过远程操控的方式，实时”驾驶”机器人做各种动作，以此收集训练数据。

这套打法有没有用，现在还不好说。但逻辑是通的：想让机器人学会”把杯子拿起来”，先得让它看几万遍人类是怎么拿杯子的。

“世界模型”可能是下一个大突破

大语言模型擅长处理文字，但要让 AI 真正理解物理世界，还需要别的东西。这就是”世界模型”（World Models）的由来——AI 公司希望构建能够理解外部物理世界的系统，而不只是预测下一个 token。

如果世界模型取得成功，AI 将克服大语言模型的局限性，真正进入物理环境——而不只是停留在屏幕里和你聊天。

AI 智能体开始”组队协作”了

第一波 AI 智能体只能做单件任务——运行一个浏览器、写几行代码，而且各自为战。下一阶段的智能体将能够”组队”，多个代理协作完成复杂得多的目标。这就像从”单打独斗”进化到”团队协作”，能力上限会完全不一样。

中国的开源赌注，全球已经在用

中国实验室把前沿模型免费开放，这件事在全球范围内获得了大量开发者的好感。现在的问题是：这种模式财务上是否可持续？没人能给出确定答案。但一个事实已经形成——全球开发者已经在基于中国的开源基础模型构建应用了。

这份清单里还有几个方向也值得关注：AI 加持下的诈骗正在升级、武器化的深度伪造已经成为现实、全球范围内对 AI 的抵制浪潮正在形成。MIT Technology Review 这份清单的价值不在于”预测”，而在于它把那些真正在发生的、会被写进历史的变化挑了出来。

📎 原文来源：10 things that matter in AI right now — MIT Technology Review

2026年5月31日
AI 代理正在重塑互联网基础设施，AWS、微软、Cloudflare 纷纷入局

最近有个变化正在发生，可能很多人还没注意到——互联网的基础设施，正在从为”人”设计，转向为”机器”设计。

这么说可能有点抽象，具体来看就很有意思了。Cloudflare 的数据显示，过去半年里，非人类流量（主要是爬虫、AI 助手、自动化代理）已经占到整体 HTTP 流量的 31%，其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测，非人类流量将在 2027 年上半年超过人类流量。

AI 代理的流量模式，彻底打破了旧规则

这背后是 AI 代理（agent）的崛起。和人类用户稳定的浏览、点击、滚动行为不同，AI 代理的行为模式完全不同：它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用，然后像出现时一样迅速消失。这种”突发式”的流量模式，是传统云基础设施没有设计过的。

“代理会从实验阶段进入生产环境，它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值，也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

AI 助手的数字生成图像，象征人工智能系统的分布式与并行处理能力（图片来源：TechCrunch）

AWS、微软、Cloudflare 都在重新造轮子

本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦，可以根据代理流量的峰值在几秒内自动扩容，也可以在代理空闲时缩容到零——换句话说，不用为空闲的计算资源付费了。

用个通俗的比喻：以前的 Serverless 版本就像你无论用不用车，都得付固定停车费；新版更像是按实际停放时间计费的智能停车位。

类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”；微软推出了针对 Azure 的更新，专门处理 AI 代理的流量突发并在代理之间共享记忆；Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。

这个趋势值得关注，因为它意味着两件事：一是 AI 代理的规模化部署正在倒逼基础设施升级；二是当这套新基础设施成熟后，代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说，这是个好消息。

📎 原文来源：The internet is being rebuilt for machines — TechCrunch

2026年5月31日
AI 代理正在重塑互联网基础设施，AWS、微软、Cloudflare 纷纷入局

最近有个变化正在发生，可能很多人还没注意到——互联网的基础设施，正在从为”人”设计，转向为”机器”设计。

这么说可能有点抽象，具体来看就很有意思了。Cloudflare 的数据显示，过去半年里，非人类流量（主要是爬虫、AI 助手、自动化代理）已经占到整体 HTTP 流量的 31%，其中 AI 爬虫和搜索引擎占了机器人请求的四分之一。Cloudflare 的产品经理 Lai Yi Ohlsen 甚至预测，非人类流量将在 2027 年上半年超过人类流量。

AI 代理的流量模式，彻底打破了旧规则

这背后是 AI 代理（agent）的崛起。和人类用户稳定的浏览、点击、滚动行为不同，AI 代理的行为模式完全不同：它们可以在几秒钟内发起数百次数据库查询、文档检索和 API 调用，然后像出现时一样迅速消失。这种”突发式”的流量模式，是传统云基础设施根本没有设计过的。

“代理会从实验阶段进入生产环境，它们产生的流量模式是之前的基础设施根本没有设计过的。它们会毫无预警地出现流量峰值，也会毫无征兆地进入空闲状态。” — AWS OpenSearch 总经理 Tia White

AI 助手的数字生成图像，象征人工智能系统的分布式与并行处理能力（图片来源：TechCrunch）

AWS、微软、Cloudflare 都在重新造轮子

本周 AWS 发布的下一代 OpenSearch Serverless 就是一个典型例子。这个新版本把计算和存储解耦，可以根据代理流量的峰值在几秒内自动扩容，也可以在代理空闲时缩容到零——换句话说，不用为空闲的计算资源付费了。

用个通俗的比喻：以前的 Serverless 版本就像你无论用不用车，都得付固定停车费；新版更像是按实际停放时间计费的智能停车位。

类似的动作在整个云行业都在发生。Databricks 和 Snowflake 正在把自己重新定位为企业 AI 数据的”记忆和检索系统”；微软推出了针对 Azure 的更新，专门处理 AI 代理的流量突发并在代理之间共享记忆；Cloudflare 上个月也推出了面向代理的持久化环境和即时扩展能力的基础设施。

这个趋势值得关注，因为它意味着两件事：一是 AI 代理的规模化部署正在倒逼基础设施升级；二是当这套新基础设施成熟后，代理的部署成本会更低、更容易大规模落地。对于正在考虑用 AI 代理做点什么的公司来说，这是个好消息。

📎 原文来源：The internet is being rebuilt for machines — TechCrunch

2026年5月31日
微软正在打造AI超级应用——把Copilot全家桶装进一个入口

据《财富》杂志报道，微软正在开发一款AI”超级应用”——把现在散落在各处的AI能力全部整合到同一个入口。具体来说，这款应用会把GitHub Copilot、Copilot聊天机器人、Copilot Cowork，以及一个内部代号为”Autopilot”的新智能体工作流能力，全部塞进一个App里。

这个思路听起来很熟悉，对吧？OpenAI已经在走这条路了——把对话、搜索、代码、智能体编排全部整合进ChatGPT，让它成为一个真正的”超级应用”入口。现在微软想做同样的事，只不过依托的是自己整个Copilot产品线。

微软的打法其实很清晰：它拥有全链路的产品布局——从代码编辑器里的Copilot，到Microsoft 365里的Copilot，再到独立发布的Copilot Cowork智能体平台。唯一缺的就是一个把它们串起来的”总控制台”。

可能在Build大会上亮相

《财富》的报道推测，这款超级应用可能会在近期举办的Microsoft Build开发者大会上亮相。Build是微软每年最重要的开发者活动，通常是发布重磅AI战略更新的场合。如果这款产品真的在Build上出现，基本等于微软官方确认了”超级应用”战略。

值得一提的是，微软过去一年在Copilot品牌上投入极大，但用户体验一直是碎片化状态——写代码要用GitHub Copilot，处理文档要用Microsoft 365 Copilot，管理智能体工作流要用Copilot Cowork，三者之间的数据和上下文并不打通。这款超级应用如果成真，最直接的价值就是解决这个问题。

和OpenAI的超级应用有什么不同？

OpenAI的”超级应用”路线是围绕ChatGPT构建的——所有能力都收敛到一个对话窗口里，用户跟AI交互的主要方式还是”说话”和”看结果”。微软的路线则更偏向”工作流”——它继承的是Office、Azure、GitHub这套企业生产力生态，AI超级应用更像是一个”智能工作操作系统”。

两套打法背后的逻辑不太一样。OpenAI是从消费者往上打，微软是从企业往下打。最终谁能先把”超级应用”这件事做成，很大程度上取决于谁能先把多智能体协作、跨应用上下文传递、以及企业数据安全这三个问题解决掉。

目前微软官方还没有确认这款产品的存在，按照惯例，在Build大会之前所有消息都只是传闻。但如果《财富》的报道方向是对的，这会是微软在AI应用层最重要的一次产品整合，也意味着”Copilot”作为一个独立品牌，正在从”功能”升级为”平台”。

📎 原文来源：Microsoft is reportedly working on its own AI “super app” — The Verge

2026年5月30日
互联网正在为机器重构——AI智能体正在改写整个网络基础设施

过去二十年，互联网一直是围绕人类行为设计的。人们搜索、点击、滚动、串流，这些动作有规律、可预测。但AI智能体不这么干活。它们能在几秒钟内发起一连串突发请求，同时调出十几个子智能体，疯狂查询数据库、检索文档、调用API，然后突然全部消失。这种流量模式，人类的网络基础设施从来没为它设计过。

AWS悄悄改写了搜索数据库的底层的

本周，亚马逊云科技（AWS）发布新一代OpenSearch Serverless——一个专门面向AI智能体负载设计的托管搜索和向量数据库。最核心的变化是：计算和存储解耦了。智能体发起任务时，算力可以在几秒内弹性扩容；智能体 idle 时，算力可以缩到零。客户不用再为空闲的计算资源付费。

“智能体正从实验阶段走向生产环境，它们产生的流量模式，是之前的基础设施根本没考虑过的。”
——Tia White，亚马逊OpenSearch服务总经理

之前的Serverless版本也有弹性，但存储和计算是绑定的，你至少得保留一个运行中的实例。说白了就是：哪怕你没在用，也得一直付停车费。新一代相当于改成了计时停车位——来了才计费，走了就归零。

AI智能体正在改变互联网流量结构（图片来源：Getty Images）

机器流量已经超过你想象

Cloudflare的数据很说明问题：过去六个月， bots 流量已经占到整体HTTP流量的31%。其中AI爬虫、搜索引擎和AI助手加起来，约占所有bot请求的25%。Cloudflare高级产品经理Lai Yi Ohlsen预计，2027年上半年，非人类流量就会超过人类流量。

这不只是在抢带宽。智能体的检索模式跟人类完全不一样——它们会并发查询数百个数据源，对延迟极度敏感，而且流量峰值毫无规律。传统的基础设施假设用户是”逐步浏览”的，但智能体是”瞬间爆发”的。

整个行业都在跟

AWS不是唯一一个在干这件事的。Databricks和Snowflake正在把自己重新定位为企业AI内存和检索系统；微软Azure最近也推出了针对AI智能体突发流量和多智能体共享内存的更新；Cloudflare上个月发布了面向智能体的持久化环境和即时扩展基础设施。

Google I/O上周也释放了信号：用户很快就能把购物研究、行程预订、网页浏览等任务委派给AI系统。不管是面向消费者的AI智能体，还是企业内外部部署的智能体，机器对机器的流量正在指数级增长。

这场基础设施的重构，本质上是为下一个十年做准备。当智能体成为互联网的主要”用户”，整个堆栈——从数据库到CDN，从API网关到身份认证——都得重新思考。目前看，大的云厂商已经跑起来了，但这一步才刚刚开始。

📎 原文来源：The internet is being rebuilt for machines — TechCrunch

2026年5月30日
MIT发布2026年AI十大趋势：从人形机器人训练到反AI运动

人形机器人训练数据：动作捕捉的新战场

就像人类的文字成了大语言模型的养料，现在连人类怎么动、怎么走路、怎么搬东西，都被大规模收集起来训练人形机器人。这事儿听起来有点怪，但确实在发生——有公司专门建了”训练中心”，让工人一遍遍重复同样的动作，就为了给机器人提供学习素材。还有更离谱的”提线木偶”模式：远方的人类通过远程操控，手把手教机器人怎么做事。

这种做法投入巨大，但没人能保证一定成功。可资本还是在砸钱，因为这可能是让机器人真正”活过来”的唯一路径。

大语言模型没有死，它正在进化

去年大家还在感叹大语言模型”改变了世界”，今年从业者已经在琢磨下一个突破在哪里。容易摘的果子已经摘完了，模型的提升越来越难，但这不意味着LLM要退出历史舞台。

相反，它正在往两个方向走：一个是把现有的能力压榨到极致，另一个是在寻找全新的架构突破。这条路不好走，但走通了就是下一个时代。

AI让诈骗变得便宜又高效

以前想搞网络诈骗，还得学点技术、花点钱买工具。现在有了生成式AI，门槛几乎降到了地板上。黑客可以用AI批量生成钓鱼邮件，连语法错误都不一定有；换脸视频让冒充别人变得轻而易举；甚至连打电话诈骗都有AI语音代劳。

AI正在让网络犯罪变得更便宜、更快、更容易——这对普通人来说不是什么好消息。

世界模型：让AI理解物理世界

大语言模型擅长处理文字，但要让AI进入真实物理世界——比如让机器人知道”杯子掉地上会碎”这种常识——就需要”世界模型”。这类系统试图让AI理解外部世界的运作规律，而不仅仅是预测下一个词。

如果这条路走通了，AI就不再只是聊天工具，而是能真正在现实世界里做事情的智能体。这可能是下一波AI浪潮最核心的突破点。

智能体编排：从单打独斗到团队协作

早期的AI智能体只能干一件事——比如帮你订个外卖，或者写段代码。但现实世界里的问题往往是复杂的，需要多个步骤、多种能力配合。

现在的方向是”智能体团队”：一个负责搜索、一个负责推理、一个负责执行，像人类团队一样分工协作。这比单个超级智能体更灵活，也更容易落地。很多公司已经在往这个方向押注了。

中国的开源赌注：免费模型赢来的全球影响力

DeepSeek、通义千问、智谱……中国实验室过去一年里密集开源了一大批高质量模型，而且真的好用。这让全球开发者突然意识到：原来不用OpenAI也能做出厉害的东西。

但这种”免费送”的策略能不能持续，没人说得准。训练模型太烧钱了，光靠口碑和开发者好感，账算得过来吗？不管怎样，全世界已经在基于中国的基础模型搞开发了，这本身就已经改变了格局。

AI科学家：当AI开始做科研

有些公司已经在开发能自主做科研的AI——不是帮你查文献，而是真的能设计实验、分析数据、甚至提出新假设。支持者说，这种AI合作者有一天可能会达到诺贝尔奖的水平。

这话听起来夸张，但想想十年前大家也觉得”AI下围棋赢人类”是天方夜谭。科学发现的门槛正在被重新定义。

反AI运动：当大家开始说”够了”

过去几年AI基本上是想怎么发展就怎么发展，监管跟不上，大家也沉浸在”新技术好厉害”的兴奋里。但现在这股浪潮遇到了真正的阻力。

艺术家不满自己的作品被拿来训练模型，工会担心AI抢走工作，保守派和自由派居然在”限制AI”这件事上找到了共同点。这股反对力量还在早期，但已经在一些具体问题上取得了小胜利。AI的无约束时代，可能正在走向终点。

写在最后

MIT Technology Review这份清单的价值不在于预测未来，而在于帮我们看清当下——哪些方向是真的在动，哪些只是炒作。人形机器人、世界模型、智能体编排，这些是当前最值得盯着的变化；而AI安全、监管反弹、开源商业化困境，则是这个行业必须面对的考题。

2026年的AI，已经不再是”能不能做出来”的问题，而是”应该怎么用、谁来管、往哪里去”的问题。

📎 原文来源：MIT Technology Review – 10 things that matter in AI right now

2026年5月30日

标签： AI智能体

智能体到底是个啥？

技术底座：从”大脑”到”执行”

科研场景：从翻遍文献到一键出报告

电商场景：”一句话点外卖”成真

金融和教育：秒读财报、梳理文献

安全问题：智能体也需要”纠偏”

写在最后

产品核心亮点

行业影响与挑战

从融资到IPO的节奏

核心信息梳理

Meta 的真实算盘

AI 可穿戴这个赛道到底行不行

人形机器人的”数据饥渴”

“世界模型”可能是下一个大突破

AI 智能体开始”组队协作”了

中国的开源赌注，全球已经在用

AI 代理的流量模式，彻底打破了旧规则

AWS、微软、Cloudflare 都在重新造轮子

AI 代理的流量模式，彻底打破了旧规则

AWS、微软、Cloudflare 都在重新造轮子

可能在Build大会上亮相

和OpenAI的超级应用有什么不同？

AWS悄悄改写了搜索数据库的底层的

机器流量已经超过你想象

整个行业都在跟

人形机器人训练数据：动作捕捉的新战场

大语言模型没有死，它正在进化

AI让诈骗变得便宜又高效

世界模型：让AI理解物理世界

智能体编排：从单打独斗到团队协作

中国的开源赌注：免费模型赢来的全球影响力

AI科学家：当AI开始做科研

反AI运动：当大家开始说”够了”

写在最后