标签：具身智能

MIT评出2026年AI圈最值得盯紧的10件事，每一件都在改写游戏规则

2026年5月21日
MIT发布2026年AI十大趋势：从人形机器人训练数据到AI反制浪潮

MIT发布2026年AI十大趋势：从人形机器人训练数据到AI反制浪潮

MIT Technology Review 发布2026年AI十大趋势报告

MIT Technology Review发布了2026年”当下AI领域最重要的10件事”清单。这是该刊首次将AI领域的核心趋势、行业动态、前沿进展汇总为单一清单。从人形机器人训练数据到AI反制浪潮，这10个趋势正在重塑整个行业。

人形机器人的”动作库”正在建立

训练AI理解物理世界，需要的不再只是文本。现在，无数摄像头对准工厂工人、仓库管理员、甚至远程操控的”傀儡机器人”，记录他们每一个动作。这些视频会成为下一代人形机器人的训练数据。问题是，这种规模的采集能不能真的让机器人学会干活，现在还没人能打包票。

MIT Technology Review认为，人类动作视频正在成为人形机器人训练的新”石油”，只是这套方法论还没被验证过。

大语言模型没过时，只是需要升级

LLM已经席卷全球，但容易摘的果子基本摘完了。整个行业都在找下一个爆点，但大语言模型本身不会消失。它还有大量潜力没释放——更长的上下文、更好的推理、更强的多模态能力。只是，光靠把模型做得更大，已经不够了。

诈骗的门槛正在被AI削平

钓鱼邮件、深度伪造电话、自动化的社交工程攻击——AI正在让这些事变得更快、更便宜、更容易上手。以前需要耐心和技术的活儿，现在脚本小子都能干。这对普通用户来说，意味着你收到的每一条”紧急信息”都可能是AI生成的。

世界模型：让AI理解物理规律

大语言模型擅长处理文字，但它们不了解物理世界是怎么回事。AI公司现在想构建”世界模型”——能理解重力、因果关系、空间结构的系统。如果做成，AI就不只是聊天机器人，它能真正进入工厂、仓库、医院，在真实世界里做决策。

战场上的AI：从辅助到决策

算法早就在做军事情报分析了，但生成式AI正在进入作战室。指挥官开始认真考虑AI的建议——该把资源投到哪里、怎么预测敌人的下一步。这改变的不只是技术，还有军队和科技巨头合作的方式，甚至是什么时候该按下”开火”按钮的决策逻辑。

MIT的报道指出，AI在军事领域的渗透速度比大多数人意识到得要快，而且这次不只是自动化，是真正的决策参与。

深度伪造的武器化已经到来

Grok大规模生成非自愿色情图像、美国政府用AI技术做宣传——人们长期预警的”武器化深度伪造”威胁，现在已经不是预言，是正在发生的事。假视频、假音频、假文章，正在成为信息战的一部分。

多智能体协作：从单打独斗到团队合作

第一代AI智能体只能做单一任务——运行浏览器、写几行代码。下一代智能体会组队工作，一个负责研究，一个负责写代码，一个负责测试，互相协调完成复杂目标。这就像从”一个工程师”进化到”一个产品团队”。

中国的开源赌注：免费的前沿模型

中国实验室把前沿模型免费开放，这招赢得了全球开发者的好感。现在，世界各地都有人在基于中国的开源模型做开发。问题是，这种模式能不能赚钱？没人知道答案。但不管怎样，开源的势头已经起来了。

AI科学家的出现：诺奖级别的合作者？

高校和企业都在开发能自主完成研究任务的AI智能体——不只是查文献，而是提出假设、设计实验、分析结果。一些业内人士相信，这类AI合作科学家未来可能做出达到诺贝尔奖级别的研究成果。当然，这话现在听起来还有点早。

反AI浪潮正在汇聚

经过多年几乎不受约束的AI发展，全球范围内正在形成一股强大的反对力量。保守派、自由派、艺术家、工会——不同立场的人开始在同一个问题上发声：AI跑得太快了，我们需要刹车。这股力量已经开始在一些具体问题上取得小范围胜利。

📎 原文来源：MIT Technology Review – 10 things that matter in AI right now

2026年5月20日
英伟达Lyra 2.0：一张照片生成90米3D世界，具身智能有”健身房”了

4月16日，英伟达研究团队悄悄放了个大招：Lyra 2.0，一个能从单张照片生成大规模3D场景的系统。这东西的目标很明确——给具身智能（embodied AI）提供训练场，让机器人在虚拟世界里先练熟了，再到现实中干活。

你只需要喂给它一张图片，它就能给你生成一个纵深90米的连贯3D环境。这个距离什么概念？差不多一个足球场的长度。而且相机一路走一路拍，回来的时候场景还是你刚才看到的那个，不会突然变形或者裂开。

它解决了两个老大难问题

以前的3D生成模型有两个通病，英伟达这次都给治了。

第一个叫”空间遗忘”——相机绕着场景走一圈再回到原点，发现原来的地方已经不认识了，场景扭曲得像进了哈哈镜。Lyra 2.0的做法很直白：实时把每一帧的3D几何信息存下来，相机回到老地方的时候，直接调档案，保证看到的东西跟第一次看到的一样。

第二个问题更麻烦，叫误差累积——生成的帧数越多，前面犯的错会一直往后传，到最后整个场景崩掉。Lyra 2.0在训练的时候故意把一些有缺陷的输出喂给模型，让它学会自己纠正自己。这个思路有点像让模型”打草稿→检查→修改”，而不是一条路走到黑。

在图像质量、相机控制这两项核心指标上，Lyra 2.0干掉了GEN3C、Yume-1.5等6个同类型竞品。快速版本比基础版效率提升13倍。

跟机器人仿真平台打通了

这是Lyra 2.0最实用的地方。它跟英伟达自己的Isaac Sim（机器人仿真平台）无缝集成，生成的3D场景可以直接导出为网格模型，机器人就能在这个虚拟环境里训练算法。

以前要训练一个具身智能模型，你得派人拿着激光雷达和相机去现实世界扫一大堆3D数据，费时费力还贵。现在Lyra 2.0能自动生成多样化的训练场景，机器人先在虚拟世界里把活干熟练了，再到现实里上路。

目前它只支持静态场景生成，动态物体还没搞定。但光是静态场景这个突破，已经给自动驾驶、通用机器人的物理感知训练提供了不少帮助。

为什么这事值得关注

3D世界生成这个方向，本质上是给AI建”健身房”。大模型是靠海量文本数据喂出来的，具身智能要靠海量3D交互数据，而现实世界的数据采集成本太高了。

英伟达这步棋很精明——它不跟你卷大模型，它给你造训练大模型需要的”场地”。你用不用它的GPU跑模型另说，但你要想训练具身智能，它的仿真工具链几乎是绕不开的。

目前没有看到Lyra 2.0开源的消息，但英伟达过去在研究方向上有开放的传统，后续会不会放出来让社区用，值得盯着。

对于做具身智能的团队来说，这类工具的价值在于缩短迭代周期。以前一个场景要扫好几天，现在一张图几分钟出结果，测完不行马上改，迭代速度快了不止一个量级。

📎 原文来源：英伟达发布Lyra 2.0：单张照片生成90米3D环境

2026年5月18日
自动驾驶是具身智能上半场，李想让理想”造人”的时间表提前了

最近汽车圈出了一个挺有意思的判断——理想汽车CEO李想说了一句话，把自动驾驶和人形机器人放在了一条时间轴上：自动驾驶是具身智能的上半场，通用人形机器人是下半场。

这句话不是随便说说的，背后有一张非常清晰的时间表。上半场自动驾驶分三个阶段：2018到2023年是L2辅助驾驶，2023到2028年是L3，2028到2033年是L4。下半场人形机器人则是：2030到2035年达到6岁泛化能力，2035到2040年达到12岁，2040年之后接近AGI水平。

李想还做了一个预判：购买L4自动驾驶汽车的用户，和购买家庭家政机器人的用户，重合度将高达90%。这意味着上半场的感知、模型、芯片、控制能力，可以无缝迁移到下半场，形成跨场景的商业闭环。

研发组织彻底打散重编

最让人意外的是理想今年1月的研发重组。他们把按软硬件划分的传统部门全部拆掉，按”造硅基人”的逻辑重新组合。infra团队负责算力数据，对应”心脏”；基座模型团队管多模态训练，对应”大脑”；软件本体团队做Agent和工具链，对应”手脚”；硬件本体团队管芯片传感器，对应”身体”；评估团队独立评估工作质量，对应”免疫系统”。

改完之后立竿见影：智驾模型训练从每两周迭代一次，直接压缩到每天一次。过去部门之间来回扯皮的沟通成本，就这么被彻底消解了。

两款机器人已经立项

资金投入上也不含糊。2025年理想研发花了113亿，其中AI相关占一半，2026年预算120亿基本保持同等比例。5月15日上市的L9 Livis，定价50.98万元，是理想切入具身智能赛道的首款量产旗舰。

值得注意的是，理想前高管创立的至简动力，在发布会当天放出了一个视频：旗下ix和i7两款机器人全程围观新车发布会，其中一台手持理想自研的马赫M100芯片。这说明理想系的人形机器人项目，早已跑在路上了。

理想L9 Livis 具身智能旗舰SUV

李想说这是理想的第三次”逆共识”。前两次分别是2015年坚持增程而非纯电，以及聚焦家庭场景而非个人用户。现在，当行业还在讨论具身智能是否遥不可及时，理想已经把芯片、模型、操作系统全部打通。

“理想汽车做AI，不是冒险。不做才是冒险。”

这不只是理想一家的事。国内近期也在从国家层面加速具身智能落地。杭州刚刚启用了全国首个国家级具身智能应用中试基地，130多台机器人在此接受30多种职业技能训练，由中国工程院院士王耀南担任学术委员会主任，宇树科技等行业企业也参与其中。

从实验室到真实场景，从自动驾驶的感知能力到人形机器人的泛化智能——这场变革正在加速。

📎 原文来源：理想汽车的具身智能蓝图：上半场造车，下半场造「人」
📎 参考来源：具身智能”上下半场”：自动驾驶技术为通用人形机器人铺路

2026年5月18日
Figure AI人形机器人直播33小时：分拣超4万包裹，具身智能进入真实工厂

昨晚刷到一个直播，愣是看了半小时停不下来——Figure AI的人形机器人在仓库里干活，一干就是33个小时，分拣了4万多个快递包裹。

这事说起来还有点来头。Figure AI创始人Brett Adcock之前被投资人Scott Walter怼过：人形机器人到底能不能扛住工厂班次的强度？能不能别光靠PPT吹牛，给大家真刀真枪跑一个8小时看看？Adcock当时还挺硬气，直接宣布要做一场全程直播。结果原本承诺的8小时，机器人根本停不下来，一路跑到了33小时，到我看直播的时候已经分拣了超过33000个包裹。

三台机器人，分别叫Bob、Frank和Gary

直播间里有个很有意思的细节：Adcock在观众的建议下，给三台Figure 03贴上了物理铭牌，分别叫Bob、Frank和Gary——就跟给宠物起名一样随意。整个机器人舰队在传送带前分工协作，每台机器人负责扫描条码、把标签朝下放好、再推上传送带，全流程完全自主，没有人在远程操控。

速度大概是每2.6秒处理一个包裹，已经接近人类工人的水平了。机器人手指尖的触觉传感器能感知轻至3克的压力——相当于一枚回形针的重量。视觉系统也做了大幅升级，帧率比上一代提升2倍，延迟降到原来的四分之一。

Figure 03机器人正在处理各种形状尺寸的包裹（来源：TechTimes）

当然也有翻车的时候

不过Adcock说的”零故障”有点标题党了。直播间观众能清楚看到，机器人偶尔会把包裹直接推到传送带外面，包裹掉一地。当机器人被卡住或者AI策略遇到超出训练分布的情况时，系统会触发自主重置。Adcock的解释是：人类在类似高强度任务里同样会有失误，这个逻辑……好像也没毛病。

竞争对手Agility Robotics直接开怼：”我们从2023年起就在GXO物流的真实仓库里干活了，已经移动超过10万个周转箱，还有OSHA安全认证。”言下之意：你才刚开始直播，我们早就打卡上班了。

Figure AI目前估值390亿美元，已经交付超过350台第三代机器人，从每天1台的生产速度提升到了每小时1台——120天内产能翻了24倍。电池快没的时候，机器人会自主离开工作站换岗，新单元无缝顶上，整个轮班节奏靠的是Helix-02神经网络自主协调，没有中心控制器。

这代表什么？

33小时的连续运行意味着什么？意味着人形机器人第一次在真实工业场景下展示了接近人类工人的耐力和吞吐量，而不是在实验室里做表演性质的演示。Figure AI的直播虽然有点营销的成分，但数据是实打实的——4万多个包裹，没有人工干预。当然，翻车片段也被几万人同时围观了，这个效果大概比任何广告都好。

现在的问题是：竞争对手Agility Digit已经在真实仓库跑了两三年，Tesla Optimus也在推进量产。Figure AI能不能在规模化量产和稳定性上真正追上来，才是决定这390亿估值能不能撑住的关键。毕竟直播间里的33小时固然漂亮，但如果要真正替代工厂工人，还得先过”掉包裹”这一关。

📎 原文来源：Figure AI’s 8-Hour Gamble Becomes a Livestream Marathon: 33,000+ Packages（Humanoids Daily，2026年5月14日）

2026年5月16日
Meta收购ARI机器人AI团队：具身智能的抢人大战开始了
Meta砸钱买下一个20人的机器人AI团队，这步棋下得挺准

5月1日，Meta悄悄宣布了一笔收购——把人形机器人AI初创公司Assured Robot Intelligence（简称ARI）整个团队拿了过来。具体价格没披露，但按AI研究领域种子阶段收购的惯例来估算，大概在5000万到1.5亿美元之间。ARI整个公司才成立约12个月，约20个人，全在加州圣地亚哥。

这个时机选得相当精准。就在收购前一个月，Amazon刚把Fauna Robotics收入囊中——而Fauna的联合创始人Lerrel Pinto，恰好也是ARI的联合创始人。人才圈的窗口正在关闭，Meta抢在ARI开A轮之前把它拿下了，估值还没被市场炒到天上去。

“人形机器人正在从硬件竞赛转向智能捕获。Meta收购ARI是最清晰的信号——大科技公司已经从围观这个赛道，转向直接买入场券。”

ARI到底在做什么

ARI对外声称在做”机器人的前沿AI”，但产品宣传很少，真正有价值的信息在它的创始人背景里。两位联合创始人都是学术圈的人：
- Xiaolong Wang——UC San Diego教授，研究方向是视觉运动控制和机器人灵巧操作，论文发表在CVPR、NeurIPS、ICLR这些顶会上
- Lerrel Pinto——同为UC San Diego出身，联合创立了Fauna Robotics（被Amazon收购），在机器人学习领域有扎实的积累
ARI的核心方向是给人形机器人做基础模型，特别强调在非预设环境下的全身控制和灵巧操作——这恰恰是现在大部分人形机器人最薄弱的地方。它们能走个直线、挥个手，但要让机器人像人一样在动态环境里做复杂操作，模型还差得很远。

值得注意的是，ARI强调”自学习”——模型通过物理交互来改进，而不是只靠离线数据集训练。这直接针对当前VLA（视觉-语言-动作）模型架构的一个已知局限：泛化能力不足。

为什么是ARI，不是别的公司

其实市面上做机器人智能层的初创公司不止ARI一家。Physical Intelligence（PI）融了6亿美元以上，Skild AI估值140亿美元——但这些公司要么太大太贵，要么已经走上独立发展的轨迹，买起来不划算。

ARI的巧妙之处在于：它足够小，可以干净地吸收进Meta的组织架构；它的人才足够顶尖，直接补充Meta Superintelligence Labs的短板；它的估值还没被炒高，收购成本低。

Meta在2025年成立了Reality Labs内部的机器人工作室，编制齐全，但缺的就是基础模型研究人才。ARI填的不是一块模糊的野心，而是一个精确的缺口。

大厂抢人大战才刚开始

把视野拉宽一点，这场收购其实是整个行业的一个缩影。Amazon在2025-2026年间连续拿下Fauna、Rivr，还投资了Agility；Tesla在全栈自研路线上上越走越深；NVIDIA坐在平台层，给所有人提供芯片和仿真工具，稳稳抽取margin。

Meta的策略和Amazon形成鲜明对比：Amazon是”广撒网”——连续收购，布局 warehouse、配送、家庭三大场景，但没有一个统一的平台叙事；Meta是”精准打击”——先在内部定义好机器人智能的路线图，再去买最匹配的人才来填空。

这两种路径哪个更有效，接下来两三年会见分晓。但至少从目前来看，Meta这步棋下得挺准——在种子阶段的机器人智能公司变成”不得不买”的独立巨头之前，先把人拿到手。

📎 原文来源：Meta Acquires ARI to Capture the Brain of the Humanoid Robot — RobotToday
2026年5月16日
2026全球人工智能终端展在深圳开幕，数千款AI新物种亮相
5月14日，2026全球人工智能终端展暨第七届深圳国际人工智能展览会在深圳正式开幕。本届展会以”端启未来·万物新生”为主题，聚焦AI终端落地、具身智能、行业数智化等核心赛道，汇聚全球数千款前沿智能产品。

全球人工智能终端展上，各类AI”新物种”让观众目不暇接（来源：深圳新闻网）

机器人变身多元生活助手

走进展会，第一眼就被机器人展区吸引。觉物科技带来的模块化变形机器人，高约2米，通过搭载不同模块可以”变身”执行不同任务。病虫害防治率比人工提升40%以上，单台设备作业覆盖场景提升3倍以上——这不是概念产品，而是已经在田间地头干活的真家伙。

更让我惊讶的是自变量机器人的演示：它能在陌生环境里识别地上的纸团，自主规划路线走过去捡起来，然后扔进垃圾桶。2026年3月，这家公司在深圳推出了全球首个商业化智能机器人进家庭服务。你看，机器人进家门，不是未来，是现在。

具身智能不再是实验室里的概念，而是真真切切在改变生产生活方式的技术现实。从单一工具到全能智能体，机器人的进化速度远超大多数人想象。

AI赋能传统产业：从效率升级到模式重构

AI怎么帮传统产业破旧立新？深腾数字科技给出的答案是”未来律所”：占地仅3平方米、24小时无人值守，AI数字人律师3秒钟响应法律咨询，构建”咨询-生成-风控-执行”全流程服务闭环。你说，这让传统律所怎么跟？

深圳西普尼则开辟了”贵金属+智能穿戴”新赛道。他们的”一表双戴”智能镶贵金属手表，还有行业首款贵金属智能戒指，支持100+种运动模式，实时监测心率、血氧、睡眠等健康数据。黄金珠宝和AI结合，这脑洞我是服的。

前沿终端加速落地：人机协同重塑生产生活
- 肯綮科技π系列外骨骼机器人：下肢大腿助力，适用于登山、徒步；H系列专为老年人设计，支持单腿助力调节
- 夸夸菁领科技”数智员工一体机”：将AI算力与数智员工能力融合，开箱即用、安全隔离的一体化方案
- 轻量化设计+高性价比：外骨骼机器人不再是科幻电影里的装备，而是普通人也能用的日常工具
展会现场，各类AI”新物种”不断突破大众想象边界。从机器人大放异彩变身多元生活助手，到AI深度赋能传统产业破旧立新，再到数智化工具全面重构办公生产流程——这场展会清晰勾勒出人工智能深度融入实体经济、全面重构产业生态的美好图景。

说真的，看完这场展会，你会发现AI不再是高高在上的技术名词，而是已经走进千家万户、千行百业的实实在在的工具和伙伴。端启未来，万物新生——这句主题语，还真不是吹的。

📎 原文来源：2026全球人工智能终端展在深开幕数千款前沿终端亮相 AI”新物种”重构产业生态新图景
2026年5月15日

标签： 具身智能

MIT发布2026年AI十大趋势：从人形机器人训练数据到AI反制浪潮

人形机器人的”动作库”正在建立

大语言模型没过时，只是需要升级

诈骗的门槛正在被AI削平

世界模型：让AI理解物理规律

战场上的AI：从辅助到决策

深度伪造的武器化已经到来

多智能体协作：从单打独斗到团队合作

中国的开源赌注：免费的前沿模型

AI科学家的出现：诺奖级别的合作者？

反AI浪潮正在汇聚

它解决了两个老大难问题

跟机器人仿真平台打通了

为什么这事值得关注

研发组织彻底打散重编

两款机器人已经立项

三台机器人，分别叫Bob、Frank和Gary

当然也有翻车的时候

这代表什么？

Meta砸钱买下一个20人的机器人AI团队，这步棋下得挺准

ARI到底在做什么

为什么是ARI，不是别的公司

大厂抢人大战才刚开始

机器人变身多元生活助手

AI赋能传统产业：从效率升级到模式重构

前沿终端加速落地：人机协同重塑生产生活

标签：具身智能