
一家从游戏剪辑平台Medal分拆出来的AI初创公司,正在做一件挺疯狂的事:用每年20亿条游戏视频教AI理解空间和时间的概念。这家公司叫General Intuition,最近在谈一笔30亿美元的融资,估值冲到200亿美元。
投资方名单很豪华:Jeff Bezos、前Google CEO Eric Schmidt,外加老股东Khosla Ventures和General Catalyst。八个月前他们才拿了1.34亿美元的种子轮,当时刚从Medal分拆出来。现在直接跳到20亿估值——这速度在AI圈也算猛的。
General Intuition builds a foundation model that trains AI agents how to move through space and time. The dataset — unique because it allows AI to learn from interactive, first-person gameplay — is the perfect base to teach machines deep spatial-temporal reasoning.
为啥游戏视频是宝藏数据?
Medal这个平台本来是让玩家上传和分享游戏剪辑的,每月有1000万活跃用户,每年产生20亿条视频。这些视频有个特点:都是第一人称视角,玩家在虚拟世界里做各种动作——跑、跳、开枪、解谜、开车。每一帧都包含了”这个虚拟世界是怎么运作的”的信息。
General Intuition的判断是:如果一个AI能把游戏里的空间关系学得够好,那它理解真实世界的物理规律也就不远了。这比只看静态图片训练出来的模型要强得多——因为游戏视频是动态的,有时间维度。
世界模型赛道打起来了
General Intuition不是唯一做”世界模型”的公司。Runway、Decart、李飞飞的World Labs,还有Google的Genie 3,全在这个方向上砸钱。各家思路不太一样:
- Runway原来做视频生成,现在想把Google比下去
- Decart新发布的世界模型能模拟数小时的真实驾驶场景
- World Labs走商业化路线,推出了Marble产品
- Google Genie 3最近接入了Google Maps数据,能模拟真实街道
General Intuition的差异化在于:它不做世界模型产品卖给别人,而是用世界模型来训练能行动的智能体(agents)。智能体才是它要卖的东西。这个思路有点像:别人在卖铲子,它在培养用铲子的人。
OpenAI也曾来敲门
据The Information报道,OpenAI曾经试图收购Medal,就是看中了这笔游戏视频数据。但Medal选择了分拆出General Intuition,自己掌控方向。现在OpenAI没拿到这笔数据,而General Intuition拿着它去融了天价。
这轮融资的钱主要用来扩充算力。General Intuition的计划是在今年夏末或初秋发布新产品。从目前的信息看,应该是一个能让AI智能体在复杂虚拟环境里自主行动的模型。
世界模型这个方向为啥值钱?因为如果你想让AI机器人走进真实世界,它首先得在虚拟世界里把物理规律学明白。游戏视频提供了一个低成本、大规模的训练场。General Intuition手里这20亿条视频,可能就是它最大的护城河。
发表回复