标签: AI创业

  • DeepSeek首次开门拿钱:510亿融资背后,梁文锋掏了200亿

    DeepSeek首次开门拿钱:510亿融资背后,梁文锋掏了200亿

    梁文锋掏了200亿,DeepSeek终于开门拿钱了

    深度求索(DeepSeek)这轮融资消息出来时,不少人第一反应是:他们不是一直说自己有钱不需要融资吗?事实也是这样——从成立到2026年,DeepSeek所有的研发和计算开支都是创始人梁文锋自己出的。现在突然拿了一轮510亿人民币(约74亿美元)的外部融资,估值站上4000亿人民币(约550亿美元),创始人个人在这轮里仍然出了200亿人民币。

    也就是说,这轮融资里近40%的钱仍然是梁文锋自己的。剩下的大头来自腾讯、宁德时代,以及中国国家人工智能产业投资基金。这个投资方组合本身就值得琢磨:腾讯能给它微信生态的入口和流量,宁德时代能给它能源和算力基础设施的支持,国家AI产业基金进来,意味着DeepSeek已经被放到国家级AI战略的底牌里了。

    DeepSeek融资AI概念图
    DeepSeek完成首轮74亿美元融资,估值超500亿美元(图源:beststartup.asia)

    但真正让外界在意的是这轮融资的治理结构。腾讯和宁德时代这些商业投资者,拿到的股份有五年锁定期,而且没有投票权。投票权归国家AI产业基金,而且这个基金的股份没有锁定期。换句话说,DeepSeek的战略方向实际上是由国家基金把控的,商业投资者只能拿分红,不能干预公司的技术路线和商业化决策。

    DeepSeek在2025年初发布的R1推理模型和V3语言模型,用远低于美国AI实验室的训练成本,达到了接近GPT-4和Claude的水平。这件事直接导致英伟达等AI基础设施股票出现显著抛售,因为市场开始怀疑:如果DeepSeek的方法是对的,那是不是就不需要买那么多GPU了?

    这个疑问现在仍然没有确切答案。但DeepSeek拿到74亿美元之后,毫无疑问可以买更多的算力、训练更大的模型。之前他们是因为没钱才被迫把模型做”高效”,现在钱到位了,接下来会往哪个方向走——是继续做高效小模型,还是也加入千亿参数、万亿参数的军备竞赛?——外界只能等他们下一代模型发布才知道。


    五年锁定期,意味着什么

    腾讯和宁德时代愿意接受五年锁定、无投票权的条件,说明这笔投资更多是战略卡位,而不是财务投资。腾讯需要AI大模型来补微信生态里的智能助手能力,宁德时代需要AI来优化电池管理系统和生产线自动化,两边都有自己的算盘。

    五年锁定期还有一个效果:DeepSeek在接下来五年里不用担心投资人逼着上市、逼着变现。梁文锋之前一直说不想那么快商业化,现在拿了国家的钱和腾讯、宁德时代的钱,反而可以更从容地做研究。当然,反过来说,这也就意味着DeepSeek的技术路线必须符合国家对AI发展的整体布局,不是想做什么就做什么。

    对海外客户来说,这个治理结构是一个明确的信号:DeepSeek是一个有国家背景的AI实验室。日本、韩国、印度、东南亚这些市场里,原本因为DeepSeek模型便宜、好用而在考虑接入的企业,现在需要重新评估一遍合规和风险。这也给了那些治理结构更透明、没有国家控股的AI公司一个抢客户的机会。

    DeepSeek这轮融资还给亚洲其他国家的AI战略提了一个醒:要做前沿AI,需要多少钱?74亿美元大概是一个基准线。新加坡、日本、韩国、阿联酋的 sovereign fund 如果在2026年开始认真考虑投AI,这个数字是一个绕不开的参考。

  • 机器人训练数据成了AI新战场,这家公司刚拿了7000万美元

    机器人训练数据成了AI新战场,这家公司刚拿了7000万美元

    机器人训练数据收集
    机器人训练数据收集需要大量物理交互场景的标注

    训练一个大语言模型,你只需要扒下整个互联网的文本就行。但训练一个能叠衣服、拿杯子的机器人?那可没现成的数据海洋给你捞。

    这就是XDOF看到的机会。这家今天刚从隐身模式走出来的初创公司,刚拿了7000万美元融资,投资方包括Thrive Capital、Spark Capital、a16z、Lux和WndrCo。他们的赌注很简单:AI的下一个瓶颈不是模型也不是芯片,而是教机器人理解物理世界的数据反馈回路。

    为什么机器人数据这么难搞

    语言模型可以啃下整个互联网的文本,因为文字是现成的。但机器人需要的数据得捕捉物理交互——手怎么抓、力怎么控、物体怎么响应。这类数据几乎不存在。

    YouTube视频?画质太低,而且你不知道视频里的人到底用了多少力、手指是什么角度。众包工人拍的片段?同样的问题,而且很难和真实的物理参数对上号。

    XDOF的联合创始人兼CEO Philipp Wu在UC Berkeley读博时就撞上了这堵墙。他的研究方向是让机器人从大规模数据集里学习技能,但问题来了——根本没有大规模数据。

    “这是一个鸡生蛋、蛋生鸡的问题——我们得先实际收集数据,才能开始问怎么为机器人训练基础模型。”

    从学术论文到商业项目

    Wu和后来的联合创始人、CTO Fred Shentu搞出了一个叫GELLO的低成本遥操作系统,让人类操作员可以控制机械臂来生成训练数据。这个项目后来成了一篇在机器人圈很有影响力的论文,因为很多实验室都有同样的数据瓶颈,开始用这类设备来采集数据。

    看到机会后,Wu、Shentu和第三位联合创始人、COO Nemo Jin在2024年10月创立了XDOF,专门为搞机器人模型的公司提供数据生态系统。公司现在有约60名员工,已经在对口20家客户,包括几家前沿AI实验室(名字不能透露)。

    Wu说得很直接:”所有顶尖实验室都在追机器人。我们已经看到在语言模型竞赛中稍微落后的后果……你不想在物理AI成为下一个前沿时被甩在后面。”

    数据金字塔的三层结构

    XDOF的计划是覆盖一个数据金字塔的三个层级。最值钱的一层是在实际部署的机器人上采集的遥操作数据;第二层是用遥操作机器人采集更通用的数据(就像GELLO那样);第三层是”以自我为中心”的数据——人类戴穿戴式传感器完成日常任务时采集的数据,XDOF计划自己造这种传感器。

    选什么摄像头会直接影响数据质量,进而影响手 tracking 算法的表现。Wu说:”如果你一开始不把硬件设计好,你采集的数据可能会有你没预料到的特定问题。”

    为什么大实验室不自己搞

    这个问题很自然:为什么OpenAI、Google DeepMind这些巨头不自己建数据管道?Wu的回答是规模和专注度:”你需要一个几十万平方英尺的仓库,里面放上几百台机器人。你还得维护这些机器人、校准它们的物理参数、 properly培训操作员。”

    这种重资产、劳动密集的运营模式,大多数AI实验室宁愿外包。而这正是XDOF押注的市场。

    公司名字XDOF是个双关,既指机器人学里的”自由度”(degrees of freedom,描述机器人能独立运动的方向数),也表达了他们的野心:”任意自由度,无限自由度。”


    XDOF已经和UC Berkeley的AI研究实验室合作,发布了他们声称的有史以来最大的高质量机器人训练数据集合,叫ABC。里面有13万条机器人操作数据轨迹、300小时仿真数据和100小时评估数据。这种规模的预训练数据以前学术界根本拿不到。

    团队已经用这些数据训练机器人做折T恤、压扁纸箱、把AirPods塞进盒子这类基准任务。接下来,物理AI的数据军备竞赛才刚刚开始。

  • 世界模型公司Odyssey冲到145亿美元估值,Amazon、AMD都来了

    世界模型公司Odyssey冲到145亿美元估值,Amazon、AMD都来了

    大语言模型之后,AI的下一个战场在哪里?越来越多人的答案是:世界模型(World Model)。而这家叫做Odyssey的公司,刚刚用一份融资成绩单告诉市场:资本已经用真金白银投了票。

    Odyssey完成3.1亿美元B轮融资,投后估值145亿美元。这轮由Natural Capital领投,Amazon、AMD Ventures、GV等跟投。加上这笔,公司成立以来总共融了3.37亿美元——对于一个2023年才成立的初创公司来说,这个速度相当惊人。

    AI世界模型概念图
    世界模型试图让AI理解物理世界的运行规律 | 概念图

    创始人背景:自动驾驶的老兵

    Odyssey的两位创始人,CEO Oliver Cameron和CTO Jeff Hawke,都是从自动驾驶行业出来的。Cameron之前是自动驾驶初创公司Voyage的联合创始人兼CEO,后来Voyage被GM的Cruise收购,他就在Cruise做产品VP。Hawke则在另一家英国自动驾驶公司Wayve当工程师。

    这个背景其实解释了Odyssey在做什么。世界模型的核心是:让AI理解物理世界的运行规律——重力、碰撞、光线、物体之间的相互作用。这正是自动驾驶公司一直在攻克的问题,只不过Odyssey把它做成了一个通用平台,可以应用到游戏、机器人、虚拟现实等多个领域。

    怎么采集数据?背上摄像头走遍全世界

    要训练世界模型,得先有海量真实世界的视频数据。Odyssey的做法相当”物理”:派人背上摄像头,走街串巷地拍。这个思路其实和Google Earth有点像,只不过Google是开车拍,Odyssey是让人背着设备步行采集,能覆盖到车辆到不了的地方。

    世界模型不只是生成视频,它要模拟物理规律。这意味着AI生成的画面里,一个杯子掉到地上会碎,一个球踢出去会按照抛物线飞行——而不是每一帧都”猜”接下来发生什么。

    应用场景:从游戏到机器人

    目前Odyssey的世界模型已经有几个明确的方向。游戏是最直接的——用文字提示词生成可交互的3D视频内容,理论上可以大幅降低游戏场景的制作成本。机器人是另一个大方向:用世界模型做仿真训练,让机器人在虚拟环境里”摔”几千次,再放到现实里。

    和Amazon的合作也值得注意。Odyssey宣布AWS成为其首选云服务商,并且会优化模型以运行在AWS的Trainium芯片上——这是Amazon自家开发的AI训练芯片,直接对标Nvidia的GPU。有了Amazon的投资和云资源,Odyssey在算力成本上可能比竞争对手更有优势。

    天使投资人名单:硅谷半壁江山

    除了机构投资人,Odyssey这轮还拉来了一批重量级天使:Google传奇工程师Jeff Dean、知名天使Elad Gil、YC现任CEO Garry Tan、Vercel CEO Guillermo Rauch,还有Cruise创始人Kyle Vogt。这个阵容基本上把硅谷AI圈最有话语权的那批人都聚齐了。

    世界模型是不是下一个大机会,现在下结论还为时过早。但资本已经在用行动表态:这个方向,值得押注。

  • 这家公司想用数学证明来管住AI的幻觉,2700万美元押一条没人走的路

    这家公司想用数学证明来管住AI的幻觉,2700万美元押一条没人走的路

    企业想把AI用到实处,最难的不是让模型”说出话”,而是让说出来的话靠谱。税务、法律、药物研发——这些领域错一个字就是真金白银甚至人命,AI幻觉在这儿比别处更致命。一家刚冒头的新公司觉得,解决这个问题靠的不是把模型做得更大,而是把规则写得更死。

    给AI套上数学的缰绳

    Pramaana Labs本周冒了出来,拿了Kholla Ventures领投的2700万美元种子轮,Accel、Boldcap、Nexus Venture Partners、Premji Invest和Unbound跟投。这家公司的主意说起来不复杂:用计算机科学里最”死板”的工具——数学形式化验证——来管住AI最”飘”的那部分幻觉和乱编。

    AI形式化验证概念图
    形式化验证让AI的推理过程变得可验证 | 配图来源:WorkBuddy AI生成

    CEO Ranjan Rajagopalan的说法是:税务法规本质上就是一套规则,跟数学差不多。一旦把规则用代码形式化,推理过程就能变成确定性的——换句话说,AI可以天马行空地理解自然语言,但最后得出来的结论必须过一道”数学检查”,否则不让出门。

    “世界上最难的问题不是无解,而是没有被形式化。每个’出错就要命’的领域——健康、金钱、自由——都有规则,只是这些规则还没被写成代码。”
    ——Ranjan Rajagopalan,Pramaana Labs联合创始人兼CEO

    LEAN语言来了

    Pramaana的做法是在常规LLM上面加一层确定性验证,这套验证用的是开源LEAN编程语言的工具——本来这东西是用来验证数学证明的,现在被他们拿来验证AI的输出。有法国民俗,法国的CATALA项目已经把本国税法和福利系统的一大块形式化成了可执行代码,算是这条路上有分量的先驱。

    每个使用场景,Pramaana会搭一套自己的类LEAN形式化验证系统,并且有领域专家盯着。税务方向的前IRS局长Danny Werfel在公司顾问名单上;网络安全与药物研发系统则由IIT Delhi、IIT Madras和UC Berkeley的教授们把关。

    为什么是现在

    AI可靠性这事儿,搁两年前大家还在实验室里吵,现在企业已经被迫要认真对待了。幻觉在闲聊里是个笑话,在报税软件里就是一个灾难。Pramaana挑的这几个垂直领域——法律、药物研发、税务——恰恰是容错率最低的几个地方,也是愿意为”可靠性”付钱的地方。

    这条路能不能走通,取决于一件事:把现实世界的复杂规则完整、准确地形式化,这件事本身难度就不比做AI小。但Rajagopalan的判断是,那些规则本来就在那儿,只是没人把它们变成代码而已。


  • KPMG的AI报告因为幻觉被撤,这家刚拿900万美元的公司说他们有解法

    KPMG的AI报告因为幻觉被撤,这家刚拿900万美元的公司说他们有解法

    AI可靠性与幻觉检测
    AI幻觉问题正催生新的技术解决方案

    前几天KPMG撤掉了一份关于AI使用的报告,原因是报告里引用了多家机构的数据,但那些机构纷纷表示”我们没说过这个”。调查发现,这些错误来自AI幻觉——也就是说,这家全球顶级专业服务公司在制作一份关于AI的报告时,自己先被AI骗了。

    这件事在AI圈子里传开之后,很多人把它当成一个笑话。但笑完之后,一个更严肃的问题摆在所有AI用户面前:如果连KPMG都用不好AI,普通人该怎么办?

    “机甲套装”思路

    Peter Elias创办的Probably公司刚拿了900万美元种子轮,领投方是Andreessen Horowitz。他们的思路说起来不复杂:既然大模型天生就会犯事实性错误,那就不要让用户直接碰到原始模型的输出,在模型和用户之间加一层”套装”——Elias自己用的词是”mech suit”(机甲套装)。

    具体做法是:大模型的初版回答先经过一个确定性验证系统(deterministic validator)检查,验证系统会根据已知的数据集来核对结果,任何对不上的回答都会被打回去重算。关键是,大模型本身也针对这个验证系统做了训练,整个链条是一起优化的,而不是各干各的。

    Elias总结了一句话:”你的套装工程设计得越好,你需要的模型就越弱。”意思是,如果你能把上下文整理得足够精确,模型其实不需要很聪明也能给出正确答案。本质上,这是在减少歧义。

    用小模型干大事

    这套架构带来一个有趣的副作用:因为验证层承担了大部分”把关”工作,Probably的数据科学工具实际上跑的是一个比前沿模型”弱四个级别”的模型。换句话说,他们不需要GPT-4o或者Claude Sonnet这种级别的模型,也能给出准确率极高的回答。

    这意味着什么?意味着整套系统可以跑在本地硬件上,不需要把每一次查询都发到OpenAI或者Anthropic的服务器。对于企业用户来说,这省掉了一大笔token费用,也不用担心敏感数据离开自己的网络。

    Elias说他们当前版本的模型跑在桌面级硬件上就没问题。这个定位很聪明——在大家都拼命往云端跑的时候,他选择了往本地走。

    大AI实验室为什么不做这个

    Elias在接受TechCrunch采访时说了一段挺直接的话:”有趣的是,大型AI实验室甚至没有尝试过这样做。他们的激励机制不支持他们这样做,因为用户越是需要反复纠正模型,他们就越赚钱。”

    这个观察很犀利。OpenAI、Anthropic、Google这些公司的商业模式本质上建立在”模型还不够好”这个前提上——如果一次就能给出正确答案,用户就不需要多次调用API,收入就会下降。所以让他们主动把准确率做到99.99%,相当于让他们自己砍自己的收入。


    Probably目前的第一款产品是一个数据科学工具,但Elias说这套引擎可以扩展到任何对精度敏感的场景——会计、医疗、法律分析,这些都是容错率极低的领域,也是目前AI最难真正落地的领域。

    KPMG的尴尬撤稿事件其实正好给市场做了一次普及教育:AI幻觉不是小问题,它会导致真实的、可量化的损失。能解决这个问题的人,值得那900万美元。