YOHO AI

标签： AI创业

DeepSeek首次开门拿钱：510亿融资背后，梁文锋掏了200亿

梁文锋掏了200亿，DeepSeek终于开门拿钱了

深度求索（DeepSeek）这轮融资消息出来时，不少人第一反应是：他们不是一直说自己有钱不需要融资吗？事实也是这样——从成立到2026年，DeepSeek所有的研发和计算开支都是创始人梁文锋自己出的。现在突然拿了一轮510亿人民币（约74亿美元）的外部融资，估值站上4000亿人民币（约550亿美元），创始人个人在这轮里仍然出了200亿人民币。

也就是说，这轮融资里近40%的钱仍然是梁文锋自己的。剩下的大头来自腾讯、宁德时代，以及中国国家人工智能产业投资基金。这个投资方组合本身就值得琢磨：腾讯能给它微信生态的入口和流量，宁德时代能给它能源和算力基础设施的支持，国家AI产业基金进来，意味着DeepSeek已经被放到国家级AI战略的底牌里了。

DeepSeek完成首轮74亿美元融资，估值超500亿美元（图源：beststartup.asia）

但真正让外界在意的是这轮融资的治理结构。腾讯和宁德时代这些商业投资者，拿到的股份有五年锁定期，而且没有投票权。投票权归国家AI产业基金，而且这个基金的股份没有锁定期。换句话说，DeepSeek的战略方向实际上是由国家基金把控的，商业投资者只能拿分红，不能干预公司的技术路线和商业化决策。

DeepSeek在2025年初发布的R1推理模型和V3语言模型，用远低于美国AI实验室的训练成本，达到了接近GPT-4和Claude的水平。这件事直接导致英伟达等AI基础设施股票出现显著抛售，因为市场开始怀疑：如果DeepSeek的方法是对的，那是不是就不需要买那么多GPU了？

这个疑问现在仍然没有确切答案。但DeepSeek拿到74亿美元之后，毫无疑问可以买更多的算力、训练更大的模型。之前他们是因为没钱才被迫把模型做”高效”，现在钱到位了，接下来会往哪个方向走——是继续做高效小模型，还是也加入千亿参数、万亿参数的军备竞赛？——外界只能等他们下一代模型发布才知道。

五年锁定期，意味着什么

腾讯和宁德时代愿意接受五年锁定、无投票权的条件，说明这笔投资更多是战略卡位，而不是财务投资。腾讯需要AI大模型来补微信生态里的智能助手能力，宁德时代需要AI来优化电池管理系统和生产线自动化，两边都有自己的算盘。

五年锁定期还有一个效果：DeepSeek在接下来五年里不用担心投资人逼着上市、逼着变现。梁文锋之前一直说不想那么快商业化，现在拿了国家的钱和腾讯、宁德时代的钱，反而可以更从容地做研究。当然，反过来说，这也就意味着DeepSeek的技术路线必须符合国家对AI发展的整体布局，不是想做什么就做什么。

对海外客户来说，这个治理结构是一个明确的信号：DeepSeek是一个有国家背景的AI实验室。日本、韩国、印度、东南亚这些市场里，原本因为DeepSeek模型便宜、好用而在考虑接入的企业，现在需要重新评估一遍合规和风险。这也给了那些治理结构更透明、没有国家控股的AI公司一个抢客户的机会。

DeepSeek这轮融资还给亚洲其他国家的AI战略提了一个醒：要做前沿AI，需要多少钱？74亿美元大概是一个基准线。新加坡、日本、韩国、阿联酋的 sovereign fund 如果在2026年开始认真考虑投AI，这个数字是一个绕不开的参考。

📎 原文来源：BestStartup.Asia – DeepSeek Funding 2026: New $7.4 Billion Shakes Global AI

2026年6月18日
机器人训练数据成了AI新战场，这家公司刚拿了7000万美元

机器人训练数据收集需要大量物理交互场景的标注

训练一个大语言模型，你只需要扒下整个互联网的文本就行。但训练一个能叠衣服、拿杯子的机器人？那可没现成的数据海洋给你捞。

这就是XDOF看到的机会。这家今天刚从隐身模式走出来的初创公司，刚拿了7000万美元融资，投资方包括Thrive Capital、Spark Capital、a16z、Lux和WndrCo。他们的赌注很简单：AI的下一个瓶颈不是模型也不是芯片，而是教机器人理解物理世界的数据反馈回路。

为什么机器人数据这么难搞

语言模型可以啃下整个互联网的文本，因为文字是现成的。但机器人需要的数据得捕捉物理交互——手怎么抓、力怎么控、物体怎么响应。这类数据几乎不存在。

YouTube视频？画质太低，而且你不知道视频里的人到底用了多少力、手指是什么角度。众包工人拍的片段？同样的问题，而且很难和真实的物理参数对上号。

XDOF的联合创始人兼CEO Philipp Wu在UC Berkeley读博时就撞上了这堵墙。他的研究方向是让机器人从大规模数据集里学习技能，但问题来了——根本没有大规模数据。

“这是一个鸡生蛋、蛋生鸡的问题——我们得先实际收集数据，才能开始问怎么为机器人训练基础模型。”

从学术论文到商业项目

Wu和后来的联合创始人、CTO Fred Shentu搞出了一个叫GELLO的低成本遥操作系统，让人类操作员可以控制机械臂来生成训练数据。这个项目后来成了一篇在机器人圈很有影响力的论文，因为很多实验室都有同样的数据瓶颈，开始用这类设备来采集数据。

看到机会后，Wu、Shentu和第三位联合创始人、COO Nemo Jin在2024年10月创立了XDOF，专门为搞机器人模型的公司提供数据生态系统。公司现在有约60名员工，已经在对口20家客户，包括几家前沿AI实验室（名字不能透露）。

Wu说得很直接：”所有顶尖实验室都在追机器人。我们已经看到在语言模型竞赛中稍微落后的后果……你不想在物理AI成为下一个前沿时被甩在后面。”

数据金字塔的三层结构

XDOF的计划是覆盖一个数据金字塔的三个层级。最值钱的一层是在实际部署的机器人上采集的遥操作数据；第二层是用遥操作机器人采集更通用的数据（就像GELLO那样）；第三层是”以自我为中心”的数据——人类戴穿戴式传感器完成日常任务时采集的数据，XDOF计划自己造这种传感器。

选什么摄像头会直接影响数据质量，进而影响手 tracking 算法的表现。Wu说：”如果你一开始不把硬件设计好，你采集的数据可能会有你没预料到的特定问题。”

为什么大实验室不自己搞

这个问题很自然：为什么OpenAI、Google DeepMind这些巨头不自己建数据管道？Wu的回答是规模和专注度：”你需要一个几十万平方英尺的仓库，里面放上几百台机器人。你还得维护这些机器人、校准它们的物理参数、 properly培训操作员。”

这种重资产、劳动密集的运营模式，大多数AI实验室宁愿外包。而这正是XDOF押注的市场。

公司名字XDOF是个双关，既指机器人学里的”自由度”（degrees of freedom，描述机器人能独立运动的方向数），也表达了他们的野心：”任意自由度，无限自由度。”

XDOF已经和UC Berkeley的AI研究实验室合作，发布了他们声称的有史以来最大的高质量机器人训练数据集合，叫ABC。里面有13万条机器人操作数据轨迹、300小时仿真数据和100小时评估数据。这种规模的预训练数据以前学术界根本拿不到。

团队已经用这些数据训练机器人做折T恤、压扁纸箱、把AirPods塞进盒子这类基准任务。接下来，物理AI的数据军备竞赛才刚刚开始。

📎 原文来源：TechCrunch – Collecting robot training data is dirty, unglamorous work

2026年6月18日
世界模型公司Odyssey冲到145亿美元估值，Amazon、AMD都来了

大语言模型之后，AI的下一个战场在哪里？越来越多人的答案是：世界模型（World Model）。而这家叫做Odyssey的公司，刚刚用一份融资成绩单告诉市场：资本已经用真金白银投了票。

Odyssey完成3.1亿美元B轮融资，投后估值145亿美元。这轮由Natural Capital领投，Amazon、AMD Ventures、GV等跟投。加上这笔，公司成立以来总共融了3.37亿美元——对于一个2023年才成立的初创公司来说，这个速度相当惊人。

世界模型试图让AI理解物理世界的运行规律 | 概念图

创始人背景：自动驾驶的老兵

Odyssey的两位创始人，CEO Oliver Cameron和CTO Jeff Hawke，都是从自动驾驶行业出来的。Cameron之前是自动驾驶初创公司Voyage的联合创始人兼CEO，后来Voyage被GM的Cruise收购，他就在Cruise做产品VP。Hawke则在另一家英国自动驾驶公司Wayve当工程师。

这个背景其实解释了Odyssey在做什么。世界模型的核心是：让AI理解物理世界的运行规律——重力、碰撞、光线、物体之间的相互作用。这正是自动驾驶公司一直在攻克的问题，只不过Odyssey把它做成了一个通用平台，可以应用到游戏、机器人、虚拟现实等多个领域。

怎么采集数据？背上摄像头走遍全世界

要训练世界模型，得先有海量真实世界的视频数据。Odyssey的做法相当”物理”：派人背上摄像头，走街串巷地拍。这个思路其实和Google Earth有点像，只不过Google是开车拍，Odyssey是让人背着设备步行采集，能覆盖到车辆到不了的地方。

世界模型不只是生成视频，它要模拟物理规律。这意味着AI生成的画面里，一个杯子掉到地上会碎，一个球踢出去会按照抛物线飞行——而不是每一帧都”猜”接下来发生什么。

应用场景：从游戏到机器人

目前Odyssey的世界模型已经有几个明确的方向。游戏是最直接的——用文字提示词生成可交互的3D视频内容，理论上可以大幅降低游戏场景的制作成本。机器人是另一个大方向：用世界模型做仿真训练，让机器人在虚拟环境里”摔”几千次，再放到现实里。

和Amazon的合作也值得注意。Odyssey宣布AWS成为其首选云服务商，并且会优化模型以运行在AWS的Trainium芯片上——这是Amazon自家开发的AI训练芯片，直接对标Nvidia的GPU。有了Amazon的投资和云资源，Odyssey在算力成本上可能比竞争对手更有优势。

天使投资人名单：硅谷半壁江山

除了机构投资人，Odyssey这轮还拉来了一批重量级天使：Google传奇工程师Jeff Dean、知名天使Elad Gil、YC现任CEO Garry Tan、Vercel CEO Guillermo Rauch，还有Cruise创始人Kyle Vogt。这个阵容基本上把硅谷AI圈最有话语权的那批人都聚齐了。

世界模型是不是下一个大机会，现在下结论还为时过早。但资本已经在用行动表态：这个方向，值得押注。

📎 原文来源：TechCrunch · World model maker Odyssey nabs $1.45B valuation

2026年6月18日
这家公司想用数学证明来管住AI的幻觉，2700万美元押一条没人走的路

企业想把AI用到实处，最难的不是让模型”说出话”，而是让说出来的话靠谱。税务、法律、药物研发——这些领域错一个字就是真金白银甚至人命，AI幻觉在这儿比别处更致命。一家刚冒头的新公司觉得，解决这个问题靠的不是把模型做得更大，而是把规则写得更死。

给AI套上数学的缰绳

Pramaana Labs本周冒了出来，拿了Kholla Ventures领投的2700万美元种子轮，Accel、Boldcap、Nexus Venture Partners、Premji Invest和Unbound跟投。这家公司的主意说起来不复杂：用计算机科学里最”死板”的工具——数学形式化验证——来管住AI最”飘”的那部分幻觉和乱编。

形式化验证让AI的推理过程变得可验证 | 配图来源：WorkBuddy AI生成

CEO Ranjan Rajagopalan的说法是：税务法规本质上就是一套规则，跟数学差不多。一旦把规则用代码形式化，推理过程就能变成确定性的——换句话说，AI可以天马行空地理解自然语言，但最后得出来的结论必须过一道”数学检查”，否则不让出门。

“世界上最难的问题不是无解，而是没有被形式化。每个’出错就要命’的领域——健康、金钱、自由——都有规则，只是这些规则还没被写成代码。”
——Ranjan Rajagopalan，Pramaana Labs联合创始人兼CEO

LEAN语言来了

Pramaana的做法是在常规LLM上面加一层确定性验证，这套验证用的是开源LEAN编程语言的工具——本来这东西是用来验证数学证明的，现在被他们拿来验证AI的输出。有法国民俗，法国的CATALA项目已经把本国税法和福利系统的一大块形式化成了可执行代码，算是这条路上有分量的先驱。

每个使用场景，Pramaana会搭一套自己的类LEAN形式化验证系统，并且有领域专家盯着。税务方向的前IRS局长Danny Werfel在公司顾问名单上；网络安全与药物研发系统则由IIT Delhi、IIT Madras和UC Berkeley的教授们把关。

为什么是现在

AI可靠性这事儿，搁两年前大家还在实验室里吵，现在企业已经被迫要认真对待了。幻觉在闲聊里是个笑话，在报税软件里就是一个灾难。Pramaana挑的这几个垂直领域——法律、药物研发、税务——恰恰是容错率最低的几个地方，也是愿意为”可靠性”付钱的地方。

这条路能不能走通，取决于一件事：把现实世界的复杂规则完整、准确地形式化，这件事本身难度就不比做AI小。但Rajagopalan的判断是，那些规则本来就在那儿，只是没人把它们变成代码而已。

📎 原文来源：Pramaana Labs raises $27M seed round from Khosla Ventures to bring formal verification to AI — TechCrunch

2026年6月17日
KPMG的AI报告因为幻觉被撤，这家刚拿900万美元的公司说他们有解法

AI幻觉问题正催生新的技术解决方案

前几天KPMG撤掉了一份关于AI使用的报告，原因是报告里引用了多家机构的数据，但那些机构纷纷表示”我们没说过这个”。调查发现，这些错误来自AI幻觉——也就是说，这家全球顶级专业服务公司在制作一份关于AI的报告时，自己先被AI骗了。

这件事在AI圈子里传开之后，很多人把它当成一个笑话。但笑完之后，一个更严肃的问题摆在所有AI用户面前：如果连KPMG都用不好AI，普通人该怎么办？

“机甲套装”思路

Peter Elias创办的Probably公司刚拿了900万美元种子轮，领投方是Andreessen Horowitz。他们的思路说起来不复杂：既然大模型天生就会犯事实性错误，那就不要让用户直接碰到原始模型的输出，在模型和用户之间加一层”套装”——Elias自己用的词是”mech suit”（机甲套装）。

具体做法是：大模型的初版回答先经过一个确定性验证系统（deterministic validator）检查，验证系统会根据已知的数据集来核对结果，任何对不上的回答都会被打回去重算。关键是，大模型本身也针对这个验证系统做了训练，整个链条是一起优化的，而不是各干各的。

Elias总结了一句话：”你的套装工程设计得越好，你需要的模型就越弱。”意思是，如果你能把上下文整理得足够精确，模型其实不需要很聪明也能给出正确答案。本质上，这是在减少歧义。

用小模型干大事

这套架构带来一个有趣的副作用：因为验证层承担了大部分”把关”工作，Probably的数据科学工具实际上跑的是一个比前沿模型”弱四个级别”的模型。换句话说，他们不需要GPT-4o或者Claude Sonnet这种级别的模型，也能给出准确率极高的回答。

这意味着什么？意味着整套系统可以跑在本地硬件上，不需要把每一次查询都发到OpenAI或者Anthropic的服务器。对于企业用户来说，这省掉了一大笔token费用，也不用担心敏感数据离开自己的网络。

Elias说他们当前版本的模型跑在桌面级硬件上就没问题。这个定位很聪明——在大家都拼命往云端跑的时候，他选择了往本地走。

大AI实验室为什么不做这个

Elias在接受TechCrunch采访时说了一段挺直接的话：”有趣的是，大型AI实验室甚至没有尝试过这样做。他们的激励机制不支持他们这样做，因为用户越是需要反复纠正模型，他们就越赚钱。”

这个观察很犀利。OpenAI、Anthropic、Google这些公司的商业模式本质上建立在”模型还不够好”这个前提上——如果一次就能给出正确答案，用户就不需要多次调用API，收入就会下降。所以让他们主动把准确率做到99.99%，相当于让他们自己砍自己的收入。

Probably目前的第一款产品是一个数据科学工具，但Elias说这套引擎可以扩展到任何对精度敏感的场景——会计、医疗、法律分析，这些都是容错率极低的领域，也是目前AI最难真正落地的领域。

KPMG的尴尬撤稿事件其实正好给市场做了一次普及教育：AI幻觉不是小问题，它会导致真实的、可量化的损失。能解决这个问题的人，值得那900万美元。

📎 原文来源：Probably raises $9M to build a more reliable kind of AI — TechCrunch

2026年6月17日

标签： AI创业

DeepSeek首次开门拿钱：510亿融资背后，梁文锋掏了200亿

梁文锋掏了200亿，DeepSeek终于开门拿钱了

五年锁定期，意味着什么

机器人训练数据成了AI新战场，这家公司刚拿了7000万美元

为什么机器人数据这么难搞

从学术论文到商业项目

数据金字塔的三层结构

为什么大实验室不自己搞

世界模型公司Odyssey冲到145亿美元估值，Amazon、AMD都来了

创始人背景：自动驾驶的老兵

怎么采集数据？背上摄像头走遍全世界

应用场景：从游戏到机器人

天使投资人名单：硅谷半壁江山

这家公司想用数学证明来管住AI的幻觉，2700万美元押一条没人走的路

给AI套上数学的缰绳

LEAN语言来了

为什么是现在

KPMG的AI报告因为幻觉被撤，这家刚拿900万美元的公司说他们有解法

“机甲套装”思路

用小模型干大事

大AI实验室为什么不做这个