标签: AI

  • DeepSeek首次开门拿钱:510亿融资背后,梁文锋掏了200亿

    DeepSeek首次开门拿钱:510亿融资背后,梁文锋掏了200亿

    梁文锋掏了200亿,DeepSeek终于开门拿钱了

    深度求索(DeepSeek)这轮融资消息出来时,不少人第一反应是:他们不是一直说自己有钱不需要融资吗?事实也是这样——从成立到2026年,DeepSeek所有的研发和计算开支都是创始人梁文锋自己出的。现在突然拿了一轮510亿人民币(约74亿美元)的外部融资,估值站上4000亿人民币(约550亿美元),创始人个人在这轮里仍然出了200亿人民币。

    也就是说,这轮融资里近40%的钱仍然是梁文锋自己的。剩下的大头来自腾讯、宁德时代,以及中国国家人工智能产业投资基金。这个投资方组合本身就值得琢磨:腾讯能给它微信生态的入口和流量,宁德时代能给它能源和算力基础设施的支持,国家AI产业基金进来,意味着DeepSeek已经被放到国家级AI战略的底牌里了。

    DeepSeek融资AI概念图
    DeepSeek完成首轮74亿美元融资,估值超500亿美元(图源:beststartup.asia)

    但真正让外界在意的是这轮融资的治理结构。腾讯和宁德时代这些商业投资者,拿到的股份有五年锁定期,而且没有投票权。投票权归国家AI产业基金,而且这个基金的股份没有锁定期。换句话说,DeepSeek的战略方向实际上是由国家基金把控的,商业投资者只能拿分红,不能干预公司的技术路线和商业化决策。

    DeepSeek在2025年初发布的R1推理模型和V3语言模型,用远低于美国AI实验室的训练成本,达到了接近GPT-4和Claude的水平。这件事直接导致英伟达等AI基础设施股票出现显著抛售,因为市场开始怀疑:如果DeepSeek的方法是对的,那是不是就不需要买那么多GPU了?

    这个疑问现在仍然没有确切答案。但DeepSeek拿到74亿美元之后,毫无疑问可以买更多的算力、训练更大的模型。之前他们是因为没钱才被迫把模型做”高效”,现在钱到位了,接下来会往哪个方向走——是继续做高效小模型,还是也加入千亿参数、万亿参数的军备竞赛?——外界只能等他们下一代模型发布才知道。


    五年锁定期,意味着什么

    腾讯和宁德时代愿意接受五年锁定、无投票权的条件,说明这笔投资更多是战略卡位,而不是财务投资。腾讯需要AI大模型来补微信生态里的智能助手能力,宁德时代需要AI来优化电池管理系统和生产线自动化,两边都有自己的算盘。

    五年锁定期还有一个效果:DeepSeek在接下来五年里不用担心投资人逼着上市、逼着变现。梁文锋之前一直说不想那么快商业化,现在拿了国家的钱和腾讯、宁德时代的钱,反而可以更从容地做研究。当然,反过来说,这也就意味着DeepSeek的技术路线必须符合国家对AI发展的整体布局,不是想做什么就做什么。

    对海外客户来说,这个治理结构是一个明确的信号:DeepSeek是一个有国家背景的AI实验室。日本、韩国、印度、东南亚这些市场里,原本因为DeepSeek模型便宜、好用而在考虑接入的企业,现在需要重新评估一遍合规和风险。这也给了那些治理结构更透明、没有国家控股的AI公司一个抢客户的机会。

    DeepSeek这轮融资还给亚洲其他国家的AI战略提了一个醒:要做前沿AI,需要多少钱?74亿美元大概是一个基准线。新加坡、日本、韩国、阿联酋的 sovereign fund 如果在2026年开始认真考虑投AI,这个数字是一个绕不开的参考。

  • Meta联手Prada和Oakley做AI智能眼镜,这次要走高端时尚路线

    Meta联手Prada和Oakley做AI智能眼镜,这次要走高端时尚路线

    从雷朋到保时捷,Meta的智能眼镜版图扩张

    Meta和依视路陆逊梯卡(EssilorLuxottica)最近放出消息,要在Oakley和Prada这两个品牌下推出AI智能眼镜。这事听起来像是把AI助手塞进不同档次的运动眼镜和奢侈墨镜里,但背后的算盘打得相当精细。

    先说Oakley这个方向。Meta盯上的是运动人群——过去一段时间,他们观察到不少戴Ray-Ban Meta眼镜的人拿它来录网球挥拍、滑雪滑行这些场景。Oakley本来就是做运动眼镜起家的,镜框更粗、防护性更强,把这些东西塞进去比Ray-Ban那副文质彬彬的镜框要合理得多。价格大概在360美元左右,比现在的Ray-Ban Meta贵一些,但防水防汗性能更好。

    Meta AI智能眼镜概念图
    Meta在2024年Connect大会上展示的Orion AR眼镜原型(图源:CNBC)

    Prada那条线更有意思。这是Meta第一次把智能眼镜往高端时尚品牌上靠,之前Ray-Ban再怎么也还是”大众轻奢”,Prada直接是奢侈品门槛。有个细节挺说明问题:Prada的镜腿本来就做得比较粗,反而给麦克风、芯片这些零件留出了空间,工程师不用为了塞元件把镜框搞得怪模怪样。Prada和依视路陆逊梯卡在2024年12月刚续了十年的眼镜授权协议,Meta这时候切入,基本上是顺着现成的生产线往上叠AI功能。

    Meta和依视路陆逊梯卡2019年开始合作,第一代Ray-Ban眼镜2021年上市,真正卖起来是2023年的第二代。依视路陆逊梯卡CEO在2025年2月说,两家合计已经卖了200万副Ray-Ban Meta眼镜,目标是在2026年底把年产能拉到1000万副。

    200万副是什么概念?如果按Ray-Ban Meta眼镜平均300美元算,这是6亿美元的硬件收入,还不包括Meta AI那边带来的生态价值。依视路陆逊梯卡手里捏着超过150个品牌的眼镜授权,Meta把合作扩到Oakley和Prada,本质上是在试同一套AI眼镜技术能覆盖多少种不同的消费人群。

    竞争这边已经开始围上来了。Google和Warby Parker在2025年宣布了1.5亿美元的合作,打算把Gemini装进Warby Parker的眼镜里,产品预计2026年之后上市。Snap在2025年6月宣布了第六代智能眼镜,新品牌叫Specs,预计2026年上市,主打AR功能,比之前的产品更轻更小。Qualcomm的CEO Cristiano Amon公开说过,Qualcomm、Samsung和Google都在做智能眼镜。


    同一套技术,不同的眼镜,Meta在下什么棋

    Meta的打法和Snap、Apple这些人不太一样。Snap的Specs是要做一台”眼镜形态的计算机”,有独立的AR显示和系统;Meta现在的做法是把同一套AI语音助手、摄像头、麦克风模组,装进不同品牌、不同价位的眼镜框里,让消费者按自己的穿搭和预算选,但背后跑的是同一个Meta AI。

    这套打法能跑通的前提是:智能眼镜的”智能”部分最终会变成一个可以模块化嵌入的组件,而不是每副眼镜都从头搞一遍。Meta和依视路陆逊梯卡在2024年9月把合作协议延了期,总对价高达50亿美元,依视路陆逊梯卡还给了Meta好几年独家把智能眼镜技术装进它旗下品牌的权利。

    按CNBC拿到的文件,Oakley Meta眼镜的第一版技术规格和2023年的Ray-Ban Meta眼镜差不多,也就是说Meta现阶段并不打算每换一个品牌就重新设计一遍硬件,而是在现有成熟方案上做外观和定位的差异化。这个思路很务实——先让技术在不同人群里跑起来,收集数据,再迭代下一代。

    Prada那条线什么时候公布,目前还没有确切消息。但从依视路陆逊梯卡的授权覆盖范围来看,Prada Linea Rossa和Miu Miu也在合作清单里,Meta的眼镜版图大概率还会继续往这个方向扩。对Meta来说,这不只是卖硬件,而是在尽可能多的场景下让Meta AI成为用户低头看手机之外的那个默认入口。

  • Character.AI 给创作者发「数据面板」了,AI 陪聊平台开始认真做生态

    Character.AI 给创作者发「数据面板」了,AI 陪聊平台开始认真做生态

    Character.AI 这两天悄悄上线了一批新工具,目标用户是那些在平台上制作 AI 角色的创作者。简单说就是:给你一个后台数据面板,让你看到自己做的 AI 角色到底有多少人喜欢、互动量怎么样、哪天突然火了。

    这件事看起来小,但其实透露了一个信号:Character.AI 不只想做一个”陪你聊天的 AI 平台”,它想做的是一个”AI 角色创作生态”。

    创作者最想要的东西:数据

    新上线的仪表盘(dashboard)会显示创作者的”最受欢迎 AI 角色”排行,以及一系列关键指标:互动次数、点赞数、被新用户发现的数量。这些数据对创作者来说很重要——你总得知道自己的努力有没有人看,哪类角色更受欢迎,对吧?

    在此之前,Character.AI 上的创作者基本上是”盲做”——发了一个角色出去,不知道有多少人真的在用,哪些对话场景最受欢迎。有了数据面板,至少能往”精细化运营”的方向走一步。

    AI 聊天机器人创作者平台概念图
    AI 角色创作平台的数据面板,让创作者看到自己的”作品”表现如何

    新通知功能:粉丝追更

    另一个新功能是”创作者上线通知”。当某个创作者发布了一个新的 AI 角色,他的关注者会收到通知。这个设计很明显是在借鉴社交平台的玩法——让创作者和粉丝之间建立更稳定的连接。

    想想看,这和 B 站 UP 主发视频、公众号作者推文章的逻辑是一样的:平台帮创作者维护粉丝关系,创作者持续产出内容,用户有更多理由留在平台上。Character.AI 如果真能把这套”创作者-粉丝”的关系跑通,它的护城河会比单纯做一个聊天工具深得多。

    据 Character.AI 的数据,平台上已经有数百万用户,每天都有大量新 AI 角色被创建。但真正能持续吸引用户的角色,可能只占很小的比例。

    AI 陪聊平台的”创作者经济”

    把这件事放在更大的背景里看,AI 陪聊平台正在经历一个有趣的转型:从”工具”变成”平台”。

    早期大家玩 Character.AI 是因为”哇,这个 AI 好逼真”。但现在,平台需要解决的已经不只是技术问题,而是生态问题:创作者为什么要在你这里做角色?用户为什么要在你这里聊天而不是去别的地方?广告主为什么要投你?

    给创作者提供数据工具,只是第一步。接下来大概率会出现的创作激励、分成机制、优质角色推荐位……这些在内容平台(抖音、B站、小红书)已经被验证过的玩法,Character.AI 迟早也要走一遍。

    有意思的是,Character.AI 的联合创始人 Noam Shazeer 今天刚刚宣布加入 OpenAI——也就是我们正在说的那个大新闻。那么问题来了:Shazeer 走了之后,Character.AI 的这波”生态化”转型能不能持续推进?新工具能不能真的帮到创作者?这些问题的答案,可能要等几个月才能看清。


  • Gemini 联合负责人加入 OpenAI:Google 花27亿美元请回来的人,还是被挖走了

    Gemini 联合负责人加入 OpenAI:Google 花27亿美元请回来的人,还是被挖走了

    Noam Shazeer 今天在社交平台上宣布,他将离开 Google,加入 OpenAI。这条消息在 AI 圈子里炸了锅——倒不是因为”有人跳槽”这件事本身,而是这个人的分量太重。

    如果你对 AI 研究的底层历史有了解,Shazeer 这个名字不会陌生。2017 年那篇《Attention is All You Need》的 Transformer 论文,他是作者之一。这套架构今天支撑着整个大语言模型世界——ChatGPT、Claude、Gemini,全都是它的后代。说 Shazeer 是”AI 大厦的奠基人之一”,不算夸张。

    Google 花了27亿美元才请回来

    事情的有趣之处在于时间线。Shazeer 并不是一直在 Google。他在 2021 年离开 Google,联合创办了 Character.AI——那个让你和虚拟角色对话的 AI 平台。Google 想要他回来,开出了天价。

    2024 年,Google 据报道支付了 27 亿美元(是的,你没看错)将 Shazeer 和他的研究团队从 Character.AI “请”了回来。他回来后担任 Google DeepMind 工程副总裁,同时是 Gemini 模型的联合负责人。也就是说,今天支撑 Google AI 竞争力的核心人物,两年前才刚刚被重金请回。

    AI 人才流动概念图
    AI 顶尖人才的流向,往往预示着技术格局的变动

    OpenAI 给他的新头衔

    Shazeer 在 OpenAI 将担任”架构研究负责人”(Lead for Architecture Research)。这个头衔透露了一些信号:OpenAI 希望他在模型架构层面做探索,而不只是做一些应用层的工作。

    Transformer 架构问世将近十年,各家都在寻找”下一代架构”。Mamba、Hyena、KAN……各种尝试层出不穷,但还没有谁能真正取代 Transformer。Shazeer 本人就是 Transformer 的作者,由他来探索下一步往哪走,这个安排本身挺有意思。

    Shazeer 在告别帖里说,离开 Google 是”一个艰难的决定”,对 Google 团队”无比自豪”。这种措辞在硅谷的人才流动中算是标准操作——体面告别,不撕破脸。

    时间点也微妙

    OpenAI 最近在准备 IPO,公司正处于从”研究实验室”向”上市公司”转型的关键阶段。这个时候挖来一位有传奇色彩的架构师,至少有两层用意:对内稳住技术团队士气,对外向市场和投资人展示”我们还在招最牛的人”。

    对 Google 来说,这当然不是好消息。刚刚在 Gemini 上取得一些进展,联合负责人就被竞争对手挖走,而且这个人还是你自己花 27 亿美元才请回来的。这种故事放在任何一家公司都是公关噩梦。

    不过换个角度看,AI 领域的人才流动向来频繁。Shazeer 的离开会不会影响 Gemini 的进展?短期可能有一点,但 Google DeepMind 的团队厚度还是够的。真正值得关注的是:这会不会引发一轮新的 AI 人才争夺战?毕竟,OpenAI 挖人可不止挖这一个。


  • RAGFlow:83K+ Stars 的开源 RAG 引擎,为 LLM 打造卓越上下文层

    RAGFlow:83K+ Stars 的开源 RAG 引擎,为 LLM 打造卓越上下文层

    📌 项目简介

    RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,由 InfiniFlow 团队(Milvus 向量数据库原班人马)开发,将前沿 RAG 技术与 Agent 能力深度融合,为大语言模型提供卓越的上下文理解层。

    RAGFlow 架构图

    RAGFlow 系统架构概览


    ⚙️ 安装要求和过程

    环境要求(自托管)

    配置项 最低要求
    CPU ≥ 4 核
    内存 ≥ 16 GB
    磁盘 ≥ 50 GB
    Docker ≥ 24.0.0
    Docker Compose ≥ v2.26.1

    🐳 Docker 快速部署(推荐)

    # 1. 调整系统内核参数(避免 Elasticsearch 启动失败)
    sudo sysctl -w vm.max_map_count=262144
    
    # 2. 克隆项目代码
    git clone https://github.com/infiniflow/ragflow.git
    cd ragflow/docker
    
    # 3. 切换到稳定版本
    git checkout v0.26.1
    
    # 4. 启动服务(仅CPU)
    docker compose -f docker-compose.yml up -d
    
    # (可选)如需GPU加速,先执行:
    # sed -i '1i DEVICE=gpu' .env
    # docker compose -f docker-compose.yml up -d
    
    # 5. 验证服务状态
    docker logs -f docker-ragflow-cpu-1

    启动成功后,浏览器访问服务器 IP 地址(默认 HTTP 端口 80)即可进入 RAGFlow 登录页面。

    💻 源码启动(开发用途)

    # 安装依赖工具
    pipx install uv pre-commit
    
    # 克隆代码
    git clone https://github.com/infiniflow/ragflow.git
    cd ragflow/
    uv sync --python 3.13
    uv run python3 download_deps.py
    
    # 启动基础依赖服务
    docker compose -f docker/docker-compose-base.yml up -d
    
    # 启动后端
    source .venv/bin/activate
    export PYTHONPATH=$(pwd)
    bash docker/launch_backend_service.sh
    
    # 启动前端(新终端)
    cd web && npm install && npm run dev

    ✨ 核心功能

    1. 深度文档理解,输入即精准

    基于先进的文档解析技术,可从格式复杂的非结构化数据(PDF、Word、PPT、Excel、扫描件、图片等)中精准提取知识,真正做到”Quality in, Quality out”。

    2. 可视化模板化分块,答案可追溯

    分块逻辑智能可解释,提供大量预置分块模板;支持文本分块可视化,允许人工干预调整;最终答案附带可追溯的引用来源,有效降低 LLM 幻觉问题。

    3. 多源数据兼容,异构数据统一管理

    支持解析 Word、PPT、Excel、TXT、图片、扫描件、结构化数据、网页等各类异构数据源,一站式完成企业知识库构建。

    4. Agentic 工作流 + MCP 协议支持

    内置丰富 Agent 能力,支持 Agentic 工作流编排、MCP 协议接入;内置 Python/JavaScript 代码执行器组件;支持 AI Agent 记忆功能。

    5. 高精度混合检索,多路召回+融合重排

    结合向量搜索、BM25 关键词搜索和自定义评分机制,配合先进重排序算法,提供无与伦比的回答准确性和上下文相关性。


    🚀 典型使用场景

    📈 股权投资研究

    自动化收集公司数据,整合财务指标与研究洞察。通过自主规划和多智能体编排,实现高级股票分析。自动从用户查询中识别股票代码,聚合外部权威来源和内部记录中的洞察,最终结合定性洞察和财务指标生成完整投资报告。

    ⚖️ 法律判例分析

    通过检查公共来源和内部数据集中的类似法律案例,提供结构化判例分析。自动提取关键属性(如司法管辖区和法律问题)以制定搜索查询并检索可比较的先例,最终整合成结构化分析报告。

    🏭 制造业维护支持

    通过从内部手册中准确获取内容,提供结构化维护指导(外部参考作为补充支持)。输入任务后,工作流首先验证输入充分性,然后从内部维护手册中提取标准协议,整合补充外部技术数据,生成清晰的执行指令。


    💡 推荐理由

    RAGFlow 是我用过的最”务实”的 RAG 产品,没有之一。

    第一,它真正解决了 RAG 的底层痛点——文档解析。很多 RAG 框架只关注向量检索和生成,却忽略了最关键的”输入质量”问题。RAGFlow 的 DeepDoc 技术能精准解析复杂格式的 PDF、扫描件,真正做到”Garbage in, garbage out”的反面——Quality in, quality out

    第二,可视化分块 + 可追溯引用,让 AI 回答有章可循。这是企业场景的刚需。你可以清楚看到每个答案是从哪个文档的哪个位置来的,大幅降低了 LLM 幻觉带来的风险。

    第三,Agentic 能力的融合非常自然。不是简单地在 RAG 上面套一个 Agent 外壳,而是将 Agent 能力(MCP 协议、代码执行、记忆管理)深度集成到 RAG 工作流中,真正实现了”RAG + Agent”的一体化编排。

    最后,InfiniFlow 团队是 Milvus 的原班人马,技术底蕴深厚。83K+ Stars 和 9600+ Forks 的社区活跃度也证明了产品的成熟度。如果你正在构建企业级知识库或 RAG 应用,RAGFlow 绝对值得一试。


    📥 下载地址

    🌐 官方网站:https://ragflow.io

    📦 GitHub 开源地址:https://github.com/infiniflow/ragflow ⭐ 83K+ Stars

    ☁️ 云服务(快速体验):https://cloud.ragflow.io

    📚 官方文档:https://ragflow.io/docs/dev/

    💡 小贴士:RAGFlow 支持飞书、Discord、Telegram、Line 等多聊天渠道接入(2026年6月更新),可快速将企业知识库接入到日常沟通工具中!

  • 年轻人开始嫌手机太吵了,”慢科技”成了新潮流

    年轻人开始嫌手机太吵了,”慢科技”成了新潮流

    慢科技潮流:放下手机
    年轻人开始尝试放下手机,重新拥抱”无屏幕”体验

    Tony Fadell 走进纽约第 28 街地铁站的时候,没料到自己会跟一张二十年前的”老朋友”海报面对面。

    那是一张 iPod Shuffle 的广告,五英尺乘四英尺,挂在站台墙上,宣传语写的是”零屏幕时间”。

    iPod Shuffle 广告为什么还贴在 2026 年的地铁里?

    “第一反应是,等等,是不是有人忘了换广告?”Fadell 后来跟 TechCrunch 说。他是 iPod 的发明人,被叫作”iPod 之父”,看着那张海报,就像看到自己孩子的照片。

    但仔细想想,这件事有点荒诞。Fadell 站在地铁站里,周围全是人——每个人都戴着无线蓝牙耳机,从手机里无阻地流着音乐,曲库里有一亿多首歌随时点播。这种我们早已习以为常的事,让乔布斯当年那句”你口袋里的一千首歌”听起来像出土文物。

    那张 iPod Shuffle,那个邮票大小、只能随机播放、你几乎没法控制它放什么的设备,按理说对今天的用户毫无吸引力。但我们已经被科技裹挟得太深了。

    “人们现在已经过度饱和、过度刺激了,他们真的想要一种更觉察自主的方式来处理自己跟科技的关系。”——Joy Howard,Back Market 首席营销官

    “慢科技”是什么?

    Back Market(一家翻新技术设备电商平台)的团队就是那张 iPod Shuffle 广告的操盘手。他们的首席营销官 Joy Howard 说,需求正不断增长——如果这些”过时”设备没有真的在拉动销售,公司不会舍得在纽约地铁站买那么贵的广告位。

    对从未经历过没有社交媒体和智能手机世界的年轻一代来说,有线耳机、复古游戏机、CD 和数码卡片相机,有一种奇特的魔力。它们不会把照片自动上传到你的 Instagram Story,不会在游戏里弹赌博广告,也不能算法式地替你决定下一首该听什么。

    Howard 把这种Movement 叫作”慢科技”(slowtech)。核心理念很简单:科技应该是服务你的,不是主宰你的。

    有人在行动了

    Austin Murray 早年在手机游戏行业赚过大钱(他创办的 Jamdat 以 6.8 亿美元卖给了 EA),现在他在做一个叫 MOQA 的”减屏幕时间”App。他跟 TechCrunch 说:”当我看着我的孩子们和周围的人,这件事最让我揪心。平均屏幕时间大概是每天五个小时——这不是意志力问题,是产品设计问题。”

    还有 Light Phone,那款只能打电话、发短信、听音乐的电子墨水屏”傻手机”。联合创始人 Kaiwei Tang 说,越来越多 20 到 35 岁的人开始用 Light Phone,”这让我们挺意外的”。

    作家 Calvin Kasulke(他的小说《Several People Are Typing》想象了打工人被困在 Slack 里的恐怖故事)现在付费用 Opal 和 Freedom 两款 App 来限制自己的社交媒体使用。他说:”我想很清楚地说……我并不为此感到得意。用两个不同 App 来限制自己怎么用手机,这事挺尴尬的。但我觉得屏幕本身不是坏事,只是我之前使用它的方式太蠢了。”


    AI 在这件事里站在哪边?

    有个细节挺有意思。有一款叫 Mark 的”AI 书签”,售价 159 美元,卖点是帮你减少读电子书时掏手机记笔记的频率。听起来有点荒诞——用 AI 硬件来解决 AI 时代的问题——但它的逻辑是成立的:你在读纸质书,想记个笔记,如果掏出手机来记,大概率会被别的通知带偏。用这个 AI 书签,你就不用掏手机了。

    AI 的发展几乎跟”快科技”文化是同义词,但在这个故事里,它也可以是一种帮人”往回走”的工具。这大概就是 Howard 说的:”如果可以用 AI 来做这件事,来保护你自己……这就是人们想要的:更多掌控感。”

    当然,不是所有”慢科技”信徒都同意 AI 该进来插一脚。但更大的问题其实是:我们造出了一个让我们如此依赖智能手机和各种 App 的生态系统,以至于科技行业的每一次任性改动都能决定我们怎么煮饭(Back Market 的开发者甚至”黑”进了一台电饭锅,让它继续工作)。

    在这个现实里,人们如此渴望断开连接,以至于愿意”降级”回一台 iPod Shuffle,这件事本身或许比任何 AI 突破都更值得 AI 行业想清楚。

  • Midjourney要做医疗硬件了,它想用AI把全身超声做成年度体检

    Midjourney要做医疗硬件了,它想用AI把全身超声做成年度体检

    Midjourney Medical 全身超声扫描仪
    Midjourney Medical 全身超声扫描仪概念渲染图

    Richard Lawler 在 The Verge 的报道里讲了一个挺魔幻的故事:Midjourney,就是那个你用来生成”一只戴着宇航员头盔的柯基犬”的 AI 图像工具,现在要做医疗硬件了。

    不是 App,不是插件,是一台真正的、你要走进去、身体沉入水中的全身超声扫描仪。

    “比 MRI 还强”——这话谁说的?

    David Holz(Midjourney CEO)在展示这台叫”Midjourney Scanner”的原型时,承认这跟公司之前干的”生成猫咪图片”相比,确实有点跳脱。但他的野心不小——他说这台设备的图像质量”在很多方面将优于甚至 MRI 机器”。

    “在很多方面将优于甚至 MRI 机器”——David Holz 对 Midjourney Scanner 的评价

    MRI 是什么概念?那是目前医学上最精密的无创成像手段之一。一家靠”文生图”起家的公司说自己的硬件能比 MRI 还强,这话搁在任何场合都够吹一阵的。

    但先别急着笑。这台扫描仪的原理其实有点意思。

    60秒全身扫描,每年一次?

    它跟超声波技术公司 Butterfly Network 合作开发,设备里塞了 40 个”Butterfly Ultrasound-on-Chip”成像模块——就是那种能把超声波传感器做进一枚芯片里的技术。你踏上一个平台,它带着你沿着轨道沉入水中,经过一个装了几千个换能器的环形装置,后者发射超声波然后记录波穿过你身体后的回波,最终拼出一幅详细的 3D 内部图像。

    全程大约 60 秒。

    Holz 说,理想情况下你可以一年扫一次,甚至每天都扫。他的想法是监测身体对饮食和锻炼的变化反应——”我还不是地球上被测得最多的人,但也许我想要那种每天都能获得的可量化信息。”

    这话听起来很像硅谷那套”量化自我”的老调,但换个角度想,如果全身扫描真的能做到 60 秒、低成本、无辐射(超声跟 CT/MRI 不同,不涉及电离辐射),那它确实有可能把”年度体检”这件事变得更可及。

    开在商场里的扫描水疗馆?

    Midjourney 给这个项目想了个挺有意思的落地场景:spa。不是医院,不是诊所,是一家让你放松的、可能还提供茶和点心的”扫描水疗馆”。招聘广告里写的是”通过一种魔法般的 spa 体验,最终将安全、快速、高保真的预防性扫描带给数十亿人”。

    这里有个细节值得停下来想想。AI 公司做硬件,而且还是医疗硬件,这件事的门槛在哪里?Midjourney 在图像生成上确实有两把刷子,但医学成像不是生成一张好看的图就完事——误诊的代价是真实的。Holz 说他们用”成像体模”(imaging phantom,一种用于验证扫描精度的标准测试物体)做了分割验证,但离临床批准和大规模商用,中间还隔着监管、责任归属、医生采纳等一堆难题。


    但这不妨碍它成为一个信号:AI 公司不再满足于躲在云端提供 API,它们开始想要触碰物理世界了。

    Holz 本人是 OpenAI 的联合创始人之一(虽然很早就离开了),Midjourney 在过去几年里靠文生图站稳了脚跟,现在拿着这笔钱去做硬件——而且还是医疗硬件。这个路径,跟 Anthropic 做安全、跟 OpenAI 做 AGI,都不太一样。

    它更像是在说:AI 不只是聊天机器人,它可以是看得见的、摸得着的、走进你身体的东西。

    至于它能不能真的”优于 MRI”,这个问题的答案大概要等好几年后才能揭晓。但在 AI 越来越像空气一样无处不在的 2026 年,有一家公司愿意把赌注压在”让所有人每年做一次全身扫描”这件事上,本身就挺值得记一笔的。

  • 韩国人为什么这么爱 AI?从养老院机器人到人形僧侣

    韩国人为什么这么爱 AI?从养老院机器人到人形僧侣

    从旧金山飞首尔要 12 个小时,落地后我走过无人值守的入境检查口,机器扫了一下我的脸和护照。坐地铁回家路上,人们都盯着手机——即使是地下的站台也有完美的 5G 信号——窗外闪过一个个 LED 屏幕,上面是庆祝 K-pop 偶像生日的广告。

    在江南站下车后,一个卡通大眼睛的轮式机器人在路口耐心地等着过马路,它要去给某个人送晚餐。这就是首尔,一个对 AI 几乎毫无抵触的国家。

    韩国 AI 文化
    首尔街头的 AI 机器人(配图由 AI 生成)

    乐观到离谱的数字

    皮尤研究中心调查了 25 个国家,结果发现韩国人是所有国家里对 AI 最乐观的——只有 16% 的人说他们对 AI 感到担忧胜过兴奋。作为对比,一半的美国人说他们更担忧而不是兴奋。韩国人每天都在用 AI,要么是当个人助手,要么是用它干活。

    这种乐观情绪很大程度上是”设计”出来的。韩国政府把 AI 定为经济增长的引擎,总统李在明承诺要把韩国打造成仅次于美国和中国的”AI 三强”。

    2024 年,韩国国会通过了《AI 基本法》,这是全球最早的一批综合性 AI 法律之一,重点是促进 AI 发展,监管走的是”轻触式”。

    技术立国的逻辑

    韩国人对技术的热爱有历史原因。这个国家从朝鲜战争的废墟里爬起来,靠的就是技术——1970 年代炼钢和造船,1980 年代做半导体,1990 年代铺宽带,2000 年代造智能手机。

    今天,三星和 SK 海力士供应全球大部分高带宽内存芯片,就是这些芯片在驱动训练 AI 模型需要的英伟达硬件。韩国人的逻辑很简单:拥抱技术 = 现代化 = 在全球秩序里有一席之地。AI 只是这个逻辑的最新版本。

    斯坦福 2026 年 AI 指数报告显示,70% 的韩国人认为通过 AI 创新来推进科学和医学是比通过监管保护就业更优先的事项。首尔街头的 AI 公交站已经在试点,配备多语言问答机。养老院里有 AI 陪护机器人,寺庙里甚至出现了人形僧侣机器人”Gabi”。AI 已经渗进了韩国人生活的各个角落。

    盲目乐观的代价

    但盲目乐观也是有代价的。2025 年,韩国政府强推 AI 教科书,结果被骂惨了——书上全是事实错误,而且数据隐私风险也没评估,连试点项目都没做就直接铺开了。

    现代汽车宣布要在工厂里部署 Atlas 人形机器人之后,工会抗议得很厉害,说”没有劳资协议,一个机器人都别想进厂”。64% 的韩国人担心 AI 会抢走工作、加剧不平等,尽管 52% 的人也认为 AI 能提高生产力。

    韩国 Gallup 的调查说,46% 的二十多岁的韩国人用聊天机器人算过命(韩国人叫”四柱”)。年轻人把 ChatGPT 当算命先生、股票顾问、还有干活工具,三合一。我表妹说了一句话,我觉得挺准确地概括了韩国人对 AI 的矛盾心态:”我有时候也怕 AI,但现在来说,它真的太有用了。”


  • Anthropic 加入碳去除联盟,AI 公司的环保账本

    Anthropic 加入碳去除联盟,AI 公司的环保账本

    Anthropic 上周做了一个在其他 AI 实验室眼里可能有点”格格不入”的举动——它加入了 Frontier,一个由 Stripe、Google、Shopify 等科技公司发起的碳去除集体。Anthropic 是第一个加入这个组织的纯 AI 公司。

    Frontier 这次新募集了 9.15 亿美元,让总承诺金额几乎翻了一倍,达到 18 亿美元。到目前为止,Frontier 已经签下了近 7 亿美元的合同,覆盖 50 多个项目,预计能去除 180 万吨二氧化碳。

    Anthropic 加入 Frontier 是它第一个和气候相关的动作。此时 AI 公司们正在疯狂买电,而且买的不都是”干净”的电。

    为什么这件事值得关注

    xAI 在孟菲斯的数据中心装了 57 台未获许可的燃气轮机,被环保组织告上法庭;SpaceX 的 IPO 文件显示它未来三年还要花 28 亿美元买更多燃气轮机。Anthropic 在这种时候加入 Frontier,多少有点想给自己贴上”我们在乎气候”标签的意思。

    但说实话,Anthropic 自己也没那么干净。它还没有发布过可持续发展报告,而且在今年早些时候的一份声明里说它支持”all of the above”的能源策略——这句话翻译过来其实就是”什么电都买”。

    Frontier 是怎么运作的

    Frontier 本质上是一个”碳去除项目的买手团”。想买碳去除信用的公司面临一个困境:它们想在未来一二十年达到零排放,但有些排放是消不掉的(比如坐飞机),而碳去除这个行业又太早期了,没有哪家供应商能稳定地去除大企业需要的那个规模。

    Frontier 就来做这个”尽调”——它评估哪些碳去除技术靠谱,然后替成员公司签合同。这些碳去除信用就像资产负债表上的”利润”一样,可以用来抵消企业账面上的碳排放。

    Anthropic 与碳去除
    AI 公司的环保账本(配图由 AI 生成)

    碳去除到底在去除什么

    Frontier 投过的技术路线很广:直接从空气里抓二氧化碳的装置、把磨碎的石头撒到农田里加速风化的方案、把生物质转化成生物油然后封存的路径、往海里倒抗酸剂来吸收二氧化碳,还有烧生物质发电并同时封存二氧化碳的技术。

    现在 Frontier 说要换打法了——少投一点项目,但每个项目的钱给多一点,重点押注那些有希望每年去除 10 亿吨以上二氧化碳的技术。新合同的期限也拉长了,大概 8 到 10 年。

    一个 Frontier 的发言人说,以后任何新合同都会要求碳去除公司”展示出通往政府补贴的路径”。这话其实挺诚实的——企业不想永远当这个行业的提款机。

    联合国 IPCC 已经说了,要实现净零排放,碳去除技术是必要的。但问题是,没多少人愿意买单。Frontier 签合同可以签到 2040 年,但 2040 年以后呢?按照现在全球变暖的速度,我们到时候大概会有比碳去除更紧迫的问题要操心。


  • 机器人训练数据成了AI新战场,这家公司刚拿了7000万美元

    机器人训练数据成了AI新战场,这家公司刚拿了7000万美元

    机器人训练数据收集
    机器人训练数据收集需要大量物理交互场景的标注

    训练一个大语言模型,你只需要扒下整个互联网的文本就行。但训练一个能叠衣服、拿杯子的机器人?那可没现成的数据海洋给你捞。

    这就是XDOF看到的机会。这家今天刚从隐身模式走出来的初创公司,刚拿了7000万美元融资,投资方包括Thrive Capital、Spark Capital、a16z、Lux和WndrCo。他们的赌注很简单:AI的下一个瓶颈不是模型也不是芯片,而是教机器人理解物理世界的数据反馈回路。

    为什么机器人数据这么难搞

    语言模型可以啃下整个互联网的文本,因为文字是现成的。但机器人需要的数据得捕捉物理交互——手怎么抓、力怎么控、物体怎么响应。这类数据几乎不存在。

    YouTube视频?画质太低,而且你不知道视频里的人到底用了多少力、手指是什么角度。众包工人拍的片段?同样的问题,而且很难和真实的物理参数对上号。

    XDOF的联合创始人兼CEO Philipp Wu在UC Berkeley读博时就撞上了这堵墙。他的研究方向是让机器人从大规模数据集里学习技能,但问题来了——根本没有大规模数据。

    “这是一个鸡生蛋、蛋生鸡的问题——我们得先实际收集数据,才能开始问怎么为机器人训练基础模型。”

    从学术论文到商业项目

    Wu和后来的联合创始人、CTO Fred Shentu搞出了一个叫GELLO的低成本遥操作系统,让人类操作员可以控制机械臂来生成训练数据。这个项目后来成了一篇在机器人圈很有影响力的论文,因为很多实验室都有同样的数据瓶颈,开始用这类设备来采集数据。

    看到机会后,Wu、Shentu和第三位联合创始人、COO Nemo Jin在2024年10月创立了XDOF,专门为搞机器人模型的公司提供数据生态系统。公司现在有约60名员工,已经在对口20家客户,包括几家前沿AI实验室(名字不能透露)。

    Wu说得很直接:”所有顶尖实验室都在追机器人。我们已经看到在语言模型竞赛中稍微落后的后果……你不想在物理AI成为下一个前沿时被甩在后面。”

    数据金字塔的三层结构

    XDOF的计划是覆盖一个数据金字塔的三个层级。最值钱的一层是在实际部署的机器人上采集的遥操作数据;第二层是用遥操作机器人采集更通用的数据(就像GELLO那样);第三层是”以自我为中心”的数据——人类戴穿戴式传感器完成日常任务时采集的数据,XDOF计划自己造这种传感器。

    选什么摄像头会直接影响数据质量,进而影响手 tracking 算法的表现。Wu说:”如果你一开始不把硬件设计好,你采集的数据可能会有你没预料到的特定问题。”

    为什么大实验室不自己搞

    这个问题很自然:为什么OpenAI、Google DeepMind这些巨头不自己建数据管道?Wu的回答是规模和专注度:”你需要一个几十万平方英尺的仓库,里面放上几百台机器人。你还得维护这些机器人、校准它们的物理参数、 properly培训操作员。”

    这种重资产、劳动密集的运营模式,大多数AI实验室宁愿外包。而这正是XDOF押注的市场。

    公司名字XDOF是个双关,既指机器人学里的”自由度”(degrees of freedom,描述机器人能独立运动的方向数),也表达了他们的野心:”任意自由度,无限自由度。”


    XDOF已经和UC Berkeley的AI研究实验室合作,发布了他们声称的有史以来最大的高质量机器人训练数据集合,叫ABC。里面有13万条机器人操作数据轨迹、300小时仿真数据和100小时评估数据。这种规模的预训练数据以前学术界根本拿不到。

    团队已经用这些数据训练机器人做折T恤、压扁纸箱、把AirPods塞进盒子这类基准任务。接下来,物理AI的数据军备竞赛才刚刚开始。