标签: AI

  • 微软不再只靠OpenAI了,它悄悄练出了一套自己的AI模型

    Microsoft MAI AI模型
    微软在Build 2026上发布的MAI模型家族,标志着AI战略的重要转向(配图由AI生成)

    Microsoft和OpenAI这对搭档,这几年几乎绑定在一起。Copilot用的是OpenAI的模型,Azure上跑的是OpenAI的API,连Windows里的AI功能都离不开GPT的底层支持。但这种关系正在起变化。

    在上个月的Build 2026大会上,微软悄悄干了一件大事——它发布了一套完全自研的AI模型家族,名字叫MAI(Microsoft AI)。其中最值得说的是MAI-Thinking-1,这是微软第一个自己从头训练的推理模型。

    说”从头训练”很重要。现在很多公司做模型都是拿别人的前沿模型来蒸馏,相当于抄作业。微软这次说的是,他们的训练数据是干净的,没有从第三方前沿模型里蒸馏,是自己从零开始训的。

    MAI-Thinking-1:350亿参数,MoE架构

    MAI-Thinking-1有多大?微软给的数字是350亿活跃参数。这里说的是”活跃参数”,因为模型用了MoE(混合专家)架构——每次推理只激活需要的部分,不用把整个模型都跑一遍。这样做的好处是效率高、成本低。

    性能方面,微软说它在SWE-Bench Pro上的表现跟Claude Opus 4.6差不多,但成本要低很多。GitHub的运营负责人Kyle Daigle说这个模型是冲着”高性能高效率”去的,token价格会很有竞争力。

    一口气发了7个模型

    但光有一个推理模型还不够。微软这次一口气发了7个模型,覆盖了文本推理、代码生成、图像生成、语音转文字、文字转语音整个链路。

    • MAI-Code-1-Flash:专门给GitHub Copilot和VS Code用的代码模型,主打推理效率高,适合大规模跑
    • MAI-Image-2.5:做文生图和图像编辑,在Arena.ai的图像榜单上排第二,微软说它是市面上性价比最高的图像模型
    • MAI-Voice-2:多语言语音合成,支持15种语言,还能保留说话人的声音特征
    • MAI-Transcribe-1.5:语音识别,支持43种语言,速度是同类模型的5倍

    为什么要独立?三个原因

    这些模型现在有的已经上线Microsoft Foundry,有的还在私人预览阶段。但方向已经很清楚了:微软要把AI的每一层都掌握在自己手里。

    这件事的背后是微软和OpenAI合作条款的重新谈判。新协议签下来,微软访问OpenAI模型和技术授权到2032年,但这个授权变成了非独占的——OpenAI可以卖给别人,微软也可以自己搞。

    微软为什么这时候要独立?有三个原因说得通。第一,不能把命门捏在一个外部供应商手里。第二,自己的模型可以针对自己的产品、硬件、企业客户做优化,不用迁就别人的路线图。第三,也是实在的,跑自己的模型可以省掉一大笔给第三方模型提供商的分成。

    AI操作系统的一步棋

    更值得关注的是,微软还在做一个叫Scout的永远在线的AI助手,基于OpenClaw开源项目。这东西能帮你准备会议、管日程、起草邮件,是往”AI操作系统”方向走的一步棋。有意思的是,微软之前一直把自主AI智能体当成安全风险来看,现在直接把它做成了产品功能。

    硬件端也在布局。微软发布了Surface RTX Spark开发者盒子,用Nvidia的芯片,让开发者可以在本地跑和测试模型。还有能在Windows PC上直接跑的Aion小模型,以及跟高通一起做的基于Android的AI设备原型。

    这些动作串在一起,看得出来微软的算盘:它不想只当OpenAI的分销渠道,它要自己做模型、自己做智能体、自己做硬件、自己做企业AI平台。对用微软产品的公司和开发者来说,这意味着以后会有更多选择,也可能用上更便宜的AI能力。

  • Robotaxi排行榜出炉:中国公司把Waymo挤下了冠军宝座

    过去十几年,自动驾驶圈一直有个说不清的问题:到底谁才是真正的第一名?Demo到处飞,融资一轮接一轮,但普通人——甚至专门跑这个口的记者——都很难拿到一组靠谱的量化指标来做比较。

    一家叫Autonomy AI的咨询研究公司最近做了件事:他们用生成式AI搭建了一个Benchmark系统,叫”Road to Autonomy Index”,每隔12小时就从全球公开数据库里扒一遍数据——联邦和州的报告、SEC文件、公开交易所信息等等——然后给自动驾驶公司打分排名。

    Robotaxi排行榜概念图
    中国自动驾驶公司正在Robotaxi赛道上加速领跑(概念图)

    排名结果:Baidu第一,Waymo第二

    截至本周五的最新排名,Robotaxi第一名不是Waymo,而是百度的Apollo Go项目——虽然领先优势很小。Waymo排在第二,后面紧跟着两家中国公司:Pony.ai(小马智行)WeRide(文远知行)。Tesla排在第五位。

    Autonomy AI的联合创始人Rob Grant说,他们做这个指数的时候,最让他印象深刻的发现之一就是中国公司在多个类别里都排得很靠前。这个结果和很多人直觉里”美国自动驾驶领先”的印象不太一样,但数据就是这么显示的。

    “我们很早就约定好了,不爬取互联网信息。如果信息是公开发布的,或者在Creative Commons许可下可用,我们才会使用。我们也有一些付费数据许可。”——Rob Grant,Autonomy AI联合创始人

    德州车队规模追踪:Waymo、Tesla、Zoox都在扩

    除了全国性的排名,Texs州(自动驾驶测试重镇)的车辆注册数据也透露了一些有趣的信号。截至5月28日,Waymo在德州注册了577辆自动驾驶车,而现在这个数字已经涨到620辆,不到一个月增长了约7.5%。

    Tesla的增速更猛——从5月28日的42辆涨到现在的69辆,增幅64%。不过需要注意的是,注册了不等于商业运营。Zoox目前还不能收费载客,它在德州的车队从35辆扩充到了43辆。

    • Waymo:620辆(较上月+7.5%)
    • Tesla:69辆(较上月+64%)
    • Zoox:43辆(较上月+23%)
    • Avride:317辆(持平)
    • Nuro:47辆(持平)

    行业整合加速:Gatik+PepsiCo、Uber+Mobileye

    本周还有几笔值得关注的合作。Gatik(做短途自动驾驶卡车)宣布和PepsiCo签了多年协议,继续在美国几个州帮百事运货。Stellantis、自动驾驶初创公司Wayve、以及出行巨头Uber三方达成合作,要一起开发并部署无人Robotaxi。

    更有意思的是Mobileye——这家公司一直把自己定位成自动驾驶技术供应商,但现在它要亲自下场做Robotaxi运营商了,计划2027年在美国某个城市率先落地。这个转变,用Mobileye创始人兼CEO Amnon Shashua七年前的话来说,其实是对的:想搞定乘用车全自动驾驶这个”圣杯”,得先从Robotaxi入手。

    当然,这个赛道也不是没有挫折。Waymo本周召回了近4000辆Robotaxi,原因是它们的软件会让车开进高速公路施工封闭区域。这个问题已经发生了至少13起,目前软件修复还在开发中——也就是说,还没完全解决。

  • Midjourney不画猫了,它想给你做全身超声扫描

    说起Midjourney,大家第一反应都是那些酷炫的AI绘图——猫咪做各种职业的梗图,或者一把拉高你朋友圈格调的艺术风头像。但就在最近,CEO David Holz在发布会现场亮出了一个完全不在这个赛道里的东西:一台全身超声扫描仪。

    这个叫Midjourney Scanner的设备,外形说好听点是科幻,说直白点就是你站进一个装了水的环形装置里,身体缓缓沉入水面,周围一圈传感器像海豚回声定位一样,从各个角度往你身体里发射超声波,然后计算机把这些信号拼成一张你体内肌肉、脂肪、骨骼和脏器的三维图。

    Midjourney全身超声扫描仪概念图
    Midjourney Scanner概念渲染图(来源:Midjourney Medical)

    和Butterfly Network联手,60秒扫完全身

    Holz在发布会上描述的过程很有画面感:你踏上一个平台,它载着你顺着轨道沉入水中,穿过一圈水下传感器,整个过程大约60秒。背后提供超声技术支撑的是Butterfly Network,这家公司的”超声-on-芯片”模块每套系统用到40个,基本上把超声探头微型化做到了极致。

    目前已经有大约12个人被扫描过了。Holz自己的说法是,他还没把自己身体每一寸都量个遍,但说不定以后就想每天扫一次,看看饮食和锻炼到底有没有效果——用数据说话,而不是照镜子猜。

    “我们的目标是做出世界上第一台全身超声CT扫描仪,最终通过一种像魔法水疗一样的体验,把安全、快速、高保真的预防性扫描带到数十亿人身边。”——Midjourney招聘启事

    比MRI还厉害?FDA说:先等等

    Holz在发布会上放了个狠话:这东西最终可能比MRI(磁共振成像)还强,而且没有辐射、不需要强力磁铁,扫描速度快得多。但现实是,要想让它真正用于医疗诊断,得过FDA那一关。

    Midjourney Medical目前的策略是先做”身体成分地图”——就是测测你肌肉量、体脂率这类东西,这类应用不需要诊断级别的FDA许可。等监管路径更清晰了,再往深层走。他们也说正在认真考虑数据隐私问题,但具体政策要等产品更接近发布时才会公布。

    顺便说一句,Midjourney还在旧金山联合广场筹划一家名叫”Midjourney Spa”的水疗中心,计划2027年底前开业,里面要放10台扫描仪,配套健身房、桑拿房和冷水浴。扫个身,蒸个桑拿,再冲个冷水——这条链路,Holz是真的想清楚了。


    这件事最有意思的地方在于:一家靠AI生成图片起602亿估值的公司,突然转身去做硬科技医疗设备。Holz的解释是,那些用来跑AI模型的算力,闲置的时候可以拿来做别的事——医疗设备就是他找到的”别的事”之一。至于Midjourney的AI图像生成技术跟超声扫描到底有什么关系,目前连报道的记者都没搞明白。

    但不管怎么说,把一个需要专业放射科医生操作的传统医疗设备,包装成一个普通人每年(甚至每天)都能去消费一次的”科技水疗”体验——这个思路,确实很Midjourney。

  • LlamaIndex:构建LLM应用的领先数据框架,50K+ Stars让私有数据赋能AI,RAG开发首选

    LlamaIndex:构建LLM应用的领先数据框架,50K+ Stars让私有数据赋能AI,RAG开发首选

    LlamaIndex

    LlamaIndex 🦙 — 面向LLM应用的数据框架

    🦙 项目简介

    LlamaIndex 是构建基于私有数据的 LLM 应用的领先框架,提供数据连接器、索引结构、查询引擎和 Agent 工具链,让开发者能够轻松实现 RAG(检索增强生成)、文档理解、自主 Agent 等 AI 应用。由 Jerry Liu 于 2022 年创立,现已成为 LlamaIndex 公司的核心产品,MIT 开源许可,GitHub 50,261+ Stars。

    50K+
    GitHub Stars

    7.6K+
    Forks

    300+
    集成包

    MIT
    开源许可

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.8+(推荐 3.10+)
    • pip 或 conda 包管理器
    • OpenAI API Key(使用默认 LLM 时)
    • 或本地 LLM(Ollama、LM Studio 等)

    快速安装(入门版)

    # 安装完整入门包(含常用集成)
    pip install llama-index

    # 设置 OpenAI API Key
    export OPENAI_API_KEY=”sk-…”

    # 5行代码跑通 RAG!
    from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
    docs = SimpleDirectoryReader(‘data’).load_data()
    index = VectorStoreIndex.from_documents(docs)
    query_engine = index.as_query_engine()
    print(query_engine.query(‘你的问题’))

    自定义安装(高级用户)

    # 安装核心包 + 按需添加集成
    pip install llama-index-core
    pip install llama-index-llms-openai
    pip install llama-index-llms-ollama
    pip install llama-index-embeddings-huggingface
    pip install llama-index-vector-stores-chroma

    🌟 核心功能

    📥 1. 数据连接器(Data Connectors)

    通过 LlamaHub 提供 300+ 数据连接器,支持 API、PDF、Word、PowerPoint、SQL 数据库、Notion、Google Drive、Slack 等几乎所有数据源。只需一行代码即可将任意格式的数据摄取为 LLM 可用的文档对象。

    🔍 2. 向量索引与 RAG 流水线

    提供 VectorStoreIndex、SummaryIndex、TreeIndex、KnowledgeGraphIndex 等多种索引结构。内置完整的 RAG 流水线:文档解析 → 分块 → 向量化 → 存储 → 检索 → 重排序 → 生成。支持与 Chroma、Qdrant、Pinecone、Weaviate 等 20+ 向量数据库无缝集成。

    🤖 3. Agent 与 Workflows

    原生支持构建 LLM Agent,可将 RAG 管道作为 Agent 的工具之一。Workflows 提供事件驱动的微服务编排,支持多 Agent 协作、反思、错误自修复等高级模式,并可部署为生产级微服务(配合 llama_deploy)。支持 MCP 协议,可接入任意 MCP 服务器。

    📄 4. LlamaParse —— 企业级文档解析

    LlamaIndex 官方提供的商业级文档解析 API,支持 130+ 格式,基于 VLM(视觉语言模型)处理复杂文档中的嵌套表格、嵌入图表/图片等。可与 LlamaIndex 框架无缝配合,也可独立使用。注册即送每月 10,000 免费积分。

    🌐 5. 多语言支持 + TypeScript 版本

    除 Python 主版本外,LlamaIndex 提供完整的 TypeScript/JavaScript 版本(llamaindex),可在 Node.js 和浏览器环境中运行。支持所有主流 LLM(OpenAI、Anthropic、Gemini、DeepSeek、Ollama 等),真正实现了全栈 LLM 应用开发。

    🚀 典型使用场景

    场景一:企业知识库 RAG 系统

    将企业内部文档(PDF 手册、Word 制度、Confluence 页面、钉钉/飞书文档)统一摄取,构建向量索引。员工可通过自然语言提问,系统从私有文档中检索相关段落并生成准确答案,实现”企业版 ChatGPT”。某金融科技公司使用 LlamaIndex + LlamaParse 构建了覆盖 10 万份研报的知识问答系统,查询准确率达 92%。

    场景二:AI 数据分析 Agent

    结合 LlamaIndex Agent 和 SQL 数据库连接器,构建能够理解自然语言并自动生成 SQL 查询、执行数据分析的 AI Agent。用户问”上个月销售额最高的产品是什么?”,Agent 自动查询数据库、生成图表、输出分析报告。支持多轮对话和上下文记忆,真正解放数据分析师的生产力。

    场景三:多模态文档理解

    利用 LlamaParse 解析包含图片、表格、图表的复杂 PDF 文档,结合多模态 LLM(如 GPT-4V、Claude Opus)实现图文联合理解。适用于法律合同审查、医学报告分析、学术论文摘要等场景,解析精度远超传统 OCR 工具。

    💡 推荐理由

    作为 RAG 领域的开创者之一,LlamaIndex 几乎定义了”上下文增强 LLM 应用”这一品类。我个人从 2023 年初就开始使用 LlamaIndex,见证了它从单一 RAG 库演进为完整的 Agent 平台。

    最让我印象深刻的是它的模块化设计哲学:高级 API 让新手 5 行代码跑通 demo,低级 API 让高级用户能定制每一个模块(数据连接器、索引策略、检索器、重排序器……)。这种”易者易用、难者难精”的设计,在开源框架中极为难得。

    另外,LlamaIndex 的文档质量也是开源项目中的顶级水准——不仅有完整的 API 参考,还有大量教程、Cookbook、视频课程,甚至出版了《LLM Application Development with LlamaIndex》一书。社区活跃度极高,Discord 频道每天有数百条讨论,问题基本能在 24 小时内得到解答。

    ⭐ 如果你正在构建任何需要”私有数据 + LLM”的应用,LlamaIndex 是你不应该错过的基础框架。

    ━━━━━━━━━━━━━━━━━━━━

    📅 本文撰写于 2026 年 6 月 22 日,基于 LlamaIndex 最新版本信息

    ⭐ 数据来源:GitHub API | 项目持续更新中,建议访问官网获取最新信息

  • 这家AI公司用游戏视频教机器理解世界,Jeff Bezos砸钱估值20亿

    General Intuition AI世界模型
    General Intuition用游戏视频训练AI世界模型,Jeff Bezos和Eric Schmidt押注 (TechCrunch)

    一家从游戏剪辑平台Medal分拆出来的AI初创公司,正在做一件挺疯狂的事:用每年20亿条游戏视频教AI理解空间和时间的概念。这家公司叫General Intuition,最近在谈一笔30亿美元的融资,估值冲到200亿美元。

    投资方名单很豪华:Jeff Bezos、前Google CEO Eric Schmidt,外加老股东Khosla Ventures和General Catalyst。八个月前他们才拿了1.34亿美元的种子轮,当时刚从Medal分拆出来。现在直接跳到20亿估值——这速度在AI圈也算猛的。

    General Intuition builds a foundation model that trains AI agents how to move through space and time. The dataset — unique because it allows AI to learn from interactive, first-person gameplay — is the perfect base to teach machines deep spatial-temporal reasoning.

    为啥游戏视频是宝藏数据?

    Medal这个平台本来是让玩家上传和分享游戏剪辑的,每月有1000万活跃用户,每年产生20亿条视频。这些视频有个特点:都是第一人称视角,玩家在虚拟世界里做各种动作——跑、跳、开枪、解谜、开车。每一帧都包含了”这个虚拟世界是怎么运作的”的信息。

    General Intuition的判断是:如果一个AI能把游戏里的空间关系学得够好,那它理解真实世界的物理规律也就不远了。这比只看静态图片训练出来的模型要强得多——因为游戏视频是动态的,有时间维度。

    世界模型赛道打起来了

    General Intuition不是唯一做”世界模型”的公司。Runway、Decart、李飞飞的World Labs,还有Google的Genie 3,全在这个方向上砸钱。各家思路不太一样:

    • Runway原来做视频生成,现在想把Google比下去
    • Decart新发布的世界模型能模拟数小时的真实驾驶场景
    • World Labs走商业化路线,推出了Marble产品
    • Google Genie 3最近接入了Google Maps数据,能模拟真实街道

    General Intuition的差异化在于:它不做世界模型产品卖给别人,而是用世界模型来训练能行动的智能体(agents)。智能体才是它要卖的东西。这个思路有点像:别人在卖铲子,它在培养用铲子的人。


    OpenAI也曾来敲门

    据The Information报道,OpenAI曾经试图收购Medal,就是看中了这笔游戏视频数据。但Medal选择了分拆出General Intuition,自己掌控方向。现在OpenAI没拿到这笔数据,而General Intuition拿着它去融了天价。

    这轮融资的钱主要用来扩充算力。General Intuition的计划是在今年夏末或初秋发布新产品。从目前的信息看,应该是一个能让AI智能体在复杂虚拟环境里自主行动的模型。

    世界模型这个方向为啥值钱?因为如果你想让AI机器人走进真实世界,它首先得在虚拟世界里把物理规律学明白。游戏视频提供了一个低成本、大规模的训练场。General Intuition手里这20亿条视频,可能就是它最大的护城河。

  • SZA说支持AI的音乐人”恶心”,238首歌被喂给AI训练后她怒了

    SZA与AI音乐训练的冲突
    SZA在Instagram上公开谴责AI音乐训练,引发广泛讨论 (The Verge)

    格莱美获奖歌手SZA最近在Instagram上发了一篇story,语气很冲。她说自己查了一下,发现AI音乐数据库里列了她的238首歌,用来训练AI模型。其中有些歌她从来没正式发布过。

    她心里不能忍。在第二条story里,她直接对支持AI的音乐人开火:”如果你是个音乐人,你还支持这个,我希望你得到你应得的生活。”这句话在英语里的意思差不多是”祝你好运”的反话——够狠的。

    “Just checked and music AI has trained off 238 of my songs. I’m certain some unreleased. If you’re a musician and you support this… I hope u have the life u deserve.”

    —— SZA,Instagram Story

    这事是怎么被发现的?

    这次曝光源于《大西洋月刊》前几天做的一个可搜索数据库。他们把用于训练AI模型的音乐数据集整理出来,任何人都能查自己的歌是不是在里头。SZA一查,238首——包括未发行的。

    这跟之前的AI音乐版权诉讼是一脉相承的。Suno、Udio这些AI音乐生成工具已经被各大唱片公司告了,核心争议就是:用别人的音乐训练AI,算不算侵权?

    音乐人为啥这么怒?

    站在音乐人的角度,这事儿确实让人窝火。你花几年写出来的歌,被人拿去训练AI,然后AI生成出来的东西跟你的风格很像,还不给你一分钱。更气人的是,有些AI支持者还在那儿说”这是技术进步”。

    SZA那句”恶心”(disgusting)是在回应那些公开表态支持AI的音乐人。虽然她没点名,但圈内最近确实有音乐人表态说AI是工具、不该抵制。两边的理念裂痕越来越大。


    这场仗还远没打完

    《大西洋月刊》的数据库只是把暗地里的东西摆到了台面上。AI公司训练模型时用的是什么数据,一直以来都是”商业机密”,音乐人根本没法查证。现在有了一个可搜索的入口,更多音乐人会发现自己也被”喂”了进去。

    法律层面,Suno和Udio的案子还在审理中,判决结果会直接影响整个行业的规则。如果法院认定AI训练需要获授权,那现在这些数据库里的每一首歌都能成为索赔证据。如果法院认定”合理使用”,那音乐人就真的只能看着AI把他们的风格”学”走了。

    SZA这次发声,某种程度上是把争议从法庭带到了公共舆论场。当格莱美获奖歌手公开骂支持AI的音乐人”恶心”,这事就已经不只是法律纠纷了,而是整个行业价值观的分裂。

  • 约个会还要被AI掺一脚?美国单身族的调查结果有点意外

    AI与约会软件
    约会软件一直在尝试引入AI功能,但用户买账吗?

    约会软件巨头Match Group(旗下有Tinder、Hinge、OkCupid等)最近做了一项调查,想知道美国单身族到底怎么看待AI插足浪漫关系。结果有点打脸:47%的单身者对AI在约会场景中的使用持负面态度。

    但这件事没那么简单。人们对AI的接受度,取决于AI到底在帮什么忙。大约40%的单身者说,他们拒绝和使用AI伴侣软件的人约会,在18到24岁的女性中,这个数字上升到51%。但与此同时,64%的受访者表示,他们能理解AI可能在约会过程中帮上忙。

    约会软件都在押注AI,用户却不买账?

    整个行业都在往AI方向冲。Bumble推出了名叫Bee的AI约会助手;Tinder在AI工具上砸了这么多钱,以至于它放缓了招聘;Hinge的前CEO去年辞职,跑去做了一个更偏AI的约会软件。

    但Match的调查显示,用户并不是完全拒绝AI——他们只是不想跟机器人谈恋爱,也不想觉得自己的约会体验被不真实的技术淹没了。

    Match在博客中写道:”问单身者他们希望AI在约会中做什么,答案相当一致:帮搞定难的那些部分,但人类的部分请放手。是的,他们会用它来优化个人资料,或者当对话冷场时帮忙想话说,但真正的连接还是要靠自己建立。”

    年轻人最抵触,却也在用

    数据里有个有趣的矛盾。18到24岁的年轻人是使用AI伴侣软件最少的人群——只有12%的人说他们在过去三个月用过这类产品,而且其中只有约三分之一的人说他们是在寻求真正的情感连接。

    但他们也是对AI持最强烈负面态度的群体。这可能是因为年轻人更看重约会的”真实感”,也可能是因为他们是最后一代还记得没有算法介入的社交是什么样子的人。

    相比之下,35到39岁的人群对AI在约会中的使用接受度最高。这个年龄段的人可能已经受够了刷了几年都刷不到合适人的体验,所以愿意让AI来帮点忙。

    创业者该听进去了

    希望这个信息能传达到像Bumble创始人Whitney Wolfe Herd这样的人耳中——她曾经建议,约会软件用户可以拥有”个人机器人”,这些机器人去跟其他用户的机器人约会。这个想法在技术上或许有趣,但在人类社会层面,这永远不会成为一种能被广泛接受的交友方式。

    现在的挑战是,约会软件如何在”用AI提升体验”和”让用户体验保持真实感”之间找到平衡点。Match的调查其实给出了答案:做幕后帮手,别做台前的角色。


    • 47%的美国单身者对AI用于约会持负面态度
    • 40%的人拒绝和使用AI伴侣软件的人约会
    • 64%的人认为AI可以在约会过程中提供帮助
    • 18-24岁女性对AI约会的抵触最强(51%)
    • 35-39岁人群对AI约会的接受度最高
  • 美国说ASML的顶级光刻机可能流进中国了,但这事说清楚了吗?

    ASML EUV光刻机
    ASML总部位于荷兰,其EUV光刻机是全球最先进的芯片制造设备

    美国政府最近抛出一个消息——商务部长霍华德·卢特尼克在多次会议上告诉ASML高管,他担心这家荷兰公司的最尖端极紫外光刻机(EUV)可能已经流入中国。这不是小事,EUV是地球上唯一能印制最先进半导体图案的工具,自从特朗普第一任期开始,美国就禁止ASML向中国出售EUV设备。

    但问题是,美国政府到现在都没有拿出实锤。彭博社报道说,高级政府官员声称有证据表明ASML向中国运送了EUV相关组件和运输设备,但他们对彭博社,甚至对ASML本身,都拒绝展示证据。ASML方面坚决否认,说中国境内从来没有、也不可能有这台机器。

    为什么这事这么重要

    ASML虽然名气不如英伟达,但它是全球AI基础设施建设中最关键的公司之一。没有ASML的EUV光刻机,就没有台积电生产的英伟达和苹果的最先进处理器。ASML花了大约20年、投入无数资金,才造出这台机器。目前地球上没有第二家供应商。

    这种垄断地位让ASML成为欧洲市值最高的上市公司,本周市值约7000亿美元。如果真有一台EUV流进中国,那将是美国过去几年构建的出口管制体系中最严重的漏洞之一。

    ASML CEO Christophe Fouquet告诉我:”没人能追上我们。你要造出一台EUV机器,80%的技术来自几十年的积累,而剩下那20%——怎么产生EUV光本身——我们花了20年。”

    ASML自己的说法

    我六周前刚采访过Fouquet,当时直接问了他关于中国的问题。他说ASML追踪它售出的每一台机器——它们要么在被监控的客户那里运行,要么已被拆解并归还给公司。

    他还说公司多年前就建立了一套内部防火墙:能够接触EUV技术、文档和培训的员工,与不能接触的员工是完全隔离的。他的核心论点是,你无法逆向工程一台你从未拥有过的机器,而中国没有人拥有过EUV。

    还有一个更简单的商业逻辑:ASML确实向中国出售老一代的深紫外(DUV)设备,但Fouquet明确说这是保护性策略,让中国客户仍能做一些业务,但造不出下一代竞争对手。ASML预计2026年约20%的收入来自目前获准的对华销售。为了一单非法交易而冒掉整个EUV禁令的风险,这说不通。

    幕后的政治算盘

    但这场争议出现的时间点很有意思。在卢特尼克领导下,美国商务部去年底同意向xLight注入最多1.5亿美元的纳税人资金,这家初创公司正在开发下一代光源技术,被描述为ASML EUV垄断核心的长期挑战者。

    xLight自己的CEO去年说,他们认为自己是ASML未来的合作伙伴,而不是竞争对手。但Fouquet对此并不买账。卢特尼克突然向ASML施压,跟xLight有没有关系?目前没有任何公开信息把两件事联系起来。

    还有一项横跨两党的法案正在国会推进,范围远比EUV更广——它要求有效禁止ASML所有深紫外(DUV)设备向中国出货,这些设备约占该公司预计2026年收入的五分之一。该法案今年4月已获关键委员会通过。


    • EUV光刻机重达180吨,需要三架波音747运输
    • 单价约1.5亿欧元,目前地球上没有第二家供应商
    • ASML花了20年才造出第一台EUV机器
    • 美国出口管制从特朗普第一任期开始禁止对华出售EUV
  • AI推理公司Baseten估值5个月翻近3倍,130亿美元背后的淘金热

    5个月,估值从50亿跳到130亿

    AI推理公司Baseten正在谈一笔15亿美元的融资,估值跑到130亿美元。算一下,比5个月前刚拿的50亿估值涨了160%。

    AI推理与创业融资
    AI推理层正成为VC砸钱的新战场

    5个月前,Baseten刚宣布拿下3亿美元的E轮,估值50亿。再往前9个月,是1.5亿美元的D轮。现在直接蹦到130亿——这个速度,连AI圈自己人都得愣一下。

    《华尔街日报》的报道还提到一个细节:这一轮是”分价轮”(split-priced round),意思是同一轮融资里,不同投资人拿到的股价不一样。有的按130亿估值进来,有的按110亿。这种做法最近在AI创业公司里挺流行,说白了就是把 headline valuation 做好看一点,让领投方纸面上好看。

    Baseten到底是做啥的

    先把”推理”(inference)这个词掰明白。训练模型是第一步,但训练完了之后,用户每次提交一个提示词,模型给出回答——这个过程叫推理。随着AI使用量爆炸,推理成本成了所有人都头疼的问题。

    Baseten的卖点是:把推理跑快,同时把成本压住。做法是把请求路由到最适合当前任务的模型,尤其是那些能力强、便宜的开源替代品。客户不用自己操心底层用哪个模型,Baseten在后面调度。

    这波被称为”推理淘金热”——VC们正在把大把的钱砸向构建推理层的公司。

    谁在领投

    这一轮据说由Spark Capital、Sands Capital、Altimeter Capital和Wellington Management共同领投。Baseten成立于2019年,算是这波AI浪潮里跑得比较稳的一家公司——不怎么高调,但每次融资都能拿到大机构的钱。

    值得提一下背景:训练层的巨头效应已经很明显了(OpenAI、Anthropic、Google),但推理层还在混战阶段。Baseten想做的是推理层的”基础设施”——让所有用AI的应用都能快速、便宜地跑推理,而不用自己建一套。

    估值疯涨的背后

    Baseten这波估值跳涨,其实是整个AI推理层被重估的缩影。训练一次模型要花几亿美元,但推理是每次用户提问都要发生的事——使用量越大,推理次数越多,这笔账就越好算。

    投资人押的不只是Baseten这家公司,而是”AI的推理层会变成像云计算一样的基础设施”这个假设。如果这件事真的发生,现在拿到的股权将来可能值很多倍。

    当然,分价轮这种操作也说明,130亿的估值不是所有人都完全买账。110亿进来的那批投资人,显然觉得130亿有点撑。但这就是2026年AI投融资的日常:公司在疯涨,投资人在FOMO和理性之间反复横跳。

  • 你在AI模型眼里存在吗?这个新工具给你打了分

    Google不好用了,那查人用啥?

    你上一次在Google上搜自己是什么时候?如果答案是”很久以前”,那你的感觉没错——Google搜索的结果确实不像以前那么好用了。但这背后有个更深层的变化:大家现在了解一个人,越来越多地通过聊天机器人,而不是搜索引擎。

    AI模型记忆与身份搜索
    In the Weights 用分数衡量你在AI模型眼里的存在感

    两个前OpenAI员工Thomas Dimson和Joey Flynn最近做了个工具叫In the Weights,把这个变化变成了一个可以量化的游戏。”Weights”指的是AI模型的参数权重——那些决定模型训练和输出的数字。这个网站声称能测量”一个模型在不用搜索工具的情况下,能多准确地回忆起某个人”。

    被写进权重里,意味着你的存在被认为足够重要,重要到在创造超级人工智能的过程中被记住了。

    怎么测的?

    具体做法挺直接:网站拿类似”这个人是谁?给出最多10个结果,每个带简短描述”这样的问题去问不同的模型,包括Grok、Gemini、多个版本的GPT、Claude、Llama,还有一些不太知名的模型。然后把相似的描述聚类,给你打个”强度分”。

    TechCrunch的作者Anthony Ha试了一下,拿了641分,排在前6%。他正得意呢,一查发现好几个同事分数比他高多了。排行榜一直在变,写这篇文章的时候,”小鬼当家”的主演Macaulay Culkin排第一,988分,和歌剧演唱家Luciano Pavarotti咬得很紧。

    幻觉标出来了

    结果里还会显示哪个模型给出了哪个答案,顺手把可能出现的幻觉也标出来。比如GPT-5.4 Mini说”Anthony Ha是个缩写,可能指多个名字首字母是A.H.A.的人”——这明显是在胡说。

    为什么做这个东西?Dimson说,他和Flynn离开OpenAI之后(他们是通过OpenAI收购设计工作室Global Illumination进去的),想找点有创意的事情做。他的想法是:2026年,Google式的虚荣搜索已经不是正确的目标了,因为越来越多的流量在往大语言模型那边走。

    那么多人的生活某种意义上是被编码进AI大脑里的一堆浮点数里面的。

    反响超预期

    Dimson说,反响比他们预想的要疯狂得多。他们本来以为就是个小小的好奇心的产物,结果好像戳中了大家的某根神经——大家都想看看自己在超级智能里是不是”永垂不朽”了。互相比较也是一大动力。

    这个网站还有个加分项:界面设计走的是任天堂NES的复古像素风,挺有特色的。Dimson说,他接下来打算深挖一下,为什么同一个系列的不同模型会给出不同结果,哪些模型对哪类人有偏见,以及哪些人”应该有个维基百科词条但实际上没有”。

    说到底,这个工具提出了一个挺有意思的问题:当AI模型成为大家获取信息的主要方式,你在模型眼里的”存在感”,是不是成了一件值得在意的事?