标签: AI

  • 这家公司用《堡垒之夜》训练AI Agent,估值23亿美元

    一家纽约创业公司正在把电子游戏变成AI Agent的训练场。General Intuition本周宣布完成3.2亿美元融资,估值23亿美元。它的核心想法听起来像科幻小说:让AI在《堡垒之夜》这类游戏里练级,然后把学到的能力直接搬到右手机器人身上。

    AI Agent在游戏中训练
    General Intuition用游戏数据训练AI Agent,再迁移到真实机器人(图片:AI生成)

    同一个”大脑”,从游戏到现实

    走进General Intuition纽约办公室的研发区,联合创始人兼CEO Pim de Witte(31岁)会让访客看一块显示器。屏幕上有人在玩类似《堡垒之夜》的游戏——但操控它的不是人类,而是一个AI Agent,已经连续跑了100个小时。

    然后你会听到电子脚步声。一台四足机器人走过来,用身上的摄像头”看”到你,绕着你转了一圈,继续在办公室里探索。刚才那个打游戏的AI模型,现在正在驱动这台实体机器人。

    “我们在真实世界的机器人数据上只微调了8分钟,这个模型就能上岗了。而且这些数据是在街上采集的,不是在办公室里。”

    这套打法的关键在于:General Intuition不只是有游戏画面,它还拿到了玩家实际操作的手柄记录——每一个按键、每一次移动,都是带标注的训练数据。创始人de Witte的上一家公司Medal就是做游戏精彩回放分享的,积累了数亿小时的游戏录像,这才是真正的护城河。

    23亿美元的底气

    这一轮融资由Khosla Ventures领投,Jeff Bezos、Eric Schmidt、F1冠军Nico Rosberg都跟进了。Khosla本人说,他看好的是”直觉的涌现”——就像大语言模型涌现推理能力一样,世界模型的下一次跃迁可能是直觉式判断,而游戏里的人类操作数据就是关键燃料。

    钱主要花在算力扩张上。General Intuition跟CoreWeave签了协议,接下来重点跑下一代模型的预训练。今年夏天结束前,他们的API会对更多客户开放。


    不卖公司,也不做武器

    De Witte是荷兰人,团队很大一部分在欧洲,这影响了公司的气质。他明确划定了红线:不会把AI Agent用于伤害人类的场景。”如果我说我们要做致命自主武器,你觉得其他国家会怎么反应?”

    这跟当下硅谷热衷国防科技的氛围有点格格不入。De Witte甚至还挖来了公开辞职抗议Palantir的Brianna Martin担任首席幕僚长。他说:”我不明白硅谷为什么这么做,所以我不在那里。”

    作为从小靠搭建《RuneScape》私服赚到第一桶金(150万美元)的游戏玩家,他也在想游戏从业者的出路。General Intuition刚上线了一个叫Nerve的平台,让游戏玩家用现有设备赚外快——从数据标注慢慢过渡到机器人遥操作。Medal的用户正好是最容易被AI替代的那代人,他想让他们搭上这班车。


    simulation到现实的鸿沟

    这套故事听起来很性感,但质疑声也不少。核心问题是:在游戏里学会的能力,能不能在真实世界里规模化落地?大多数类似路线都需要天量的真实世界数据,采集慢、成本高。General Intuition的赌注是:游戏数据是一条可扩展的捷径。

    投资方愿意赌一把。毕竟,如果这条路真的走通了,General Intuition可能成为AI Agent和机器人领域的”底座级”公司——就像Anthropic或OpenAI那样,不做具体应用,而是把模型能力开放给所有人用。

    De Witte说得很直白:”我们不会自己去造自动驾驶公司,但我们要让下一个人造自动驾驶公司容易10倍。”

  • Sentence Transformers:RAG与语义搜索的基石,18.8K+Stars让文本嵌入变得简单

    Sentence Transformers:RAG与语义搜索的基石,18.8K+Stars让文本嵌入变得简单

    📌 项目速览
    项目名称: Sentence Transformers
    GitHub: huggingface/sentence-transformers
    ⭐ Stars: 18.8K+ | 🍴 Forks: 2.8K+
    编程语言: Python | 许可证: Apache-2.0
    维护方: Hugging Face (原 UKP Lab)
    官网: sbert.net

    🎯 项目简介

    Sentence Transformers 是计算文本嵌入(Embeddings)的事实标准框架,让语义搜索、RAG 检索和文本相似度计算变得极其简单。由德国达姆施塔特工业大学 UKP Lab 首创,现由 Hugging Face 团队维护,是每一个做 RAG、语义搜索、向量检索工程师的必备工具箱。

    只需两行代码,就能把任意句子转换成高质量稠密向量;再配合一行相似度计算,即可实现语义级别的文本匹配。支持 100+ 语言、15000+ 预训练模型、多模态(文本/图像/音频/视频)嵌入,堪称 AI 时代的”文本向量化瑞士军刀”。

    💡 为什么重要? 大语言模型虽强,但无法直接处理超长文本或实时检索。Sentence Transformers 将文本转化为固定维度的向量,使语义搜索、去重、聚类、推荐等任务速度提升 100 倍,是 RAG 系统的第一块基石。

    ⚙️ 安装要求和过程

    环境要求

    • Python: 3.10+
    • PyTorch: 1.11.0+
    • transformers: 4.41.0+
    • 硬件: CPU 可用,GPU(CUDA)可加速 10-50 倍

    快速安装

    # 基础安装(仅核心功能)
    pip install -U sentence-transformers
    
    # 带扩展功能(图像/音频/视频/训练/ONNX)
    pip install sentence-transformers[image,audio,video,train,onnx]
    
    # 使用 uv 快速安装
    uv pip install sentence-transformers
    
    # Conda 安装
    conda install -c conda-forge sentence-transformers
    

    验证安装:

    python -c "from sentence_transformers import SentenceTransformer; print('✅ 安装成功')"
    

    🌟 核心功能

    1. 稠密嵌入(Dense Embeddings)—— RAG 的核心

    将句子、段落甚至整篇文档转换为固定维度的稠密向量(通常 384-1024 维),使得语义相似的文本在向量空间中距离更近。支持 Matryoshka 嵌入(可变尺寸,大向量拆小不降性能)和 嵌入量化压缩(降低 4-8 倍存储)。

    2. 交叉编码器重排序(Cross-Encoder Reranking)—— 精准召回

    稠密检索快速召回 Top-100 后,用 Cross-Encoder 对查询-文档对进行精细打分,重排序后 Top-5 准确率可提升 15-30%。这是生产级 RAG 系统的标配二阶段检索策略。

    3. 稀疏嵌入(Sparse Embeddings)—— 关键词 + 语义混合

    基于 SPLADE 等模型生成稀疏向量(维度 = 词表大小,但 99.8% 以上元素为 0),兼具 BM25 的关键词匹配能力和稠密向量的语义理解能力,实现真正的 混合检索

    4. 多模态嵌入 —— 图文音视统一向量空间

    通过统一 API 支持文本、图像、音频、视频四种模态的嵌入模型。例如用 AI-ModelScope/CLIP-ViT-bigG-patch14 可实现图文跨模态检索,用 laion/clap-htsat-unfused 实现音频语义搜索。

    5. 模型训练/微调 —— 适配你的业务场景

    提供 20+ 种嵌入模型损失函数(余弦相似度、三元组、对比学习等)、10+ 种重排序损失函数、10+ 种稀疏编码损失函数。支持多语言、多任务联合训练,仅需几十对标注样本即可微调出业务级模型。

    🚀 典型使用场景

    场景一:RAG 知识库检索(最流行)

    企业文档问答系统的标准做法:用 Sentence Transformers 将知识库切片编码为向量存入向量数据库(Chroma/Milvus/Qdrant),用户提问时实时编码查询向量,召回最相关的 Top-K 文档片段送给 LLM 生成答案。

    from sentence_transformers import SentenceTransformer
    from qdrant_client import QdrantClient
    
    # 1. 加载嵌入模型
    model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
    
    # 2. 编码知识库文档
    docs = ["公司报销流程...", "年假申请方法...", "IT设备申领..."]
    doc_embeddings = model.encode(docs)
    
    # 3. 存入向量数据库
    client = QdrantClient(":memory:")
    client.add(collection_name="kb", vectors=doc_embeddings, payload=docs)
    
    # 4. 用户提问检索
    query = "怎么申请年假?"
    query_vec = model.encode(query)
    results = client.search(collection_name="kb", query_vector=query_vec, limit=3)
    print(results[0].payload)  # 返回最相关文档
    

    场景二:语义搜索与去重(电商平台/内容平台)

    电商平台的商品搜索(用户输入”红色运动鞋”能匹配”红跑步鞋”)、新闻推荐系统去重、简历与岗位描述的语义匹配,都依赖 Sentence Transformers 的语义编码能力。

    场景三:跨语言语义匹配(全球化应用)

    支持 100+ 语言的预训练多语言模型(如 paraphrase-multilingual-MiniLM-L12-v2),可将中文、英文、日文等不同语言的相同语义映射到向量空间的相近位置,实现跨语言检索和匹配。

    💡 推荐理由

    1. RAG 工程师的”Hello World”

    几乎所有 RAG 教程的第一个代码示例都是 Sentence Transformers。它把复杂的 Transformer 编码、池化、归一化等步骤封装成一行 model.encode(),让开发者专注业务逻辑而非模型细节。langchain、LlamaIndex 等框架的底层检索默认就用它。

    2. Hugging Face 生态深度整合

    作为 Hugging Face 官方库,可直接 model = SentenceTransformer("your-model-name") 加载 Hub 上任意模型,也轻松将本地模型 push_to_hub() 分享给社区。15000+ 预训练模型即搜即用,覆盖从轻量级的 MiniLM(80MB)到旗舰级的 gte-Qwen3(数 GB)。

    3. 性能与精度的完美平衡

    all-MiniLM-L6-v2(仅 80MB)在 MTEB 排行榜上达到中上水平,推理速度却是最强模型的 10 倍。配合 Matryoshka 训练,768 维向量可截断为 384/256/128 维使用,存储和检索速度提升数倍,精度损失极小。

    4. 生产级可靠性

    2019 年开源至今,历经 6 年迭代,2800+ Fork、1300+ 贡献者,PyPI 月下载量超百万。Apache-2.0 许可完全免费商用,被 Google、Microsoft、Amazon、Meta 等大厂的内部系统广泛采用。

    🎯 适用人群: RAG 开发者、搜索工程师、NLP 算法工程师、推荐系统工程师、AI 全栈工程师。如果你正在构建任何需要”理解文本语义”的系统,Sentence Transformers 都是首选工具。

    📥 下载地址

    本文由 AI 自动整理,数据截至 2026 年 6 月。项目持续更新中,建议访问官方仓库获取最新信息。

  • AI本该消灭工程岗,结果数据打脸——工程师反而成了最抗打的群体

    AI与工程岗位
    AI本该消灭工程岗,结果数据显示工程师反而成了最抗打的群体(图:AI生成)

    科技行业5月裁员数创近年新高,AI是头号理由。照这个逻辑,软件工程师应该是最危险的群体——毕竟GitHub Copilot、Cursor、Claude Code这些工具,已经能让一个工程师干过去三个人的活。

    但SignalFire的数据给出了一个完全相反的答案。这家风投公司追踪了超过8000万家公司的数百万员工职业生涯,发现工程岗是2025年最抗打的职能。

    大科技公司招聘跌了25%,工程岗只跌了11%

    SignalFire的分析师Asher Bantock说,现在很多公司拿AI当裁员理由,特别爱说”有了AI,一个工程师能顶过去三个”。但他们在地上看到的情况,跟这个说法不太一致。

    大科技公司总招聘量比2019年下降25%,但工程岗只下降了11%。更有意思的是,2025年工程岗占Tech Majors(Alphabet、Meta、Apple、Amazon、Microsoft、Netflix、Nvidia、Tesla、Uber、Airbnb、Block、Stripe)所有新招聘的55%,而2019年这个比例是46%。

    工程师在Tech Majors的新招聘中占比从46%升到55%——如果AI真的在替代他们,这个曲线应该往下走才对。数据不会说谎,至少这一次不会。

    早期创业公司的信号更明显

    早期创业公司的情况更直观:2025年招聘的工程师比2019年还多了7%。小公司没有大公司的”政治包袱”,招人就是缺人干活,这个7%的增幅说明了一个简单的事实——活儿变多了,不是变少了。

    Anthropic CEO Dario Amodei去年警告说AI可能消灭一半入门级白领工作,但Anthropic自己的经济研究负责人Peter McCrory今年3月说,他还没看到AI对劳动力市场的显著影响。两个Anthropic高管的说法,居然是矛盾的。

    黄仁勋说得挺直白

    Nvidia CEO黄仁勋今年4月在斯坦福商学院的访谈里,直接否定了”AI会消灭软件工程岗”的说法。他说,现在Nvidia的所有工程师都在用agentic AI,结果呢——”软件工程师比以前更忙了”。

    黄仁勋的解释是:agent瞬间就能写出代码,但它们不停地把工程师推向”想出下一个点子”的任务。代码写得越快,需要想的点子就越多——这是一个没有终点的循环。


    Jevons悖论来了

    经济学里有个老概念叫Jevons悖论:效率提升不会减少对资源的需求,反而会增加它,因为工作会膨胀到填满新的产能。AI让工程师生产力大涨,按理说需要的工程师更少了——但实际情况是,原来做不了的项目现在能做了,原来要排期半年的功能现在可以马上开工了。

    Bantock说了一句挺有意思的话:”他们突然变得高效多了,而且有做不完的活儿在等着他们。”这不是一个”AI抢饭碗”的故事,这是一个”AI让人类看到了自己原来有多少想做的事”的故事。

    至少目前来看,工程岗不但没被AI取代,反而成了香饽饽。那些担心AI抢饭碗的人,可能低估了人类对”更多想法”的无底洞式需求——只要有想做的事,就需要有人把它做出来,不管工具有多厉害。

  • OpenAI把Uber印度负责人挖走了,这个全球第二大AI市场到底有多香

    OpenAI进军印度市场
    OpenAI任命前Uber印度总裁Prabhjeet Singh为印度区首任董事总经理(图:AI生成)

    OpenAI最近又在印度下了一笔”大注”——挖来了Uber印度和南亚区总裁Prabhjeet Singh,让他担任OpenAI在印度的第一任董事总经理。印度是OpenAI仅次于美国的第二大市场,这个任命释放了什么信号?

    Singh上周五刚宣布从Uber离职,9月正式加入OpenAI,向亚太区总经理Kiran Mani汇报。他的职责覆盖消费者增长、企业采用、合作伙伴关系、监管沟通和运营——基本上把OpenAI在印度能做的事全揽了。

    不是第一次,也不会是最后一次

    这不是OpenAI在印度的第一次大动作。去年8月,OpenAI在新德里开了第一个办公室。今年早些时候,公司宣布要在孟买和班加罗尔开新办公室。2024年,OpenAI挖来了前Truecaller和Meta高管Pragya Misra负责公共政策和合作伙伴关系,后来她的角色扩展到战略和全球事务负责人。

    更早之前,OpenAI还请了前Twitter印度负责人Rishi Jaitly做高级顾问,帮忙搭建与印度政府在AI政策上的沟通。这套”先挖人、再铺业务”的打法,OpenAI在美国和欧洲早就验证过了,现在搬到印度来用。

    印度是OpenAI的第二大市场,这里的年轻人正在用ChatGPT的方式,重新定义他们怎么学习、怎么工作。OpenAI把这件事看得很重,重到值得专门挖一个Uber级别的高管过来坐镇。

    最近几个月在印度连出组合拳

    高等教育领域的合作、企业支付整合、AI驱动的电商试点、网页流媒体接入,OpenAI在印度最近几个月没闲着。它还参与了印度正在快速扩张的数据中心建设——这件事的意义比表面看起来大得多,数据中心建到哪里,AI的”本地化服务”就能铺到哪里。

    OpenAI特别提到,印度18到24岁的年轻人占ChatGPT印度用户近50%。这个年龄段的人,现在用什么工具写作业、做什么项目、怎么找工作,五年之后就是整个印度职场的主流方式。OpenAI把这个年龄段的用户握在手里,等于提前锁定了未来十年的印度AI市场。

    印度为什么成了香饽饽

    印度有超过10亿互联网用户,其中大部分还在用低端手机、慢速网络。谁能先把AI做到能在这些设备上流畅运行,谁就拿到了下一个10亿用户。这是Google、Meta过去十年在印度拼命烧钱的逻辑,现在AI公司也在用同样的思路布局。

    竞争对手Anthropic也在2025年底在班加罗尔开了印度办公室,今年初任命了前微软印度总经理Irina Ghose为印度负责人。这场”印度争夺战”才刚开局,但赌注已经不小了。


    OpenAI这次挖Singh,看中的是他过去几年在Uber印度打下的江山。Uber在印度的外卖、网约车、B2B物流几块业务,Singh都有深度参与。印度市场的复杂度——多语言、多支付方式、监管碎片化——不是随便一个硅谷空降兵就能搞定的。

    从OpenAI的招聘页面也能看出它在印度的野心。AI部署工程师、开发者体验工程师、开发者营销负责人、合作伙伴总监——这些岗位都在招人。印度已经成为OpenAI在亚太区最重要的阵地,这次挖人只是第一步。

  • Facebook给创作者做了个AI助手,想让他们别去TikTok和YouTube

    Facebook本周宣布,要把原来的Creator Studio工具重新设计成一个独立的AI伴侣应用,专门帮创作者在平台上把受众做起来。

    这件事的背后算盘很清楚:Facebook跟TikTok、YouTube抢创作者已经抢了很久了。给创作者更好的工具,他们才愿意留下来。而且,如果Facebook自己的AI助手够好用,创作者就不需要再去开ChatGPT想内容创意、分析数据了。

    Facebook创作者AI应用界面
    Facebook新的创作者AI应用界面(测试版)| 图片来源:Meta

    这个AI助手能干什么?

    新的应用里内置了Facebook6月4日刚推出的”AI创作者助手”。这个助手不是通用聊天机器人,它是专门针对创作者的需求训练的。它能根据创作者的内容风格、历史表现、受众互动情况,还有创作者自己设的目标,给出个性化建议。

    创作者可以直接问它问题,比如”我这个视频什么时候发最好?””大家在我最新那条帖子下面都在说什么?”因为是对话式的,你还可以接着问,比如”我的受众这三个月有什么变化?”

    以前要搞清楚这些,得自己去后台翻各种图表和仪表盘。现在直接问就行了,省了不少事。

    不只是问答,还能帮你回评论

    新的Creator Studio应用里还有一个用AI驱动的评论工具。它会把最重要的评论挑出来,然后用创作者平时的语气起草回复。当然,创作者可以编辑和确认之后再发,不是完全让AI乱回。

    每天打开这个应用,创作者会看到一个优先事项列表:最新帖子的表现怎么样、离自己设的目标还差多少、哪些评论需要回复。基本上把一天该干的事都帮你列好了。


    Meta最近在疯狂推独立应用

    这次的创作者AI应用,只是Meta最近一波新应用里的其中一个。上个月,他们推了一个叫Forum的独立应用,功能类似Reddit,是给Facebook Groups用的。

    4月,Meta还推出了一款叫Instants的应用,让用户在Instagram好友之间分享会消失的照片(很明显是在学Snapchat)。

    《纽约时报》本周二还报道说,Meta正在开发一款类似Polymarket的预测市场应用,内部代号叫”Arena”,不过还没正式推出。

    《华尔街日报》今年4月报道过,CEO扎克伯格告诉员工,AI带来的效率提升,会让公司有能力开发比历史上更多的应用。

    换句话说,以前Meta可能一年出不了几个新应用,以后说不定会快很多。AI帮他们省下来的人力和时间,会直接投入到做新东西上。

    目前还在测试阶段

    这个新应用目前只向部分创作者开放测试,还没全面推出。Facebook没说什么时候会向所有人开放。

    但方向已经很明确了:Meta要把AI塞进每一个它可能派上用场的地方。创作者工具只是一个开始,接下来估计还会有更多面向普通用户的AI功能,陆续装进Meta的各个应用里。

  • OpenAI首款自研芯片Jalapeño曝光:不再完全依赖英伟达

    周三,OpenAI终于把自己的第一款定制芯片拿了出来给人看。这款叫Jalapeño的推理处理器,是OpenAI跟Broadcom一块设计、一块造出来的。公司说,这颗芯片是专门针对OpenAI推理系统的需求定制的,而且开发过程中,OpenAI自己的AI模型也参与了芯片的设计工作。

    目前Jalapeño还在测试阶段,但OpenAI透露说,早期测试结果显示,它的性能功耗比要比目前业界最先进的方案强不少。这话听着有点虚,但考虑到OpenAI的体量,他们确实有底气这么说。

    OpenAI Jalapeño芯片概念图
    OpenAI首款自研芯片Jalapeño(概念图)| 图片来源:TechCrunch

    为什么要自己造芯片?

    这件事其实传了很久。OpenAI跟Broadcom的合作关系去年10月就正式公布了,但OpenAI要自研芯片的传闻,早在2025年初就开始到处飞。最核心的动机很简单:他们不想被英伟达牵着鼻子走。

    现在训练大模型、跑大模型,全得用英伟达的GPU。算力需求越大,OpenAI交给英伟达的钱就越多。自己造芯片,哪怕只能替代一部分英伟达的GPU,长期来看也能省下不少钱,更重要的是,不用再看英伟达的脸色。

    OpenAI总裁Greg Brockman在去年10月的一期官方播客里说过一段话,大意是:”我们对自己要跑的工作负载有很深的理解。我们一直在找那些现有方案服务不够好的特定场景,然后想办法造出能加速这些场景的东西。”

    Jalapeño能干嘛?不能干嘛?

    先说清楚,Jalapeño不是用来训练大模型的。它的定位很明确:专门做推理(inference)。也就是用户发一条指令,模型给出回答这个过程。OpenAI在公告里特别强调了这颗芯片在跑实时编程模型时的低成本表现。

    像预训练这种特别吃算力的活,短期内估计还是得靠英伟达的硬件。但推理成本的优化,对OpenAI的财务来说可能是个大事情。每次用户问ChatGPT一个问题,OpenAI都要付一次推理成本。如果能把这部分成本降下来,哪怕只降一点点,积少成多,对公司的盈亏平衡会有不小的影响。


    不是只有OpenAI在这么干

    自研AI芯片这件事,OpenAI不是第一个,也不会是最后一个。Google有自己的TPU(张量处理单元),亚马逊有Trainium,这些都是为了同一个目的:加速机器学习工作负载,减少对英伟达的依赖。

    但OpenAI这次做的,跟Google和亚马逊还不太一样。Google和亚马逊主要是给自己云服务里的客户用,OpenAI造这颗芯片,首要任务是服务自己的产品和模型。Codex、GPT系列,这些产品的推理需求,OpenAI比任何人都清楚。自己造芯片,等于把优化的主动权拿在了自己手里。

    OpenAI在公告里说了一段挺有意思的话:

    “OpenAI不仅在开发前沿模型或在模型之上构建产品,我们还在设计支撑这些模型的基础设施:芯片架构、内核、内存系统、网络、调度、部署系统,以及产品体验。因为OpenAI在整个技术栈上都有布局,每一层都可以围绕同一个目标进行优化:让模型更快、更可靠、对用户更便宜。”

    这段话翻译过来就是:我们不想只做软件,硬件我们也要自己搞。从最底层的芯片,到最上层的产品体验,全都要打通。

    Jalapeño这个名字…

    最后说个题外话,这颗芯片的名字Jalapeño(哈雷佩尼奥),是一种墨西哥辣椒。OpenAI给项目起名字一直挺随意的,之前GPT系列的内部代号也全是这种风格。至少比叫”OpenAI Chip 1.0″有意思多了。

    这颗芯片目前还在测试,什么时候能大规模用上,OpenAI没说。但方向已经很明确了:以后的OpenAI,不仅卖模型、卖订阅,还要卖自己造的芯片跑出来的推理能力。英伟达估计不太乐意看到这个局面。

  • 近400家美国地方报纸联合起诉OpenAI和微软:AI版权大战从巨头打到社区

    6月24日,纽约联邦法院收到一份重量级诉状:近400家美国地方报纸联合对OpenAI和微软提起版权侵权诉讼,指控这两家科技公司在未获许可、未支付任何报酬的情况下,系统性抓取、复制并”摄取”其受版权保护的新闻报道,用于训练ChatGPT和微软Copilot等AI产品。

    这不是第一家起诉OpenAI的媒体,但可能是规模最大、最具象征意义的一次。此前《纽约时报》、Ziff Davis、梅里亚姆-韦伯斯特和大英百科全书已经分别提起了诉讼,而这次,将近400家地方报纸——那些真正在覆盖美国各地社区日常新闻的”草根媒体”——站了出来。

    地方报纸起诉OpenAI版权侵权
    近400家地方报纸联合起诉OpenAI和微软丨来源:AI生成

    诉状里写了什么?

    原告在诉状中用了很直白的表述:OpenAI和微软”抓取、复制并摄取”(scraped, copied, and ingested)了他们的新闻作品,没有任何许可,也没有任何补偿。这些地方报纸花真金白银做采访、写报道、核实事实,结果AI公司把内容一股脑喂给了大模型,训练出来的产品还能直接回答用户的新闻问题——相当于用报纸的内容训练出了一个竞争对手。

    “被告利用这些新闻作品开发能够直接替代传统新闻报道的AI产品,从而损害了新闻出版行业的生存基础。”——诉状原文

    原告律师在法庭文件中强调,地方报纸是美国社区获取本地新闻的核心渠道——市议会开了什么会、本地学校预算怎么花、哪里新开了一家店,这些”接地气”的信息,都是地方报纸的记者跑出来的。AI公司免费使用这些内容,制造出能回答同样问题的AI产品,本质上是在”搭新闻机构巨额投资的便车”。

    OpenAI的”选择性付费”策略

    这场诉讼最刺痛人的地方在于:OpenAI并不是完全不付钱。过去两年,OpenAI已经和Axel Springer(旗下有Business Insider、Politico)、英国《金融时报》、美联社、法国《世界报》等大型国际媒体达成了付费授权协议。换句话说,大媒体有谈判筹码,能拿到钱;而地方报纸没有,就被白白用了内容。

    这种”掐尖式”的授权策略,让中小型出版商特别愤怒。他们觉得,OpenAI是在用”分化瓦解”的方式逐个击破——先和大玩家和解,让小玩家陷入孤立无援的境地。但这次近400家报纸联合起来,就是要告诉OpenAI:我们虽然各自很小,但加起来不好惹。

    Timing对OpenAI很糟糕

    这起诉讼的Timing,对OpenAI来说相当棘手。据报道,OpenAI正在筹备IPO,但其2025年财报显示亏损高达385亿美元。持续增加的版权诉讼,会直接变成IPO招股书里的”法律风险”章节,投资者读了之后,对估值的看法可能会大打折扣。

    更严重的是,如果法院最终判决OpenAI需要为训练数据支付赔偿,那这个金额可能不是几千万美元能搞定的——大模型训练用到的数据量实在太大,按传统版权计费方式算下来,可能是个天文数字。这也是为什么OpenAI拼命想和大型出版商单独和解,而不是等法院给个统一规则。


    这不只是钱的问题

    地方报纸的困境,其实已经持续了十几年。广告收入被Google和Facebook吃掉,数字化转型又烧钱,很多地方报纸早就撑不下去了。现在AI来了,直接用它们的内容训练模型,连”引流”这个最后的价值都被剥夺了——用户问ChatGPT就能拿到新闻要点,为什么还要去报纸网站看全文?

    这起诉讼的走向,很大程度上会影响AI行业未来的数据使用规则。是继续”先用了再说”,还是建立一套透明的内容授权机制?答案可能要在法庭上见分晓了。

  • 苹果Vision Pro硬件负责人跳槽OpenAI,Jony Ive团队再添一员大将

    彭博社昨天(6月26日)爆了个挺炸的消息:负责Vision Pro头显和智能眼镜项目的苹果副总裁保罗·米德(Paul Meade),本周内就要离职,目的地是OpenAI的硬件部门。

    米德不是一般人物。2010年加入苹果,最早在iPhone和iPad团队干活,2017年转到视觉产品团队,一路把Vision Pro从概念推到发布。七年时间,这玩意儿终于在2024年上市,定价3499美元,被苹果寄予”下一代计算平台”的厚望。

    苹果高管跳槽OpenAI概念图
    苹果硬件高管流向OpenAI,AI硬件竞赛升温丨来源:AI生成

    去OpenAI干什么?

    米德去OpenAI,是加入去年被OpenAI收购的硬件创业公司io Products的团队。这家公司是谁创办的?乔尼·艾夫(Jony Ive),苹果的前首席设计官,也就是iPhone、iPad、MacBook那个标志性设计背后的灵魂人物。

    去年OpenAI把io Products买下来,外界就一直在猜:萨姆·奥特曼(Sam Altman)和乔尼·艾夫到底要做什么硬件?现在答案逐渐清晰——他们在组建一支豪华硬件团队,而米德是这个拼图里关键的一块。他带来的,是苹果内部关于高端硬件从零到一整套流程的实战经验。

    “米德将参与OpenAI即将推出的一系列人工智能设备的研发。”——彭博社援引知情人士

    苹果的当口,Timing很微妙

    这波人事变动的Timing,对苹果来说相当不凑巧。就在前几天,苹果刚宣布蒂姆·库克(Tim Cook)的接班人是约翰·特努斯(John Ternus),新的CEO时代即将开启。高管层本来就在洗牌,现在连Vision Pro和智能眼镜项目的硬件一把手也被OpenAI挖走了。

    更尴尬的是,Vision Pro刚宣布涨价。原因?据报道是RAM短缺。一个本就售价3499美元的头显,还要再涨一波,消费者的热情本来就不高,这下更难卖了。与此同时,苹果的智能眼镜项目还在开发当中,正是需要核心硬件人才的时候,结果负责人跑了。

    苹果和OpenAI发言人都拒绝置评。但市场已经在用脚投票——苹果的硬件护城河,正在AI时代被一点点蚕食。

    AI硬件竞赛,已经开打

    把视角拉远一点,你会发现这次人事变动背后,是一场正在升温的AI硬件竞赛。OpenAI有了乔尼·艾夫的设计能力,现在又补上了米德的硬件工程经验,软件+设计+工程的三叉戟正在成型。

    谷歌有Pixel、微软有HoloLens、Meta有Ray-Ban智能眼镜和Quest头显,而现在OpenAI也要有自己的硬件了。苹果在AI软件层面本来就不占优,如果连硬件人才也开始流失,那”下一代计算平台”的争夺战,天平正在发生微妙的变化。


    保罗·米德不是第一个离开苹果加入AI前沿公司的硬件人才,也不会是最后一个。这场人才大战的背后,是整个科技行业对”AI原生硬件”的押注。苹果能不能守住自己的地盘,接下来的12个月很关键。

  • 亚马逊再砸130亿美元押注印度,全球AI算力竞赛找到新战场

    安迪·贾西去了一趟新德里,见了印度总理莫迪。回来之后,亚马逊宣布了一件事:追加130亿美元,扩建在印度的AI和云基础设施,时限到2030年。

    这笔钱主要用来扩充亚马逊云科技(AWS)在孟买和海得拉巴的数据中心容量。看起来只是一次例行扩建,但把它放在最近几年的脉络里看,意义不太一样。

    亚马逊印度AI数据中心概念图
    亚马逊在印度孟买和海得拉巴扩建AI数据中心

    三年三次,加码越来越狠

    这是亚马逊三年内第三次对印度做出重大投资承诺。2023年,贾西和莫迪见面后宣布到2030年投入150亿美元,其中127亿专门给AWS。2025年12月,亚马逊又把承诺总额推高到350亿美元。加上这次的130亿,亚马逊在印度累计承诺的投资总额已经到了480亿美元。

    当然,科技公司宣布的”长期承诺”往往同时包含资本支出和运营支出,不等于马上就要花掉的新基建投资。但480亿美元这个数字本身,已经足以说明亚马逊对印度市场的定位——不只是”重要”,而是”绝不能丢”。

    印度正在成为全球AI算力竞赛中各方都想拿下的那个”落脚点”。微软、谷歌、亚马逊,一个都没缺席。

    不是亚马逊一个人在跑

    微软2025年12月说要在2029年之前往印度投175亿美元。谷歌2025年10月宣布150亿美元,用于在印度建AI枢纽和数据中心基础设施。这两家加起来,已经和亚马逊的承诺总额差不多了。

    数据中心这个项目,砸钱的不只是美国科技公司。澳大利亚的AirTrunk承诺投300亿美元在印度建5吉瓦的AI数据中心;加拿大养老金投资委员会(CPP Investments)也进来了;印度本土的Reliance Industries和Adani Group,分别拿出了1100亿和1000亿美元的AI投资计划。

    • 微软:175亿美元,2029年到位
    • 谷歌:150亿美元,建AI枢纽和数据中心
    • AirTrunk:300亿美元,5吉瓦数据中心容量
    • Reliance:1100亿美元AI投资计划
    • Adani:1000亿美元投向AI数据中心

    印度打的是什么算盘

    新德里方面也在主动出牌。2026年2月,印度政府推出了一项税收优惠政策:外国云服务商如果把计算工作负载放在印度的数据中心、并且服务的是海外客户,那么这部分收入可以享受免税待遇,一直持续到2047年。

    这个政策指向很明确——印度不只是想当AI技术的消费市场,更想成为支撑全球AI运算的基础设施提供方。电价相对便宜、土地成本不高、政府愿意给税收优惠,这几个条件加在一起,对算力密集的AI产业确实有吸引力。


    亚马逊没忘记自己的老本行

    除了云和AI基础设施,亚马逊在印度的零售和物流网络也在同步扩张。今年计划新开20多个履约中心,以及超过100个最后一英里配送站。主打快速配送的”Amazon Now”服务,正在推进到全国300多个城市和乡镇。

    这个赛道现在挺挤的。Eternal旗下的Blinkit、Swiggy的Instamart、Zepto,还有沃尔玛控股的Flipkart,都在抢即时配送这块蛋糕。Flipkart上周刚说要在2026年底前在全国开1500个微型履约中心,亚马逊这边的压力不小。

    从AWS到即时配送,亚马逊在印度的这笔130亿美元新投资,表面上是在跟上AI基础设施的全球竞赛,实际上也在为更长远的印度市场布局做准备。480亿美元会不会全部落地、什么时候落地,还得接着看。

  • Claude付费用户悄悄涨了75%,这家”企业向”AI公司正在撬动ChatGPT的消费者地盘

    很多人对Anthropic的印象还停留在”那是家做企业生意的公司”——开发者用Claude Code写代码,公司用它搭AI工作流,消费者市场?那是ChatGPT的地盘。

    一家做信用卡交易数据分析的公司Indagari,最近给出了不太一样的数据。他们分析了约2800万美国消费者的匿名信用卡交易记录,时间跨度从2025年到2026年5月10日,覆盖了订阅付费和API token购买。结论很直接:Claude在消费者端的付费用户,正在稳定增长。

    Claude与ChatGPT消费者市场竞争
    Claude正在消费者市场悄悄追赶ChatGPT

    增长从哪里来

    具体数字Indagari没有披露,但他们看到的趋势是”持续向右上方走”。自2026年1月以来,Claude在这2800万人的样本里,付费消费者收入和用户数增长了大约75%。

    有意思的是,这个增长在三月份还经历过一次跳涨——当时Anthropic公开拒绝让自家的模型被特朗普政府用于大规模监控美国公民和开发自主武器。这件事在消费者圈子里反而成了加分项,之后增长并没有回落,而是继续保持上行。

    Anthropic拒绝配合政府大规模监控这件事,反而让更多普通消费者愿意掏钱订阅Claude。在AI公司争相和政府合作的当下,这个选择挺少见的。

    学Claude的人越来越多了

    另一组数据来自在线教育平台DataCamp。他们有大约2000万用户,教的是AI技能和数据分析。DataCamp说,”Claude”现在已经是他们网站上被搜索次数最多的词,比”AI”这个统称还热门。

    在自费学习的消费者群体里,Claude相关课程的需求量是ChatGPT课程的3倍。过去30天里,Claude课程的需求增长了18倍。不过在企业客户那边,ChatGPT的课程仍然更受欢迎——公司出钱培训员工的时候,还是更认ChatGPT。

    ChatGPT还是老大,但差距在缩小

    当然,把Claude和ChatGPT摆在同一个量级上说,目前还为时尚早。Sensor Tower的数据很清楚:ChatGPT在各个平台上的总用户数和付费用户数,仍然远远领先。只是ChatGPT基数太大,近期的增长率相对平缓,而Claude从较小的基数往上走,增速看起来就更醒目。

    Indagari的数据也印证了这一点——ChatGPT的付费用户绝对数量还是更多,但Claude从消费者口袋里赚到的钱,2026年以来确实在快速追赶。


    麻烦事还没完

    就在数据看起来一片向好之际,Anthropic又碰上了美国政府这道坎。本月早些时候,美国政府禁止Anthropic向非美国公民提供其最强大的网络安全模型Mythos 5和Fable 5,原因是担心模型被滥用。Anthropic的应对是把这两款模型暂时全网下线,目前还没有明确何时恢复。

    这件事对消费者业务的影响目前还看不清楚。政府限制的主要是非美国用户的访问,对美国本土消费者的订阅意愿影响可能有限。而且Anthropic的企业和开发者用户数据也在继续增长,看起来并没有因为这场风波而受到明显冲击。

    眼下OpenAI和Anthropic都站在准备上市的门槛上,外界对这两家公司的业务健康度的好奇心比以往任何时候都强。从目前能拿到的各种数据来看,Anthropic在消费者市场的这波增长,可能不是昙花一现。