标签： AI

Google的AI大牛们正在集体出走，Anthropic和OpenAI疯狂捡人

Google的AI研究部门正在经历一轮令人不安的人才流失。根据彭博社的报道，顶级AI研究人员Jonas Adler和Alexander Pritzel已经决定离开Google，加盟Anthropic。这两个名字你可能不太熟悉，但他们都是Google Gemini模型开发过程中的核心人物。

一周之内，连续出走

这已经不是偶然事件了。就在上周，传奇AI研究员Noam Shazeer刚刚宣布离开Google、加入OpenAI。Shazeer在Google的资历极深——2000年就加入了，中间出去创立了Character.AI（那个做AI聊天伴侣的创业公司），后来Google花了27亿美元把Character.AI的人才和技术基本整个买了回来，目的就是把Shazeer弄回来主导Gemini项目。

顶级AI研究人员正从Google流向Anthropic和OpenAI | 来源：TechCrunch

结果人刚回来没多久，又要走。而且这次不是一个人——就在Shazeer官宣之后几天，DeepMind的总监John Jumper也宣布离职去Anthropic。Jumper可不是普通研究员，他和DeepMind CEO Demis Hassabis一起拿了2024年的诺贝尔化学奖，获奖理由是用AlphaFold预测蛋白质三维结构，这项技术对整个生物界都有颠覆性意义。

一个诺贝尔化学奖得主、一个Gemini核心架构师、一个Character.AI创始人——这些人短时间内接连离开，对任何一家公司来说都是值得警惕的信号。

为什么是现在

时机很微妙。OpenAI和Anthropic都在准备IPO，这对于顶尖AI人才来说是一个极具吸引力的时刻——用股权来抢人，这种手段在硅谷从来都好使。相比之下，Google的薪资福利虽然依然顶级，但股票增值的想象空间跟一家即将上市的公司能给出的期权比起来，确实没那么性感了。

还有一个更深层的问题：Google内部对AI研究方向的控制和优先级排序，可能让一些研究员感到受限。Anthropic主打AI安全研究，OpenAI虽然争议不断但至少在推进AGI路线上目标明确。如果研究员觉得自己在Google做不了最想做的东西，出走只是时间问题。

这对Google意味着什么

短期来看，Gemini项目不会因为几个人离开就垮掉——Google的资源和人才储备依然深厚。但长期来看，如果这种顶级人才持续外流的趋势不能遏止，Google在大模型竞赛中的技术领先地位就会被一点点蚕食。

更关键的是，Anthropic和OpenAI正在形成某种人才”黑洞效应”——越多顶级研究员过去，对那些还在犹豫的人吸引力就越强。Google现在需要认真想想，除了钱之外，还能给这些最顶尖的脑子提供什么他们真正想要的东西。

📎 原文来源：AI researchers continue to leave Google for its rivals — TechCrunch

2026年6月25日
Google DeepMind砸7500万美元押注A24，AI开始认真搞定莱坞

硅谷和好莱坞的边界又模糊了一层。Google DeepMind本周一宣布向独立电影公司A24投资7500万美元，双方要一起给电影人做AI工具。A24这个名字你可能不陌生——《瞬息全宇宙》《波拉特2》《Backrooms》都是他们的作品，走的是那种不太商业但很能打的路子。

Demis Hassabis亲自出面

DeepMind的CEO兼联合创始人Demis Hassabis在新闻稿里说了一句话，大意是：要做出真正能帮到创作者的工具，最好的办法就是跟创作者直接合作。这次合作被双方称为”首创性”的联盟，Google DeepMind会从中获得一线艺术家的反馈和指导，反过来为电影制作流程开发AI功能。

Google DeepMind投资A24，AI正式进军好莱坞影视制作 | 来源：TechCrunch

Hassabis这句话其实挺值得玩味的。过去两年，好莱坞对AI的态度可以用”又爱又恨”来形容——爱的是它确实能省成本、提效率，恨的是大家搞不清楚这东西到底会不会抢走自己的饭碗，再加上去年编剧工会大罢工，AI成了绕不开的敏感词。

A24不是第一个吃螃蟹的

但A24远非第一个在AI影视工具上押注的玩家。今年早些时候，Netflix宣布收购了本·阿弗莱克创办的AI工具公司InterPositive，这家公司专门给电影人做AI辅助制作工具。去年，亚马逊的MGM工作室也组了一个AI单元，目标同样是给电影和电视制作开发工具。

好莱坞的AI军备竞赛已经开始了，只是这次的战场不在特效，而在创作工具链。

A24最近跟Timothée Chalamet和Anne Hathaway等一线明星都有合作项目，这次拿到Google DeepMind的投资，显然是想在AI辅助创作这条路上走得更前面。对于一家以”独立””作者性”闻名的制片公司来说，主动拥抱AI工具这个决定本身就需要一点勇气。

7500万美元能买到什么

目前双方公开的细节并不多，只知道会共同开发面向电影制作的AI工具，具体是剧本分析、预可视化、后期制作还是发行营销，暂时还不清楚。但DeepMind在生成式AI和多模态模型上积累的技术，如果真的能无缝接入电影制作流程，想象空间确实不小。

对Google来说，这笔投资的意义可能不止于”做工具卖钱”。A24在年轻创作者和影迷群体里的影响力不小，如果DeepMind的技术能在一部叫好又叫座的作品里刷个脸，对Google AI在整个创意产业的品牌认知会是很强势的背书。

📎 原文来源：Google DeepMind bets $75M on AI’s future in Hollywood with A24 deal — TechCrunch

2026年6月25日
Milvus：高性能云原生向量数据库，为AI应用打造的神经记忆中枢（44.9K Stars）
Milvus：高性能云原生向量数据库，为AI应用打造的神经记忆中枢

44,934+ ⭐ · Go + C++ · Apache 2.0 · LF AI & Data 基金会托管

📌 项目简介

Milvus 是由 Zilliz 开发、LF AI & Data 基金会托管的开源向量数据库，专为 AI 应用的大规模非结构化数据检索而设计。底层使用 Go 和 C++ 编写，支持 CPU/GPU 硬件加速，可在十亿级向量规模下实现毫秒级检索延迟，是 RAG、推荐系统、多模态搜索等 AI 应用的首选向量存储引擎。最新稳定版：v2.5.13（2026年6月）。

44.9K

GitHub Stars

4,089

Forks

10亿+

向量规模

5种

SDK语言
⚙️ 安装要求和过程

💻 环境要求

CPU：4核以上（生产推荐16核+）

内存：16GB以上（十亿级向量推荐128GB+）

存储：SSD推荐，冷数据可归档至S3/GCS（成本降低10倍）

Docker：Standalone模式需Docker 19.03+（最简方式）

Kubernetes：分布式部署需K8s 1.20+

Python：3.8～3.12（pymilvus SDK支持）

🐳 快速安装（Docker Standalone，生产推荐）

# 下载 docker-compose.yml（含 etcd + MinIO 依赖） wget https://github.com/milvus-io/milvus/releases/download/v2.5.13/milvus-standalone-docker-compose.yml -O docker-compose.yml # 启动 Milvus docker compose up -d # 验证（看到三个容器均为 healthy 即成功） docker compose ps

🐍 Python SDK 安装（最常用）

# 标准安装（连接远程Milvus服务） pip install -U pymilvus # 包含 Milvus Lite（嵌入式，pip install即可运行，无需Docker） pip install "pymilvus[milvus-lite]" # 验证 python -c "from pymilvus import MilvusClient; print('Milvus OK')"

☁️ 零配置托管（Zilliz Cloud）

不想自建服务？试用 Zilliz Cloud，提供 Serverless（按量付费）、Dedicated（专属集群）、BYOC（自带云）三种模式，免费额度足够个人开发使用。与 AWS Bedrock、Azure OpenAI 深度集成。
✨ 核心功能

⚡ 十亿级高性能检索

存储计算分离架构，支持 HNSW / IVF / SCANN / DiskANN 等全部主流索引。GPU 加速兼容 NVIDIA CAGRA，十亿级向量下毫秒级延迟，QPS 可达数万次/秒。在官方性能基准中处于行业第一梯队。

🔀 混合检索（稠密+稀疏向量）

原生支持 BM25 全文检索和学习的稀疏嵌入（SPLADE、BGE-M3），同一集合可同时存储稠密和稀疏向量，自定义重排策略合并多路结果，RAG 召回率提升 30%+。这是 Milvus 相比其他向量数据库的显著优势。

🏢 企业级多租户与安全

支持数据库/集合/分区/分区键四级隔离，单集群可承载数百万租户。强制用户认证、TLS 加密、RBAC 细粒度权限控制，满足 SOC 2 合规要求。适合 SaaS 平台多客户场景。

💾 冷热存储分离

热数据存内存/SSD，冷数据自动归档至 S3/GCS，存储成本降低 10 倍。支持对象存储原生架构，无需额外 ETL 即可直接读取云存储中的向量数据。Collection 级别的 Fork（写时复制）功能，大幅提升实验迭代效率。

🌐 多语言 SDK + 丰富 AI 生态集成

官方 SDK 覆盖 Python（pymilvus）、Java、Go、Node.js、Restful API 五种语言。原生集成 LangChain、LlamaIndex、OpenAI、HuggingFace、AutoGPT 等主流 AI 框架，可作为 RAG 应用的即插即用向量存储。Attu 提供图形化管理界面，Prometheus/Grafana 支持监控告警。
🏗️ 架构设计

Milvus 采用存储与计算分离、无状态微服务的分布式架构，所有组件以容器化方式部署，可充分利用 Kubernetes 的调度和自愈能力。

┌───────────────────────────────────────────────┐ │ API Service Layer │ │ gRPC / REST / Python / Java / Go SDK │ └──────────────┬──────────────────────────────┘ │ ┌───────────────▼──────────────────────────────┐ │ Coordinator Service (元数据) │ │ Root Coord │ Query Coord │ Data Coord │ └────┬──────────┴─────────────┴──────────────┘ │ │ │ ▼ ▼ ▼ ┌──────────┐┌──────────┐ ┌──────────┐ │ Query ││ Data │ │ Index │ ← 可独立扩缩容 │ Node ││ Node │ │ Node │ │(读密集) ││(写密集) │ │(索引构建)│ └───┬──────┘└───┬──────┘ └───┬──────┘ │ │ │ ┌─────▼──────────▼────────────▼─────────┐ │ Object Storage (S3 / GCS / MinIO) │ │ + Hot Cache (内存 / SSD) │ └──────────────────────────────────────────┘

所有协调服务支持多副本部署，单节点故障秒级恢复。存储与计算解耦，可按业务特征独立调整查询/写入容量。
🎯 典型使用场景

场景一：RAG（检索增强生成）应用

将企业知识库文档向量化存入 Milvus，用户提问时检索最相关的 Top-K 片段，注入 LLM 上下文窗口，显著提升回答准确性并减少幻觉。混合检索（向量+全文）可进一步提升召回率。官方 RAG 教程 30分钟可跑通 Demo。

场景二：多模态语义搜索引擎

利用 CLIP 等多模态模型将图片、音频、视频转为向量存入 Milvus，实现”以文搜图”、”以图搜图”、”视频片段检索”等功能。支持动态字段存储原始元数据，检索结果可直接返回图片 URL 或视频时间戳。图像检索实战教程可直接参考。

场景三：实时推荐系统

将用户行为特征和物品特征向量化后存入 Milvus，通过近似最近邻搜索实时找相似用户或相似物品，实现个性化推荐。支持流式数据实时更新，新用户行为可在秒级反映到推荐结果中。官方电影推荐系统教程可直接参考。
💡 推荐理由

在向量数据库赛道中，Milvus 是最成熟、生产案例最多的开源选择之一。与 Chroma（轻量级，适合原型）和 Qdrant（Rust 性能优异）相比，Milvus 的独特优势在于：

云原生分布式架构：K8s 原生支持，可独立扩展查询/数据/索引节点，真正适合生产环境大规模部署（Chroma 无分布式，Qdrant 分布式为企业版功能）

混合检索能力：稠密+稀疏向量一体化，RAG 场景召回率显著优于单一向量检索（多数竞品仅支持稠密向量）

LF AI & Data 基金会托管：开源治理规范，Apache 2.0 永久开源，不会突然变更许可协议

Milvus Lite 零配置：pip install 即可运行嵌入式版本，本地开发、单元测试、CI/CD 均无需 Docker

如果你正在构建 RAG 应用或语义搜索功能，Milvus 值得作为向量存储的首选方案进行评估。根据官方性能基准，Milvus 在十亿级向量场景下的检索性能处于行业第一梯队。
📥 下载地址

🐙 GitHub 仓库

milvus-io/milvus · 44.9K ⭐

🌐 官方网站

milvus.io · 文档 + 在线 Demo

☁️ Zilliz Cloud

托管服务 · 免费额度 · Serverless

🐍 Python SDK

pymilvus · PyPI 安装 · Milvus Lite

📚 官方文档

安装 · 教程 · API 参考 · 性能基准



📦 发布版本

v2.5.13（最新稳定版）· 发布说明

LF AI & Data 基金会托管 · Apache 2.0 开源协议 · Zilliz 主导开发

最后更新：2026年6月25日 · 数据来源：GitHub API + milvus.io
2026年6月25日
近400家地方报纸联名起诉OpenAI和微软：AI版权大战烧到地方媒体

OpenAI和微软又被告了。这一次站出来的是将近400家地方报纸，他们6月24日在纽约南区联邦法院提交了诉状，指控这两家公司在未经许可、未支付任何报酬的情况下，爬取并复制了他们的新闻报道，用来训练ChatGPT和微软Copilot。

地方报纸正在发起迄今规模最大的AI版权诉讼

“连一分钱都没给过我们”

诉状里的话说得很重。这些生成式AI产品”靠出版商的内容成为可能”，给被告带来了数十亿美元的市场价值，但”没有一分钱流向出版商”。原告方包括Richner Communications等多家报业集团，旗下总共运营着近400家地方和区域报纸。

具体的指控包括：被告”系统性地、秘密地”爬取了这些出版商的网站，把文章、报道和其他原创作品复制到自己的服务器上，用来训练大语言模型，同时删除了作品里的版权管理信息，并且在用户提问时直接生成了这些内容。

“除非开发AI产品的公司为其滥用出版商内容的行为负责，否则这场AI热潮将成为地方新闻业的丧钟。”
——原告出版商在诉状中陈述

地方报纸请出了前新泽西总检察长

这起诉讼的代理律所是Platkin LLP，创始人是前新泽西州总检察长Matthew Platkin（民主党）。Platkin在采访里说，这是迄今由地方和区域报纸牵头的最大规模法律行动。

此前针对AI公司的版权诉讼——比如《纽约时报》的案子——虽然开了先河，但地方媒体一直没有被带到谈判桌上。Platkin说：”地方新闻是美国绝大多数人信任的新闻来源，是我们民主的命脉，但这个商业模式已经让地方新闻走到了灭绝的边缘。”

他还提到了一个公平性问题：如果这场版权大战的最终结果只让最大的玩家受益，而那些今天还在兢兢业业报道本地新闻的人得不到任何补偿，”这是不公平的”。

OpenAI的回应：”合理使用”

OpenAI发言人在声明里说，他们的模型”赋能创新，基于公开数据训练，符合合理使用原则”。这是OpenAI在一连串版权诉讼中的标准回应。微软方面则没有立即回复置评请求。

这起诉讼加入了针对AI公司的一波又一波版权诉讼大潮——CNN、《纽约时报》、Reddit、韦氏词典和大英百科全书等都已经分别起诉了Perplexity AI。而这起新诉讼的目标是直接指向了这个行业里最大的两个玩家：OpenAI和微软。

地方报纸的困境是真实的。过去二十年，随着分类广告转到互联网、读者转到社交媒体，地方报纸的商业模式已经崩塌了大半。现在AI又来了——直接把他们的内容拿去，用来回答用户的提问，读者连点开原网站的动力都没有了。

这起诉讼能不能赢，还得看法院怎么解释”合理使用”。但至少，地方报纸终于开始抱团跟最大的AI公司正面对抗了。

📎 原文来源：Nearly 400 local newspapers are suing OpenAI and Microsoft — The Verge

2026年6月25日
都说AI要取代程序员，数据却显示工程师比谁都抢手

AI到底有没有在抢程序员的饭碗？这场争论打了好几年，两边的人都能拿出一堆证据。裁员的公司说：用了AI，一个工程师能干过去三个人的活。但风投机构SignalFire刚出的一份报告，给了这个问题一个挺不一样的答案。

AI到底是在替代工程师，还是在让他们变得更高效？

裁员理由写的是AI，但招人数据说的不是一回事

SignalFire不是拍脑袋得出结论的。他们追踪了8000多万家公司的数亿名员工职业生涯数据，比那些靠调查问卷得出的结论要扎实得多。他们的发现是：2025年，工程岗位是所有职能里最抗打的。

具体数字是这样——大型科技公司的总招聘量比2019年下降了25%，但工程岗位的降幅只有11%，远低于平均水平。更有意思的是，在SignalFire定义的”科技巨头”（Alphabet、Meta、Apple、Amazon、Microsoft、Netflix、Nvidia、Tesla、Uber、Airbnb、Block、Stripe）2025年的所有新员工里，工程师占了55%。2019年这个比例是46%。

“很多公司裁员的理由一律写AI，尤其是说AI写代码厉害了，一个工程师能顶过去好几个。但我们在实际数据里看到的情况，跟这个说法不太一样。”
——Asher Bantock，SignalFire研究负责人

早期创业公司的数据更说明问题。2025年，早期初创公司招的工程师数量比2019年还多了7%。如果AI真的在替代工程师，你不会看到这个趋势。

Anthropic自己的人都不信”AI消灭就业”这个说法

这事儿有点尴尬。Anthropic CEO Dario Amodei去年警告说，AI有可能在五年内消灭一半的入门级白领岗位，失业率冲到20%。但他自己公司负责经济学的研究主管Peter McCrory，今年3月跟TechCrunch说的情况完全不一样。

McCrory说，他还没看到AI对就业市场有什么明显的实质影响。用Claude干活的那些人——技术写手、数据录入员、软件工程师——和那些不太被AI影响的工作相比，失业率”至少没有显著差异”。

黄仁勋说得更直接。今年4月在斯坦福商学院的一场访谈里，有人问他怎么看”AI要消灭所有软件工程岗位”这个说法，他直接说反了。英伟达所有工程师现在都在用AI代理写代码，结果呢？”软件工程师比以前更忙了。”

“代理写代码几乎是一瞬间的事，但它们一直在逼工程师想出’下一个想法’。”
——黄仁勋，Nvidia CEO

Jevons悖论：效率越高，需求越大

SignalFire的报告里提到了一个经济学概念——Jevons悖论。这个19世纪就有的理论说的是：蒸汽机效率越高，英国人烧的煤反而越多，因为用煤变得更划算了，需求就扩大了。

AI写代码这事也是一样。工程师现在用AI辅助，产出效率翻了好几倍，按理说需要的人应该变少。但实际情况是：能做的事变多了，需求反而更大了。Bantock的说法很直白：”他们突然变得效率高了很多，但活是干不完的。”

这个逻辑其实不难理解。AI降低了写代码的门槛，也让以前不敢想的项目变得可行了，结果就是更多想法等着被实现，而不是更少。

5月份科技行业裁员创了近年单月新高，AI是头号背锅侠。但SignalFire的数据提醒了一个被忽略的角度：公司在裁员的同时，还在抢工程师。这两件事可以同时是真的——只是被裁掉的和被招进去的，可能不是同一批人。

📎 原文来源：AI was supposed to kill engineering jobs, but new data suggests they’re the most resilient — TechCrunch

2026年6月25日
企业AI狂欢结束，Accenture们开始严控员工用AI的”零花钱”

企业开始严控AI token支出（概念图）

今年早些时候，AI行业还在鼓励每家公司的员工尽量多用AI，把token预算花到上限，甚至搞内部排行榜来激励大家——这个现象有个名字叫”tokenmaxxing”。但现在，风向变了。

最新的信号来自Accenture。根据404 Media获得的内部会议录音，这家全球咨询巨头的agentic AI战略负责人Justice Kwak在会上说了一句话：”AI正在成为成本结构里不可忽视的一项，支出的可预测性越来越差，CFO、COO、CIO级别的人都在问，花的钱到底值不值。”

从”多用AI”到”省着用”

这个转折来得很快。就在不久之前，Accenture还在内部发话，说不用AI的员工”会失去晋升机会”。现在同样这家公司，却在想办法阻止员工把token预算花光——比如用AI把PDF转成PPT这种琐碎任务，在Accenture内部已经被点名了。

这背后的逻辑其实很朴素：token不是免费的，而且价格不便宜。一家有几万名员工的公司，如果每个人每天用AI助手处理几十条请求，一个月下来账单可以很吓人。更关键的是，很多这样的用法并没有产生对应的商业价值。

“我们正处在一个拐点，AI正在成为成本结构中实质性的存在。支出变得非常不可预测，领导层——尤其是CFO、COO和CIO级别——仍在问一个问题：我们从AI上花的钱，到底得到了什么价值？”
——Justice Kwak，Accenture agentic AI战略负责人

不只是Accenture

Accenture不是唯一一个开始”token配给”的公司。根据The Information的报道，Meta也在采取措施限制员工使用AI工具，原因是AI成本已经达到了数十亿美元的规模。

Amazon之前也干过类似的事——他们曾经搞过一个”tokenmaxxing排行榜”，鼓励开发者尽量多用AI工具，后来因为成本失控，这个排行榜被悄无声息地撤掉了。

这种现象背后是一个更深层的问题：企业到底该怎么衡量AI的ROI？员工用AI确实可能提高了效率，但这个效率提升能不能覆盖AI使用的成本，很多时候是一笔糊涂账。

token经济的泡沫信号

企业开始严控AI支出，这个时间节点值得注意。就在这几天，资本市场出现了一波”AI抛售”——memory芯片制造商的股价受到了明显冲击。投资者正在重新评估AI公司的盈利模型，光有”增长”和”兴奋感”已经不够了。

从企业端来看，token成本的疑问正在动摇整个AI商业模式的根基。如果连Accenture这种最积极拥抱AI的公司都在问”值不值”，那说明这个行业已经从”跑马圈地”进入了”算账”阶段。

对员工来说，这也意味着”AI技能”的含金量正在重新定义。会用AI不等于能产生价值，能证明AI使用带来实际产出的人，才会在新一轮的”AI绩效考核”里站得住脚。

这场从”tokenmaxxing”到”token rationing”的转变，或许是企业AI应用成熟化的必经之路。狂欢结束之后，才是真正考验的开始。

📎 原文来源：TechCrunch · Companies are scrambling to stop employees from maxing out AI budgets with small tasks

2026年6月25日
OpenAI拿出第一块自己的AI芯片，代工的是Broadcom

OpenAI首款定制AI推理芯片Jalapeño（概念图）

昨天OpenAI办了个小仪式，Broadcom的CEO Hock Tan亲自把第一块Jalapeño芯片交到了Sam Altman和Greg Brockman手里。这块芯片的全名很长——OpenAI Intelligence Processor，代号Jalapeño——是OpenAI第一次真正拥有自己名字的定制AI推理处理器。

这件事的意义不只是”OpenAI做了块芯片”这么简单。它意味着这家公司正在把掌控权从Nvidia手里往自己这边挪一步。

为什么是现在

OpenAI和Broadcom的合作关系去年10月就公布了，但芯片真正亮相还是这两天的事。根据OpenAI官方的说法，从设计到送厂制造（tape-out），整个过程只用了9个月。他们说自己用AI模型辅助了芯片设计，所以才能跑这么快。

如果这个数字属实，这确实是高性能半导体行业里最快的ASIC开发周期之一。通常这种级别的芯片从设计到出炉要走两三年，OpenAI说自己9个月搞定了，里面有它自己模型的功劳——用AI设计AI芯片，这个逻辑闭环很有意思。

Jalapeño不是一块通用加速卡，它是从零开始为大型语言模型推理设计的。用OpenAI硬件项目负责人Richard Ho的话说：”我们围绕对前沿AI模型推理需求的理解，从头优化了架构。”

它到底强在哪里

OpenAI目前给出的最核心数据是：性能功耗比（performance per watt）大幅优于当前业界最先进水平。具体好多少，他们说要等几个月后的技术报告才会披露。

目前Jalapeño的工程样品已经在实验室里跑起来了，生产目标频率和功耗都达标，跑的负载包括GPT-5.3-Codex-Spark。这块芯片的设计思路是减少数据搬运（data movement），同时把计算、内存和网络资源平衡好，让实际利用率尽量接近理论峰值。

专门做推理，不是训练。这个定位很清晰——预训练这种最吃算力的任务短期内还是会跑在Nvidia的GPU上，但推理侧的成本优化空间巨大，哪怕只省个10-20%，对OpenAI这种规模的运营来说都是真金白银。

全栈叙事

OpenAI在这波宣传里反复强调的一个词是”full stack”——全栈。他们的逻辑是：不光做模型，不光做产品，现在连芯片架构、内核、内存系统、网络、调度、部署系统全部自己设计，每一层都围绕同一个目标优化：让模型更快、更可靠、更便宜。

这个叙事其实和Google的TPU、Amazon的Trainium是一个路子。这些公司都发现，与其完全依赖Nvidia，不如自己掌握一部分算力供应链。区别在于，OpenAI是纯软件公司起家，现在往硬件走，这个跨越比Google和Amazon都要大。

接下来怎么铺

Jalapeño只是第一代。OpenAI和Broadcom签的是multi-generation路线图，计划从2026年底开始部署到吉瓦级（gigawatt scale）的数据中心，合作方包括Microsoft和其他伙伴。

Broadcom的CEO Hock Tan在声明里说：”这只是多代路线图的第一步。通过和OpenAI直接联合开发我们的领先硅片，我们能让吉瓦级数据中心从2026年开始部署。”

吉瓦级是个什么概念？大概是一个中等城市的总用电功率。把AI数据中心做到这个规模，算力供给确实是个核心瓶颈，这也是为什么OpenAI要自己下场做芯片。

这块芯片目前还在测试阶段，离大规模部署还有段时间。但它传递的信号很明确：OpenAI不想在算力这件事上完全被人卡脖子，哪怕这个”人”是Nvidia。

📎 原文来源：TechCrunch · OpenAI unveils its first custom chip, built by Broadcom

2026年6月25日
做AI写作工具的Superhuman，把AI检测工具GPTZero买了

AI写作和AI检测，本来像是矛和盾的关系，现在被同一家公司握在手里了。

Superhuman收购AI内容检测平台GPTZero

Superhuman（就是那个改名前的Grammarly）宣布收购GPTZero——一个专门检测AI生成内容的工具。GPTZero能做的事包括：判断一段文字是不是AI写的、检测AI幻觉（就是模型瞎编的内容）、查抄袭。

集成到Superhuman Go

收购之后，GPTZero会集成到Superhuman Go里。这个AI助手号称能在”100万个应用和网站”里工作，以后用户在写东西的时候，就能同时用到写作辅助和内容真实性验证两套能力。

Superhuman的说法是，他们要做”内容真实性”的两端：一边帮用户负责任地用AI写作，一边帮用户判断读到的内容是不是AI生成的。

教师市场仍是重点

这个组合确实有点意思。GPTZero之前最有名的用户群体是教师——老师们用它来检测学生作业是不是用ChatGPT写的。Superhuman收购后表示，教育市场仍然是重点，会把GPTZero的工具直接嵌到用户已经在用的写作场景里。

当然，这事在外人看来有点矛盾：你一边卖AI写作工具，一边卖AI检测工具，这不是自己打自己吗？但Superhuman的逻辑是，用户既需要AI帮助写作，也需要知道哪些内容是AI生成的——两个需求同时存在，不如都攥在自己手里。

收购金额没披露。GPTZero会继续以独立品牌运营，Superhuman方面表示不会把它完全吞掉，而是让它继续服务已有的用户群。

📎 原文来源：Superhuman is acquiring GPTZero, an AI content detector – The Verge

2026年6月25日
白宫想要审查Meta的AI模型，扎克伯格还在犹豫

就在各家公司争相把AI模型开放给美国政府审查的时候，Meta选了最后一个当”钉子户”。

白宫与Meta在AI审查问题上的博弈

《纽约时报》的报道说，白宫官员正在向Meta施压，要求它把AI模型提交给”AI标准与创新中心”（CAISI）做安全评估。OpenAI、Anthropic、Google、xAI、微软早就签了协议，只有Meta还没松口。

行政令背后的推力

这事可不是突然冒出来的。6月2日，特朗普签了一份行政令，要求前沿AI模型在公开发布前，给联邦专家最多30天的时间做审查。政府这边要在7月底前把正式评审流程搭好，但其他公司实际上已经交了几个月的作业了。

CAISI这个单位是专门找软件漏洞、防网络攻击、阻止军事滥用的。政府现在最想看的，包括Meta今年4月刚发布的Muse Spark模型——这个模型还带了个专门的推理模式，用来处理复杂问题。

Meta发言人的回应很外交辞令：”我们在研究具体细节，希望很快能签协议。”翻译过来就是：还在谈，别催。

开源路线与政府审查的张力

这事背后的张力挺有意思。Meta一直以来打的都是开源牌，跟OpenAI、Google那种把模型锁在服务器里的思路完全相反。现在政府说要提前审查，等于是要Meta把”开源”的节奏交给华盛顿来把关。

几周前，政府刚命令Anthropic暂停Mythos 5对非美国公民的访问，理由是”国家安全关切”。这个信号发出去之后，剩下的公司基本都乖乖交卷了，只剩Meta还在扛。

Meta到底会不会最终签字，还是个未知数。从它过去几年跟监管打交道的方式来看，拖字诀是常用手法——能拖就拖，拖到对自己最有利的时点为止。

📎 原文来源：Meta reportedly still haven’t agreed to allow the US government to review its AI models – The Verge

2026年6月25日
deer-flow：ByteDance 开源超级智能体框架，74K+ Stars 让 AI 处理小时级复杂任务
2026年2月，ByteDance（科技公司）开源了其内部打磨多时的超级智能体框架 deer-flow 2.0，发布当天即登顶 GitHub Trending 榜首，目前已收获 74,000+ Stars。这不仅仅是一个”AI聊天机器人”，而是一个能够处理分钟级到小时级复杂任务的长周期智能体框架——从深度研究、代码编写，到内容创作、幻灯片制作，deer-flow 都能自主规划并执行。

🦌 项目简介

deer-flow（鹿流）是 ByteDance 开源的长周期超级智能体框架（Super Agent Harness），由初代 Deep Research 框架完全重构而来。它支持研究、编码、内容创作等复杂任务，通过沙箱隔离、持久化记忆、工具调用、子智能体协作等能力，处理从几分钟到数小时的各类任务。2.0 版本为完全重构版本，架构更清晰、扩展性更强。

deer-flow 2.0 – ByteDance 开源超级智能体框架

🛠 安装要求和过程

环境要求
- Python：3.12+（推荐使用 uv 管理依赖）
- Node.js：22+（前端界面需要）
- pnpm：前端包管理工具
- Docker：推荐部署方式（可选，用于沙箱隔离）
- 操作系统：macOS / Linux / Windows（WSL2）
快速安装（3分钟上手）
```
# 1. 克隆仓库
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow

# 2. 运行交互式配置向导（2分钟完成，生成 config.yaml 和 .env）
make setup

# 3. 安装依赖（本地开发模式）
make install

# 4. 启动本地服务
make dev
# 访问地址：http://localhost:2026
```
配置向导会引导你设置 LLM 提供商（支持 OpenAI / DeepSeek / MiniMax / Qwen / 本地 vLLM 等）、网页搜索提供商（Tavily / Brave / Exa 等），无需手动编辑配置文件。配置完成后可随时运行 make doctor 验证配置是否正确。

Docker 部署（推荐生产环境）
```
# 开发模式（支持热重载）
make docker-init    # 仅首次或沙箱镜像更新时运行
make docker-start   # 启动服务

# 生产模式
make up             # 构建镜像并启动所有生产服务
make down            # 停止并删除容器
```
🎯 核心功能
- 🧠 子智能体调度：主智能体可按需创建子智能体，每个子智能体拥有独立上下文、工具和终止条件；子智能体支持并行执行，执行结果结构化返回，主智能体最终汇总输出。长任务可拆分为多个子步骤，支持分钟到小时级别的复杂任务处理。
- 📦 沙箱与文件系统隔离：每个任务拥有独立执行环境，支持文件读写、编辑、图像查看；支持多种沙箱模式：本地执行、Docker 隔离容器执行、Kubernetes Pod 执行。沙箱内文件路径 /mnt/user-data/ 下包含 uploads/（用户上传文件）、workspace/（智能体工作目录）、outputs/（最终交付物）。
- 🧩 技能与工具扩展：内置研究、报告生成、幻灯片制作、网页生成、图像/视频生成等开箱即用技能；支持自定义技能、MCP 服务器扩展、Python 函数自定义工具；技能按需加载，避免上下文窗口过度占用；支持通过 /skill-name 前缀手动激活单轮技能。
- 💾 长期记忆：跨会话持久化存储用户偏好、技术栈、常用工作流等信息；自动跳过重复记忆条目，避免记忆无限膨胀；记忆本地存储，用户完全可控。让智能体”记得”你之前的项目背景和编码习惯。
- 🔌 IM 渠道集成：支持接入 Telegram、Slack、飞书、企业微信、钉钉、微信等 IM 渠道，无需公网 IP 即可接收任务。在聊天工具中直接使用 /new、/status、/models、/memory 等命令管理对话和智能体。
- 📊 可观测性：内置 LangSmith、Langfuse 可观测性集成，支持全链路 LLM 调用、智能体运行、工具执行追踪。生产和调试时都能清晰了解智能体的决策过程。
💡 典型使用场景

场景一：深度研究报告自动生成

输入”研究 Transformer 架构的演进历程，输出一份 5000 字的技术报告，包含关键论文引用和架构对比图”，deer-flow 会自动规划研究步骤：搜索相关资料 → 阅读并提取关键信息 → 对比不同架构差异 → 生成结构化报告 → 输出为 PDF/Markdown。整个过程无需人工干预，耗时约 10-30 分钟。

场景二：代码项目从零搭建

输入”帮我搭建一个基于 FastAPI + Redis 的短链接服务，包含单元测试和 Docker 部署配置”，deer-flow 会创建子智能体分别处理：API 路由设计、Redis 缓存逻辑、测试用例编写、Dockerfile 生成。最终在 outputs/ 目录下产出完整项目代码，可直接运行。

场景三：内容创作与多语言本地化

deer-flow 内置内容创作技能，支持文章撰写、幻灯片制作、网页生成。结合 IM 渠道集成，可以将已有视频/文章自动翻译为多种语言并生成配音版本，实现内容的多语言分发。适合自媒体运营者和内容创作者使用。

🌟 推荐理由

deer-flow 2.0 是目前开源超级智能体框架中最接近”生产可用”的项目之一。与 LangChain、CrewAI 等框架相比，deer-flow 的最大特点是长周期任务处理能力——通过子智能体调度和上下文管理，它可以处理耗时数小时的复杂任务而不超出上下文窗口。这是很多同类框架做不到的。

几个让我印象深刻的细节：
上下文工程做得很到位：子智能体上下文隔离 + 自动摘要已完成子任务 + 中间结果卸载到文件系统，这套组合拳让长任务不 OOM。如果你用过其他框架处理长任务，就知道这个有多重要。
沙箱设计务实：支持本地 / Docker / K8s 三种沙箱模式，开发时可以用本地模式快速迭代，生产时切到 Docker 隔离。不用一上来就搞复杂的 K8s 部署。
ByteDance 背书：这不是个人业余项目，是 ByteDance 内部打磨后开源的框架，2.0 版本完全重构，代码质量和文档都相当不错。74K+ stars 和 GitHub Trending 第一也证明了社区认可度。
IM 渠道集成很实用：无需公网 IP 就能通过飞书/企微接收任务，对国内用户非常友好。想象一下在企业微信群里 @ 一下你的 AI 智能体，它就去后台帮你跑一个深度研究任务，完成后通知你——这个体验很丝滑。