标签: AI

  • Google的AI大牛们正在集体出走,Anthropic和OpenAI疯狂捡人

    Google的AI研究部门正在经历一轮令人不安的人才流失。根据彭博社的报道,顶级AI研究人员Jonas Adler和Alexander Pritzel已经决定离开Google,加盟Anthropic。这两个名字你可能不太熟悉,但他们都是Google Gemini模型开发过程中的核心人物。

    一周之内,连续出走

    这已经不是偶然事件了。就在上周,传奇AI研究员Noam Shazeer刚刚宣布离开Google、加入OpenAI。Shazeer在Google的资历极深——2000年就加入了,中间出去创立了Character.AI(那个做AI聊天伴侣的创业公司),后来Google花了27亿美元把Character.AI的人才和技术基本整个买了回来,目的就是把Shazeer弄回来主导Gemini项目。

    AI研究人员从Google流向Anthropic和OpenAI
    顶级AI研究人员正从Google流向Anthropic和OpenAI | 来源:TechCrunch

    结果人刚回来没多久,又要走。而且这次不是一个人——就在Shazeer官宣之后几天,DeepMind的总监John Jumper也宣布离职去Anthropic。Jumper可不是普通研究员,他和DeepMind CEO Demis Hassabis一起拿了2024年的诺贝尔化学奖,获奖理由是用AlphaFold预测蛋白质三维结构,这项技术对整个生物界都有颠覆性意义。

    一个诺贝尔化学奖得主、一个Gemini核心架构师、一个Character.AI创始人——这些人短时间内接连离开,对任何一家公司来说都是值得警惕的信号。

    为什么是现在

    时机很微妙。OpenAI和Anthropic都在准备IPO,这对于顶尖AI人才来说是一个极具吸引力的时刻——用股权来抢人,这种手段在硅谷从来都好使。相比之下,Google的薪资福利虽然依然顶级,但股票增值的想象空间跟一家即将上市的公司能给出的期权比起来,确实没那么性感了。

    还有一个更深层的问题:Google内部对AI研究方向的控制和优先级排序,可能让一些研究员感到受限。Anthropic主打AI安全研究,OpenAI虽然争议不断但至少在推进AGI路线上目标明确。如果研究员觉得自己在Google做不了最想做的东西,出走只是时间问题。

    这对Google意味着什么

    短期来看,Gemini项目不会因为几个人离开就垮掉——Google的资源和人才储备依然深厚。但长期来看,如果这种顶级人才持续外流的趋势不能遏止,Google在大模型竞赛中的技术领先地位就会被一点点蚕食。

    更关键的是,Anthropic和OpenAI正在形成某种人才”黑洞效应”——越多顶级研究员过去,对那些还在犹豫的人吸引力就越强。Google现在需要认真想想,除了钱之外,还能给这些最顶尖的脑子提供什么他们真正想要的东西。


  • Google DeepMind砸7500万美元押注A24,AI开始认真搞定莱坞

    硅谷和好莱坞的边界又模糊了一层。Google DeepMind本周一宣布向独立电影公司A24投资7500万美元,双方要一起给电影人做AI工具。A24这个名字你可能不陌生——《瞬息全宇宙》《波拉特2》《Backrooms》都是他们的作品,走的是那种不太商业但很能打的路子。

    Demis Hassabis亲自出面

    DeepMind的CEO兼联合创始人Demis Hassabis在新闻稿里说了一句话,大意是:要做出真正能帮到创作者的工具,最好的办法就是跟创作者直接合作。这次合作被双方称为”首创性”的联盟,Google DeepMind会从中获得一线艺术家的反馈和指导,反过来为电影制作流程开发AI功能。

    Google DeepMind与A24达成AI影视合作
    Google DeepMind投资A24,AI正式进军好莱坞影视制作 | 来源:TechCrunch

    Hassabis这句话其实挺值得玩味的。过去两年,好莱坞对AI的态度可以用”又爱又恨”来形容——爱的是它确实能省成本、提效率,恨的是大家搞不清楚这东西到底会不会抢走自己的饭碗,再加上去年编剧工会大罢工,AI成了绕不开的敏感词。

    A24不是第一个吃螃蟹的

    但A24远非第一个在AI影视工具上押注的玩家。今年早些时候,Netflix宣布收购了本·阿弗莱克创办的AI工具公司InterPositive,这家公司专门给电影人做AI辅助制作工具。去年,亚马逊的MGM工作室也组了一个AI单元,目标同样是给电影和电视制作开发工具。

    好莱坞的AI军备竞赛已经开始了,只是这次的战场不在特效,而在创作工具链。

    A24最近跟Timothée Chalamet和Anne Hathaway等一线明星都有合作项目,这次拿到Google DeepMind的投资,显然是想在AI辅助创作这条路上走得更前面。对于一家以”独立””作者性”闻名的制片公司来说,主动拥抱AI工具这个决定本身就需要一点勇气。

    7500万美元能买到什么

    目前双方公开的细节并不多,只知道会共同开发面向电影制作的AI工具,具体是剧本分析、预可视化、后期制作还是发行营销,暂时还不清楚。但DeepMind在生成式AI和多模态模型上积累的技术,如果真的能无缝接入电影制作流程,想象空间确实不小。

    对Google来说,这笔投资的意义可能不止于”做工具卖钱”。A24在年轻创作者和影迷群体里的影响力不小,如果DeepMind的技术能在一部叫好又叫座的作品里刷个脸,对Google AI在整个创意产业的品牌认知会是很强势的背书。


  • Milvus:高性能云原生向量数据库,为AI应用打造的神经记忆中枢(44.9K Stars)

    Milvus:高性能云原生向量数据库,为AI应用打造的神经记忆中枢(44.9K Stars)

    Milvus Logo

    Milvus:高性能云原生向量数据库,为AI应用打造的神经记忆中枢

    44,934+ ⭐ · Go + C++ · Apache 2.0 · LF AI & Data 基金会托管

    📌 项目简介

    Milvus 是由 Zilliz 开发、LF AI & Data 基金会托管的开源向量数据库,专为 AI 应用的大规模非结构化数据检索而设计。底层使用 Go 和 C++ 编写,支持 CPU/GPU 硬件加速,可在十亿级向量规模下实现毫秒级检索延迟,是 RAG、推荐系统、多模态搜索等 AI 应用的首选向量存储引擎。最新稳定版:v2.5.13(2026年6月)。

    44.9K
    GitHub Stars

    4,089
    Forks

    10亿+
    向量规模

    5种
    SDK语言

    ⚙️ 安装要求和过程

    💻 环境要求
    • CPU:4核以上(生产推荐16核+)
    • 内存:16GB以上(十亿级向量推荐128GB+)
    • 存储:SSD推荐,冷数据可归档至S3/GCS(成本降低10倍)
    • Docker:Standalone模式需Docker 19.03+(最简方式)
    • Kubernetes:分布式部署需K8s 1.20+
    • Python:3.8~3.12(pymilvus SDK支持)
    🐳 快速安装(Docker Standalone,生产推荐
    # 下载 docker-compose.yml(含 etcd + MinIO 依赖)
    wget https://github.com/milvus-io/milvus/releases/download/v2.5.13/milvus-standalone-docker-compose.yml -O docker-compose.yml
    
    # 启动 Milvus
    docker compose up -d
    
    # 验证(看到三个容器均为 healthy 即成功)
    docker compose ps

    🐍 Python SDK 安装(最常用
    # 标准安装(连接远程Milvus服务)
    pip install -U pymilvus
    
    # 包含 Milvus Lite(嵌入式,pip install即可运行,无需Docker)
    pip install "pymilvus[milvus-lite]"
    
    # 验证
    python -c "from pymilvus import MilvusClient; print('Milvus OK')"

    ☁️ 零配置托管(Zilliz Cloud)

    不想自建服务?试用 Zilliz Cloud,提供 Serverless(按量付费)、Dedicated(专属集群)、BYOC(自带云)三种模式,免费额度足够个人开发使用。与 AWS Bedrock、Azure OpenAI 深度集成。

    ✨ 核心功能

    ⚡ 十亿级高性能检索

    存储计算分离架构,支持 HNSW / IVF / SCANN / DiskANN 等全部主流索引。GPU 加速兼容 NVIDIA CAGRA,十亿级向量下毫秒级延迟,QPS 可达数万次/秒。在 官方性能基准中处于行业第一梯队。

    🔀 混合检索(稠密+稀疏向量)

    原生支持 BM25 全文检索和学习的稀疏嵌入(SPLADE、BGE-M3),同一集合可同时存储稠密和稀疏向量,自定义重排策略合并多路结果,RAG 召回率提升 30%+。这是 Milvus 相比其他向量数据库的显著优势。

    🏢 企业级多租户与安全

    支持数据库/集合/分区/分区键四级隔离,单集群可承载数百万租户。强制用户认证、TLS 加密、RBAC 细粒度权限控制,满足 SOC 2 合规要求。适合 SaaS 平台多客户场景。

    💾 冷热存储分离

    热数据存内存/SSD,冷数据自动归档至 S3/GCS,存储成本降低 10 倍。支持对象存储原生架构,无需额外 ETL 即可直接读取云存储中的向量数据。Collection 级别的 Fork(写时复制)功能,大幅提升实验迭代效率。

    🌐 多语言 SDK + 丰富 AI 生态集成

    官方 SDK 覆盖 Python(pymilvus)、Java、Go、Node.js、Restful API 五种语言。原生集成 LangChain、LlamaIndex、OpenAI、HuggingFace、AutoGPT 等主流 AI 框架,可作为 RAG 应用的即插即用向量存储。Attu 提供图形化管理界面,Prometheus/Grafana 支持监控告警。

    🏗️ 架构设计

    Milvus 采用存储与计算分离、无状态微服务的分布式架构,所有组件以容器化方式部署,可充分利用 Kubernetes 的调度和自愈能力。

    ┌───────────────────────────────────────────────┐
    │            API Service Layer                 │
    │    gRPC / REST / Python / Java / Go SDK   │
    └──────────────┬──────────────────────────────┘
                    │
    ┌───────────────▼──────────────────────────────┐
    │         Coordinator Service (元数据)            │
    │   Root Coord  │  Query Coord  │  Data Coord  │
    └────┬──────────┴─────────────┴──────────────┘
          │          │              │
          ▼          ▼              ▼
    ┌──────────┐┌──────────┐  ┌──────────┐
    │ Query    ││ Data     │  │ Index    │  ← 可独立扩缩容
    │ Node     ││ Node     │  │ Node     │
    │(读密集) ││(写密集) │  │(索引构建)│
    └───┬──────┘└───┬──────┘  └───┬──────┘
         │          │            │
    ┌─────▼──────────▼────────────▼─────────┐
    │      Object Storage (S3 / GCS / MinIO)  │
    │       + Hot Cache (内存 / SSD)           │
    └──────────────────────────────────────────┘

    所有协调服务支持多副本部署,单节点故障秒级恢复。存储与计算解耦,可按业务特征独立调整查询/写入容量。

    🎯 典型使用场景

    场景一:RAG(检索增强生成)应用

    将企业知识库文档向量化存入 Milvus,用户提问时检索最相关的 Top-K 片段,注入 LLM 上下文窗口,显著提升回答准确性并减少幻觉。混合检索(向量+全文)可进一步提升召回率。官方 RAG 教程 30分钟可跑通 Demo。

    场景二:多模态语义搜索引擎

    利用 CLIP 等多模态模型将图片、音频、视频转为向量存入 Milvus,实现”以文搜图”、”以图搜图”、”视频片段检索”等功能。支持动态字段存储原始元数据,检索结果可直接返回图片 URL 或视频时间戳。图像检索实战教程 可直接参考。

    场景三:实时推荐系统

    将用户行为特征和物品特征向量化后存入 Milvus,通过近似最近邻搜索实时找相似用户或相似物品,实现个性化推荐。支持流式数据实时更新,新用户行为可在秒级反映到推荐结果中。官方电影推荐系统教程 可直接参考。

    💡 推荐理由

    在向量数据库赛道中,Milvus 是最成熟、生产案例最多的开源选择之一。与 Chroma(轻量级,适合原型)和 Qdrant(Rust 性能优异)相比,Milvus 的独特优势在于:

    • 云原生分布式架构:K8s 原生支持,可独立扩展查询/数据/索引节点,真正适合生产环境大规模部署(Chroma 无分布式,Qdrant 分布式为企业版功能)
    • 混合检索能力:稠密+稀疏向量一体化,RAG 场景召回率显著优于单一向量检索(多数竞品仅支持稠密向量)
    • LF AI & Data 基金会托管:开源治理规范,Apache 2.0 永久开源,不会突然变更许可协议
    • Milvus Lite 零配置:pip install 即可运行嵌入式版本,本地开发、单元测试、CI/CD 均无需 Docker

    如果你正在构建 RAG 应用或语义搜索功能,Milvus 值得作为向量存储的首选方案进行评估。根据 官方性能基准,Milvus 在十亿级向量场景下的检索性能处于行业第一梯队。

    LF AI & Data 基金会托管 · Apache 2.0 开源协议 · Zilliz 主导开发

    最后更新:2026年6月25日 · 数据来源:GitHub API + milvus.io

  • 近400家地方报纸联名起诉OpenAI和微软:AI版权大战烧到地方媒体

    OpenAI和微软又被告了。这一次站出来的是将近400家地方报纸,他们6月24日在纽约南区联邦法院提交了诉状,指控这两家公司在未经许可、未支付任何报酬的情况下,爬取并复制了他们的新闻报道,用来训练ChatGPT和微软Copilot。

    地方报纸起诉AI公司
    地方报纸正在发起迄今规模最大的AI版权诉讼

    “连一分钱都没给过我们”

    诉状里的话说得很重。这些生成式AI产品”靠出版商的内容成为可能”,给被告带来了数十亿美元的市场价值,但”没有一分钱流向出版商”。原告方包括Richner Communications等多家报业集团,旗下总共运营着近400家地方和区域报纸。

    具体的指控包括:被告”系统性地、秘密地”爬取了这些出版商的网站,把文章、报道和其他原创作品复制到自己的服务器上,用来训练大语言模型,同时删除了作品里的版权管理信息,并且在用户提问时直接生成了这些内容。

    “除非开发AI产品的公司为其滥用出版商内容的行为负责,否则这场AI热潮将成为地方新闻业的丧钟。”
    ——原告出版商在诉状中陈述

    地方报纸请出了前新泽西总检察长

    这起诉讼的代理律所是Platkin LLP,创始人是前新泽西州总检察长Matthew Platkin(民主党)。Platkin在采访里说,这是迄今由地方和区域报纸牵头的最大规模法律行动。

    此前针对AI公司的版权诉讼——比如《纽约时报》的案子——虽然开了先河,但地方媒体一直没有被带到谈判桌上。Platkin说:”地方新闻是美国绝大多数人信任的新闻来源,是我们民主的命脉,但这个商业模式已经让地方新闻走到了灭绝的边缘。”

    他还提到了一个公平性问题:如果这场版权大战的最终结果只让最大的玩家受益,而那些今天还在兢兢业业报道本地新闻的人得不到任何补偿,”这是不公平的”。

    OpenAI的回应:”合理使用”

    OpenAI发言人在声明里说,他们的模型”赋能创新,基于公开数据训练,符合合理使用原则”。这是OpenAI在一连串版权诉讼中的标准回应。微软方面则没有立即回复置评请求。

    这起诉讼加入了针对AI公司的一波又一波版权诉讼大潮——CNN、《纽约时报》、Reddit、韦氏词典和大英百科全书等都已经分别起诉了Perplexity AI。而这起新诉讼的目标是直接指向了这个行业里最大的两个玩家:OpenAI和微软。


    地方报纸的困境是真实的。过去二十年,随着分类广告转到互联网、读者转到社交媒体,地方报纸的商业模式已经崩塌了大半。现在AI又来了——直接把他们的内容拿去,用来回答用户的提问,读者连点开原网站的动力都没有了。

    这起诉讼能不能赢,还得看法院怎么解释”合理使用”。但至少,地方报纸终于开始抱团跟最大的AI公司正面对抗了。

  • 都说AI要取代程序员,数据却显示工程师比谁都抢手

    AI到底有没有在抢程序员的饭碗?这场争论打了好几年,两边的人都能拿出一堆证据。裁员的公司说:用了AI,一个工程师能干过去三个人的活。但风投机构SignalFire刚出的一份报告,给了这个问题一个挺不一样的答案。

    AI与软件工程
    AI到底是在替代工程师,还是在让他们变得更高效?

    裁员理由写的是AI,但招人数据说的不是一回事

    SignalFire不是拍脑袋得出结论的。他们追踪了8000多万家公司的数亿名员工职业生涯数据,比那些靠调查问卷得出的结论要扎实得多。他们的发现是:2025年,工程岗位是所有职能里最抗打的。

    具体数字是这样——大型科技公司的总招聘量比2019年下降了25%,但工程岗位的降幅只有11%,远低于平均水平。更有意思的是,在SignalFire定义的”科技巨头”(Alphabet、Meta、Apple、Amazon、Microsoft、Netflix、Nvidia、Tesla、Uber、Airbnb、Block、Stripe)2025年的所有新员工里,工程师占了55%。2019年这个比例是46%。

    “很多公司裁员的理由一律写AI,尤其是说AI写代码厉害了,一个工程师能顶过去好几个。但我们在实际数据里看到的情况,跟这个说法不太一样。”
    ——Asher Bantock,SignalFire研究负责人

    早期创业公司的数据更说明问题。2025年,早期初创公司招的工程师数量比2019年还多了7%。如果AI真的在替代工程师,你不会看到这个趋势。

    Anthropic自己的人都不信”AI消灭就业”这个说法

    这事儿有点尴尬。Anthropic CEO Dario Amodei去年警告说,AI有可能在五年内消灭一半的入门级白领岗位,失业率冲到20%。但他自己公司负责经济学的研究主管Peter McCrory,今年3月跟TechCrunch说的情况完全不一样。

    McCrory说,他还没看到AI对就业市场有什么明显的实质影响。用Claude干活的那些人——技术写手、数据录入员、软件工程师——和那些不太被AI影响的工作相比,失业率”至少没有显著差异”。

    黄仁勋说得更直接。今年4月在斯坦福商学院的一场访谈里,有人问他怎么看”AI要消灭所有软件工程岗位”这个说法,他直接说反了。英伟达所有工程师现在都在用AI代理写代码,结果呢?”软件工程师比以前更忙了。”

    “代理写代码几乎是一瞬间的事,但它们一直在逼工程师想出’下一个想法’。”
    ——黄仁勋,Nvidia CEO

    Jevons悖论:效率越高,需求越大

    SignalFire的报告里提到了一个经济学概念——Jevons悖论。这个19世纪就有的理论说的是:蒸汽机效率越高,英国人烧的煤反而越多,因为用煤变得更划算了,需求就扩大了。

    AI写代码这事也是一样。工程师现在用AI辅助,产出效率翻了好几倍,按理说需要的人应该变少。但实际情况是:能做的事变多了,需求反而更大了。Bantock的说法很直白:”他们突然变得效率高了很多,但活是干不完的。”

    这个逻辑其实不难理解。AI降低了写代码的门槛,也让以前不敢想的项目变得可行了,结果就是更多想法等着被实现,而不是更少。


    5月份科技行业裁员创了近年单月新高,AI是头号背锅侠。但SignalFire的数据提醒了一个被忽略的角度:公司在裁员的同时,还在抢工程师。这两件事可以同时是真的——只是被裁掉的和被招进去的,可能不是同一批人。

  • 企业AI狂欢结束,Accenture们开始严控员工用AI的”零花钱”

    企业AI预算管控
    企业开始严控AI token支出(概念图)

    今年早些时候,AI行业还在鼓励每家公司的员工尽量多用AI,把token预算花到上限,甚至搞内部排行榜来激励大家——这个现象有个名字叫”tokenmaxxing”。但现在,风向变了。

    最新的信号来自Accenture。根据404 Media获得的内部会议录音,这家全球咨询巨头的agentic AI战略负责人Justice Kwak在会上说了一句话:”AI正在成为成本结构里不可忽视的一项,支出的可预测性越来越差,CFO、COO、CIO级别的人都在问,花的钱到底值不值。”

    从”多用AI”到”省着用”

    这个转折来得很快。就在不久之前,Accenture还在内部发话,说不用AI的员工”会失去晋升机会”。现在同样这家公司,却在想办法阻止员工把token预算花光——比如用AI把PDF转成PPT这种琐碎任务,在Accenture内部已经被点名了。

    这背后的逻辑其实很朴素:token不是免费的,而且价格不便宜。一家有几万名员工的公司,如果每个人每天用AI助手处理几十条请求,一个月下来账单可以很吓人。更关键的是,很多这样的用法并没有产生对应的商业价值。

    “我们正处在一个拐点,AI正在成为成本结构中实质性的存在。支出变得非常不可预测,领导层——尤其是CFO、COO和CIO级别——仍在问一个问题:我们从AI上花的钱,到底得到了什么价值?”
    ——Justice Kwak,Accenture agentic AI战略负责人

    不只是Accenture

    Accenture不是唯一一个开始”token配给”的公司。根据The Information的报道,Meta也在采取措施限制员工使用AI工具,原因是AI成本已经达到了数十亿美元的规模。

    Amazon之前也干过类似的事——他们曾经搞过一个”tokenmaxxing排行榜”,鼓励开发者尽量多用AI工具,后来因为成本失控,这个排行榜被悄无声息地撤掉了。

    这种现象背后是一个更深层的问题:企业到底该怎么衡量AI的ROI?员工用AI确实可能提高了效率,但这个效率提升能不能覆盖AI使用的成本,很多时候是一笔糊涂账。


    token经济的泡沫信号

    企业开始严控AI支出,这个时间节点值得注意。就在这几天,资本市场出现了一波”AI抛售”——memory芯片制造商的股价受到了明显冲击。投资者正在重新评估AI公司的盈利模型,光有”增长”和”兴奋感”已经不够了。

    从企业端来看,token成本的疑问正在动摇整个AI商业模式的根基。如果连Accenture这种最积极拥抱AI的公司都在问”值不值”,那说明这个行业已经从”跑马圈地”进入了”算账”阶段。

    对员工来说,这也意味着”AI技能”的含金量正在重新定义。会用AI不等于能产生价值,能证明AI使用带来实际产出的人,才会在新一轮的”AI绩效考核”里站得住脚。

    这场从”tokenmaxxing”到”token rationing”的转变,或许是企业AI应用成熟化的必经之路。狂欢结束之后,才是真正考验的开始。

  • OpenAI拿出第一块自己的AI芯片,代工的是Broadcom

    OpenAI Jalapeño AI芯片
    OpenAI首款定制AI推理芯片Jalapeño(概念图)

    昨天OpenAI办了个小仪式,Broadcom的CEO Hock Tan亲自把第一块Jalapeño芯片交到了Sam Altman和Greg Brockman手里。这块芯片的全名很长——OpenAI Intelligence Processor,代号Jalapeño——是OpenAI第一次真正拥有自己名字的定制AI推理处理器。

    这件事的意义不只是”OpenAI做了块芯片”这么简单。它意味着这家公司正在把掌控权从Nvidia手里往自己这边挪一步。

    为什么是现在

    OpenAI和Broadcom的合作关系去年10月就公布了,但芯片真正亮相还是这两天的事。根据OpenAI官方的说法,从设计到送厂制造(tape-out),整个过程只用了9个月。他们说自己用AI模型辅助了芯片设计,所以才能跑这么快。

    如果这个数字属实,这确实是高性能半导体行业里最快的ASIC开发周期之一。通常这种级别的芯片从设计到出炉要走两三年,OpenAI说自己9个月搞定了,里面有它自己模型的功劳——用AI设计AI芯片,这个逻辑闭环很有意思。

    Jalapeño不是一块通用加速卡,它是从零开始为大型语言模型推理设计的。用OpenAI硬件项目负责人Richard Ho的话说:”我们围绕对前沿AI模型推理需求的理解,从头优化了架构。”

    它到底强在哪里

    OpenAI目前给出的最核心数据是:性能功耗比(performance per watt)大幅优于当前业界最先进水平。具体好多少,他们说要等几个月后的技术报告才会披露。

    目前Jalapeño的工程样品已经在实验室里跑起来了,生产目标频率和功耗都达标,跑的负载包括GPT-5.3-Codex-Spark。这块芯片的设计思路是减少数据搬运(data movement),同时把计算、内存和网络资源平衡好,让实际利用率尽量接近理论峰值。

    专门做推理,不是训练。这个定位很清晰——预训练这种最吃算力的任务短期内还是会跑在Nvidia的GPU上,但推理侧的成本优化空间巨大,哪怕只省个10-20%,对OpenAI这种规模的运营来说都是真金白银。

    全栈叙事

    OpenAI在这波宣传里反复强调的一个词是”full stack”——全栈。他们的逻辑是:不光做模型,不光做产品,现在连芯片架构、内核、内存系统、网络、调度、部署系统全部自己设计,每一层都围绕同一个目标优化:让模型更快、更可靠、更便宜。

    这个叙事其实和Google的TPU、Amazon的Trainium是一个路子。这些公司都发现,与其完全依赖Nvidia,不如自己掌握一部分算力供应链。区别在于,OpenAI是纯软件公司起家,现在往硬件走,这个跨越比Google和Amazon都要大。


    接下来怎么铺

    Jalapeño只是第一代。OpenAI和Broadcom签的是multi-generation路线图,计划从2026年底开始部署到吉瓦级(gigawatt scale)的数据中心,合作方包括Microsoft和其他伙伴。

    Broadcom的CEO Hock Tan在声明里说:”这只是多代路线图的第一步。通过和OpenAI直接联合开发我们的领先硅片,我们能让吉瓦级数据中心从2026年开始部署。”

    吉瓦级是个什么概念?大概是一个中等城市的总用电功率。把AI数据中心做到这个规模,算力供给确实是个核心瓶颈,这也是为什么OpenAI要自己下场做芯片。

    这块芯片目前还在测试阶段,离大规模部署还有段时间。但它传递的信号很明确:OpenAI不想在算力这件事上完全被人卡脖子,哪怕这个”人”是Nvidia。

  • 做AI写作工具的Superhuman,把AI检测工具GPTZero买了

    做AI写作工具的Superhuman,把AI检测工具GPTZero买了

    AI写作和AI检测,本来像是矛和盾的关系,现在被同一家公司握在手里了。

    Superhuman收购GPTZero
    Superhuman收购AI内容检测平台GPTZero

    Superhuman(就是那个改名前的Grammarly)宣布收购GPTZero——一个专门检测AI生成内容的工具。GPTZero能做的事包括:判断一段文字是不是AI写的、检测AI幻觉(就是模型瞎编的内容)、查抄袭。

    集成到Superhuman Go

    收购之后,GPTZero会集成到Superhuman Go里。这个AI助手号称能在”100万个应用和网站”里工作,以后用户在写东西的时候,就能同时用到写作辅助和内容真实性验证两套能力。

    Superhuman的说法是,他们要做”内容真实性”的两端:一边帮用户负责任地用AI写作,一边帮用户判断读到的内容是不是AI生成的。

    教师市场仍是重点

    这个组合确实有点意思。GPTZero之前最有名的用户群体是教师——老师们用它来检测学生作业是不是用ChatGPT写的。Superhuman收购后表示,教育市场仍然是重点,会把GPTZero的工具直接嵌到用户已经在用的写作场景里。

    当然,这事在外人看来有点矛盾:你一边卖AI写作工具,一边卖AI检测工具,这不是自己打自己吗?但Superhuman的逻辑是,用户既需要AI帮助写作,也需要知道哪些内容是AI生成的——两个需求同时存在,不如都攥在自己手里。

    收购金额没披露。GPTZero会继续以独立品牌运营,Superhuman方面表示不会把它完全吞掉,而是让它继续服务已有的用户群。


  • 白宫想要审查Meta的AI模型,扎克伯格还在犹豫

    白宫想要审查Meta的AI模型,扎克伯格还在犹豫

    就在各家公司争相把AI模型开放给美国政府审查的时候,Meta选了最后一个当”钉子户”。

    Meta拒绝美国政府AI审查
    白宫与Meta在AI审查问题上的博弈

    《纽约时报》的报道说,白宫官员正在向Meta施压,要求它把AI模型提交给”AI标准与创新中心”(CAISI)做安全评估。OpenAI、Anthropic、Google、xAI、微软早就签了协议,只有Meta还没松口。

    行政令背后的推力

    这事可不是突然冒出来的。6月2日,特朗普签了一份行政令,要求前沿AI模型在公开发布前,给联邦专家最多30天的时间做审查。政府这边要在7月底前把正式评审流程搭好,但其他公司实际上已经交了几个月的作业了。

    CAISI这个单位是专门找软件漏洞、防网络攻击、阻止军事滥用的。政府现在最想看的,包括Meta今年4月刚发布的Muse Spark模型——这个模型还带了个专门的推理模式,用来处理复杂问题。

    Meta发言人的回应很外交辞令:”我们在研究具体细节,希望很快能签协议。”翻译过来就是:还在谈,别催。

    开源路线与政府审查的张力

    这事背后的张力挺有意思。Meta一直以来打的都是开源牌,跟OpenAI、Google那种把模型锁在服务器里的思路完全相反。现在政府说要提前审查,等于是要Meta把”开源”的节奏交给华盛顿来把关。

    几周前,政府刚命令Anthropic暂停Mythos 5对非美国公民的访问,理由是”国家安全关切”。这个信号发出去之后,剩下的公司基本都乖乖交卷了,只剩Meta还在扛。

    Meta到底会不会最终签字,还是个未知数。从它过去几年跟监管打交道的方式来看,拖字诀是常用手法——能拖就拖,拖到对自己最有利的时点为止。


  • deer-flow:ByteDance 开源超级智能体框架,74K+ Stars 让 AI 处理小时级复杂任务

    deer-flow:ByteDance 开源超级智能体框架,74K+ Stars 让 AI 处理小时级复杂任务

    2026年2月,ByteDance(科技公司)开源了其内部打磨多时的超级智能体框架 deer-flow 2.0,发布当天即登顶 GitHub Trending 榜首,目前已收获 74,000+ Stars。这不仅仅是一个”AI聊天机器人”,而是一个能够处理分钟级到小时级复杂任务的长周期智能体框架——从深度研究、代码编写,到内容创作、幻灯片制作,deer-flow 都能自主规划并执行。

    🦌 项目简介

    deer-flow(鹿流)是 ByteDance 开源的长周期超级智能体框架(Super Agent Harness),由初代 Deep Research 框架完全重构而来。它支持研究、编码、内容创作等复杂任务,通过沙箱隔离、持久化记忆、工具调用、子智能体协作等能力,处理从几分钟到数小时的各类任务。2.0 版本为完全重构版本,架构更清晰、扩展性更强。

    deer-flow GitHub OpenGraph 图片
    deer-flow 2.0 – ByteDance 开源超级智能体框架

    🛠 安装要求和过程

    环境要求

    • Python:3.12+(推荐使用 uv 管理依赖)
    • Node.js:22+(前端界面需要)
    • pnpm:前端包管理工具
    • Docker:推荐部署方式(可选,用于沙箱隔离)
    • 操作系统:macOS / Linux / Windows(WSL2)

    快速安装(3分钟上手)

    # 1. 克隆仓库
    git clone https://github.com/bytedance/deer-flow.git
    cd deer-flow
    
    # 2. 运行交互式配置向导(2分钟完成,生成 config.yaml 和 .env)
    make setup
    
    # 3. 安装依赖(本地开发模式)
    make install
    
    # 4. 启动本地服务
    make dev
    # 访问地址:http://localhost:2026
    

    配置向导会引导你设置 LLM 提供商(支持 OpenAI / DeepSeek / MiniMax / Qwen / 本地 vLLM 等)、网页搜索提供商(Tavily / Brave / Exa 等),无需手动编辑配置文件。配置完成后可随时运行 make doctor 验证配置是否正确。

    Docker 部署(推荐生产环境)

    # 开发模式(支持热重载)
    make docker-init    # 仅首次或沙箱镜像更新时运行
    make docker-start   # 启动服务
    
    # 生产模式
    make up             # 构建镜像并启动所有生产服务
    make down            # 停止并删除容器
    

    🎯 核心功能

    • 🧠 子智能体调度:主智能体可按需创建子智能体,每个子智能体拥有独立上下文、工具和终止条件;子智能体支持并行执行,执行结果结构化返回,主智能体最终汇总输出。长任务可拆分为多个子步骤,支持分钟到小时级别的复杂任务处理。
    • 📦 沙箱与文件系统隔离:每个任务拥有独立执行环境,支持文件读写、编辑、图像查看;支持多种沙箱模式:本地执行、Docker 隔离容器执行、Kubernetes Pod 执行。沙箱内文件路径 /mnt/user-data/ 下包含 uploads/(用户上传文件)、workspace/(智能体工作目录)、outputs/(最终交付物)。
    • 🧩 技能与工具扩展:内置研究、报告生成、幻灯片制作、网页生成、图像/视频生成等开箱即用技能;支持自定义技能、MCP 服务器扩展、Python 函数自定义工具;技能按需加载,避免上下文窗口过度占用;支持通过 /skill-name 前缀手动激活单轮技能。
    • 💾 长期记忆:跨会话持久化存储用户偏好、技术栈、常用工作流等信息;自动跳过重复记忆条目,避免记忆无限膨胀;记忆本地存储,用户完全可控。让智能体”记得”你之前的项目背景和编码习惯。
    • 🔌 IM 渠道集成:支持接入 Telegram、Slack、飞书、企业微信、钉钉、微信等 IM 渠道,无需公网 IP 即可接收任务。在聊天工具中直接使用 /new/status/models/memory 等命令管理对话和智能体。
    • 📊 可观测性:内置 LangSmith、Langfuse 可观测性集成,支持全链路 LLM 调用、智能体运行、工具执行追踪。生产和调试时都能清晰了解智能体的决策过程。

    💡 典型使用场景

    场景一:深度研究报告自动生成

    输入”研究 Transformer 架构的演进历程,输出一份 5000 字的技术报告,包含关键论文引用和架构对比图”,deer-flow 会自动规划研究步骤:搜索相关资料 → 阅读并提取关键信息 → 对比不同架构差异 → 生成结构化报告 → 输出为 PDF/Markdown。整个过程无需人工干预,耗时约 10-30 分钟。

    场景二:代码项目从零搭建

    输入”帮我搭建一个基于 FastAPI + Redis 的短链接服务,包含单元测试和 Docker 部署配置”,deer-flow 会创建子智能体分别处理:API 路由设计、Redis 缓存逻辑、测试用例编写、Dockerfile 生成。最终在 outputs/ 目录下产出完整项目代码,可直接运行。

    场景三:内容创作与多语言本地化

    deer-flow 内置内容创作技能,支持文章撰写、幻灯片制作、网页生成。结合 IM 渠道集成,可以将已有视频/文章自动翻译为多种语言并生成配音版本,实现内容的多语言分发。适合自媒体运营者和内容创作者使用。

    🌟 推荐理由

    deer-flow 2.0 是目前开源超级智能体框架中最接近”生产可用”的项目之一。与 LangChain、CrewAI 等框架相比,deer-flow 的最大特点是长周期任务处理能力——通过子智能体调度和上下文管理,它可以处理耗时数小时的复杂任务而不超出上下文窗口。这是很多同类框架做不到的。

    几个让我印象深刻的细节:

  • 上下文工程做得很到位:子智能体上下文隔离 + 自动摘要已完成子任务 + 中间结果卸载到文件系统,这套组合拳让长任务不 OOM。如果你用过其他框架处理长任务,就知道这个有多重要。
  • 沙箱设计务实:支持本地 / Docker / K8s 三种沙箱模式,开发时可以用本地模式快速迭代,生产时切到 Docker 隔离。不用一上来就搞复杂的 K8s 部署。
  • ByteDance 背书:这不是个人业余项目,是 ByteDance 内部打磨后开源的框架,2.0 版本完全重构,代码质量和文档都相当不错。74K+ stars 和 GitHub Trending 第一也证明了社区认可度。
  • IM 渠道集成很实用:无需公网 IP 就能通过飞书/企微接收任务,对国内用户非常友好。想象一下在企业微信群里 @ 一下你的 AI 智能体,它就去后台帮你跑一个深度研究任务,完成后通知你——这个体验很丝滑。

当然也有一些注意事项:项目默认设计为本地可信环境部署,不可信环境需要额外配置认证网关;生产环境扩容需要通过提升单 worker 资源配置或拆分数据库、沙箱到独立节点实现,不能直接增加 worker 数量。部署前建议仔细阅读安全文档。

📦 下载地址

  • GitHubhttps://github.com/bytedance/deer-flow(74K+ Stars,2.3K+ Commits)
  • 官方网站https://deerflow.tech(在线体验 + 完整文档)
  • 文档中心https://deerflow.tech/docs(支持英文、中文、日文、法文、俄文)
  • 在线体验https://deerflow.tech/playground(无需安装,直接试用)
  • License:MIT License(商业友好,可自由修改和分发)
  • 支持的 LLM:OpenAI / DeepSeek / MiniMax / Qwen / 本地 vLLM / 豆包 Doubao(推荐 Seed-2.0-Code)等
  • 如果你正在寻找一个能处理复杂长任务的 AI 智能体框架,或者想了解 ByteDance 级别的工程团队是如何设计超级智能体的,deer-flow 绝对值得深入研究。74K+ 社区星标不会骗你。