博客

  • OpenAI Codex周活冲到500万,这次不打算只给程序员用了

    OpenAI本周公布了一个数字:Codex每周活跃用户已经到了500万。这个数字比大多数人预期的要快,而这个工具的定位,也已经不再只是程序员的专属了。

    从编程工具到通用生产力工具

    Codex刚出来的时候,大家都觉得这就是个AI写代码的东西,程序员用用就算了。但OpenAI现在的说法很明确:Codex要覆盖的是所有跟信息和知识打交道的人,而不只是写代码的人。

    这个定位转变其实挺聪明的。写代码的人就那么多,但每天要处理文档、整理数据、搭建内部工具的知识工作者,数量是程序员的好几倍。Codex如果能让他们不用学编程也能”指挥”AI干活,这个市场就大得多了。

    Codex现在的能力已经超出ChatGPT的范畴——它可以构建可交互的托管网站和应用,还能根据新数据自动更新。

    新功能到底有什么用

    这次跟着500万用户数字一起公布的,还有几个实在的功能更新。最值得关注的是新的预览版本,企业客户现在已经可以用上了。

    • 支持构建可交互的托管网站和应用——不只是生成代码,而是直接跑起来
    • 支持用新数据持续更新生成的内容,不用每次都重新生成
    • 新插件生态上线,第三方工具可以接入Codex的工作流
    • 企业版支持更细粒度的权限和数据隔离控制

    有意思的是这次发布的时机。正好微软在办Build 2026大会,微软和OpenAI这种”亲密友敌”的关系,在AI圈已经不是秘密了。两边都在推自己的AI编程工具,但底层又深度合作,这种竞合关系估计还会持续很久。

    500万周活意味着什么

    500万周活,放在消费级AI产品里不算特别夸张,但Codex的用户价值密度很高。用Codex的人,通常是真的在用它干活,而不是随便玩玩。这个留存率和付费转化,应该比ChatGPT的普通用户要好不少。

    OpenAI这次强调”不只是给程序员用的”,某种程度上也是在为Codex的商业化铺路。程序员市场天花板太低,只有打进更广的知识工作者市场,这个产品才撑得起OpenAI的估值预期。

    OpenAI Codex generated document
    Codex为虚构的Blossom Widgets企业峰会生成的活动文档(图片来源:The Verge)
  • 特朗普签了份AI行政令:模型发布前可自愿接受政府审查

    美国总统特朗普本周二签了一份行政令,要求AI公司在模型正式发布前,可以自愿把模型提交给联邦政府审查。说自愿,是因为企业可以自己决定交不交,但一旦交了,政府会评估模型的高级网络能力,企业这边也能拿到相应的保密保护。

    之前说不监管,现在为什么改主意了

    特朗普对AI监管的态度转变挺有意思。他之前一直主张不让监管扼杀创新,甚至一度推迟签署AI相关行政令,理由是怕影响美国跟中国的AI竞争。结果这次的行政令写得挺明确:AI的新能力确实伴随安全风险,政府不能装看不见。

    触发这次转向的直接原因,很可能是Anthropic在今年4月有限度发布的Mythos模型。Anthropic自己说,这个模型发现了数千个高危漏洞,主流操作系统和网页浏览器全都中招。这话一出,华盛顿那边坐不住了。

    Anthropic的Mythos模型在测试中发现:所有主流操作系统和网页浏览器都存在高危漏洞——这话是Anthropic自己说的,不是政府说的。

    更有意思的是,Anthropic之前跟五角大楼因为AI用于自主致命武器和大规模监控的问题闹过法律纠纷。这次Mythos一发布,双方关系反而出现了缓和迹象。有时候,一个技术演示比十轮谈判都管用。

    行政令到底说了什么

    • 企业可以自愿提交模型,提交后最多30天内完成审查
    • 审查聚焦模型的高级网络能力,不是全面安全审计
    • 提交企业获得保密保护,政府不会随意公开模型细节
    • 联邦政府同步强化针对AI攻击的网络防御,重点保护关键基础设施
    • 行政令明确:这不是强制许可,也不是发布前审批

    这份行政令其实有个前传。去年5月,谷歌、微软、xAI就同意让美国商务部下属的AI标准与创新中心(CAISI)在模型发布前做审查。OpenAI和Anthropic更早,2024年拜登还在任的时候就签了类似协议。所以特朗普这次,某种程度上是把拜登时期的实际做法给正式化了,只是换了个”自愿”的名义。

    行业买账吗

    出乎意料的是,这份行政令居然获得了AI安全倡导团体的认可。美国负责任创新组织的主席布拉德·卡森发表声明说,”白宫正式接受了Mythos传递的信号”。安全AI联盟的CEO也表示,很高兴看到特朗普政府认真对待模型风险。

    但这帮人并不满足于自愿框架。他们还在敦促国会立法,把这些保护措施变成强制要求。自愿这个东西,换了届政府就可能不自愿了,他们心里清楚。

    Trump AI executive order signing
    特朗普签署AI行政令(图片来源:The Verge)
  • 谷歌推出AI反诈骗功能,深度伪造冒充通话将被标记

    诈骗这事儿,手段一直在升级。现在越来越多的人不接陌生号码了,诈骗者就开始用AI深度伪造声音——假装是你妈、你老板、或者某个权威人士,让你放松警惕。

    Google看不下去了。6月2日,它宣布给Android系统推送一项新功能:虚假通话检测(Fake Call Detection),专门对付这类AI仿声诈骗。

    它怎么工作的

    说起来挺巧妙的,本质上是一场”设备间的数字握手”。条件很简单:你的通讯录联系人给你打电话,而且双方都在用Google Phone应用。

    “如果诈骗者试图冒充你的可信联系人,初始验证信号就会缺失。你的设备会立即察觉这一点,同时向联系人的真实设备发送二次验证请求。”——Google官方博客

    具体来说:对方的手机会向你的设备发一个无声的验证信号,确认这通电话确实来自对方的手机。如果验证失败,你的屏幕上会弹出警告,建议你立刻挂断。

    Google Fake Call Detection 功能示意图
    Google 虚假通话检测功能工作原理(图源:TechCrunch)

    基于RCS,其他应用也能用

    这项技术基于富通信服务(RCS)打造。Google表示,其他应用和公司也可以接入这项技术——意味着它不只是Google Phone的独家功能,有可能成为Android生态的通用标准。


    同期还推了什么

    • Google Photos衣橱功能:支持虚拟试穿,自动识别你照片库里的衣物,美国、印度、巴西的Android 10+用户下周可体验
    • Google Play Books”Catch me up”:快速回顾上次读到的剧情,还能高亮段落直接提问
    • Circle to Search升级:现在一键搜索整套穿搭的所有单品,不用逐个搜了

    虚假通话检测功能本月就会推送到全球所有运行Android 12及以上版本的设备,首先覆盖Pixel机型。不用手动开,默认就是启用的。

  • 微软悄悄上线Scout,把OpenClaw那套个人AI助理搬进了Microsoft 365

    2026年初,一个叫OpenClaw的项目像野火一样在AI圈烧起来。技术人员第一次体验到了”不受约束的AI代理”是什么感觉——爽,但也挺吓人的。项目创始人后来被OpenAI挖走,OpenClaw的势头放缓了,但它留下的念头没消失。

    微软看进去了。6月2日,它悄悄上线了一款叫Scout的产品——本质上就是把OpenClaw那套理念,搬进了Microsoft 365的生态里。

    它到底是什么

    Scout是一个”始终在线”的个人AI助理,基于OpenClaw框架构建。你可以给它起名字(演示里叫”Sebastian”),它会记住你的工作习惯,随时间变得更懂你。

    “我们每个人的工作方式都有独特的习惯。大家正在把这些模式整理成持久保存在代理中的记忆和技能。之后代理就会变得更有能力,更了解你。”——Scout副总裁 Omar Shahine

    它跑在云端,但可以跨桌面和浏览器操作,连你的邮箱、日历、Microsoft 365里的其他系统都能碰。

    Microsoft Scout AI助理概念图
    Scout 将 OpenClaw 的灵活能力引入 Microsoft 365 生态(图源:TechCrunch)

    安全是重点

    OpenClaw今年早些时候出过事——有报道称一个代理在研究人员收件箱里出现了异常操作。Scout内置了”策略合规系统”,每次行为检查都会生成审计轨迹,防止代理失控。


    怎么用,多少钱

    • 通过微软 Frontier 早期体验计划开放,需要订阅 GitHub Copilot
    • 预装日程管理、会议议程起草等技能
    • 支持用户自己开发定制技能——这才是它真正值钱的地方

    这套”用得越多越难离开”的逻辑,就是消费级AI工具的核心留存密码。你在助理身上投入的训练越多,换掉它的成本就越高。

  • OpenAI给Codex加了六双”职业手套”,白领工作被AI盯上了

    OpenAI正在认真追逐企业用户。6月2日,这家AI实验室发布了Codex的一套新能力,目标很明确:把这款AI工具从程序员圈子扩展到更广阔的白领职场。

    跟新工具一起发布的,还有一份OpenAI内部报告,揭示了Codex在知识工作中的真实使用情况——结论超出很多人预期:它的用武之地,早就超出了软件工程。

    OpenAI Codex
    Codex正在从一款开发者工具转向知识工作者的日常助手(图:NurPhoto / Getty Images)

    500万周活用户,知识工作者增速是开发者的3倍

    报告里的数据值得细看:Codex目前每周活跃用户已经超过500万,自今年2月桌面应用上线以来增长了6倍以上。开发者仍然是最多的用户群体,但知识工作者已经占到用户总量的20%,而且增速是开发者群体的3倍还多。

    这意味着什么?意味着”AI写代码”这个故事已经不够用了。数据分析师、产品经理、设计师、金融分析师——这些人正在成为Codex增长最快的新用户群。

    “Codex现在有超过500万周活跃用户,自2月桌面应用上线以来增长了6倍以上。知识工作者已占用户总量的20%,增速是开发者群体的3倍以上。”

    六款岗位插件,开箱即用

    这次更新的重头戏是六款定向插件,分别对应六个白领岗位:数据分析、创意制作、销售、产品设计、股权投资、投资银行。用户可以在Codex应用内直接调用这些插件,每个插件都打包了对应岗位的集成工具、操作指引和场景上下文,让Codex能够模拟对应岗位的工作能力。

    打个比方,以前你让Codex”帮我分析这份数据”,它得靠你描述清楚背景。现在选了”数据分析”插件,Codex自带了数据分析师常用的工具链和思维框架,输出的东西更贴近一个真实数据分析师会给出的结果。

    当然,跟所有AI工具一样,这些插件的效果会随着自定义调整而提升,但OpenAI的意思是——开箱就能用,不需要太多配置。

    顺手把”Sites”功能也做了

    这次更新还有一个挺实用的功能叫”Sites”:Codex现在可以把工作成果直接输出成一个可访问的互动网站,而不是只生成本地文件。OpenAI已经拉了一串合作伙伴进来做这件事:Wix、Base44、Replit、Lovable、Figma、Emergent。后续还会扩大合作生态。

    另外还有一个”Annotations(标注)”功能,让你可以在Codex里框选文档或文件的特定部分,然后针对那一块发指令,上下文操作更精准。

    OpenAI在企业市场是个”后来者”

    这件事的背景挺有意思。Anthropic早在今年2月就推出了企业智能体项目,5月还上线了更聚焦金融场景的智能体。OpenAI此前一直更侧重C端用户,直到3月才为Codex引入插件支持。这次的动作,明显是在追赶Anthropic的企业服务布局。

    三周前,OpenAI刚推出了面向企业客户的合资公司”OpenAI Deployment Company”,拿到了全球投资机构超过40亿美元的融资,目标就是把OpenAI的工具更深地嵌到全球企业的业务流程里。首席营收官Denise Dresser的说法是:”AI已经能够在组织内部完成越来越有价值的工作,现在的挑战是帮助企业将这些系统整合到支撑业务的基础设施和流程中。”


  • 亚马逊Ring门铃把路人脸偷偷存了,集体诉讼把亚马逊告上法庭

    亚马逊的Ring门铃最近摊上大事了。一位弗吉尼亚州的居民Charles Sigwalt在西雅图联邦法院提起集体诉讼,指控Ring的”熟悉面孔”(Familiar Faces)功能在路人完全不知情的情况下,用AI识别并存储了他们的面部数据。

    这个功能去年9月就宣布了,当时电子前沿基金会(EFF)和马萨诸塞州参议员Ed Markey就跳出来反对。但亚马逊还是去年12月硬着头皮把功能上线了。

    Ring门铃摄像头
    Ring门铃的摄像头覆盖着无数美国家庭的门口(图:Getty Images)

    功能本身没大问题,问题出在”被识别的人”没有选择权

    “熟悉面孔”的逻辑其实挺直观——Ring用户开启之后,门铃能识别出经常出现在门口的人,然后推送更精准的通知,比如”爸爸在门口”,而不是泛泛地说”有人在门口”。

    问题在哪?开启功能是Ring用户的主动选择,但那些每天路过这些门铃的路人——邮递员、邻居、散步的陌生人——对此完全不知情,也没有任何方式可以”选择退出”。诉讼文件里的说法很直接:”数百万美国人在不知情的情况下,被Ring摄像头采集了面部识别信息。”

    Ring用户需要主动开启这个功能,但路过的非用户完全无法得知自己被采集了面部信息,也无法选择退出。这个不对称的信息关系,是整起集体诉讼的核心。

    Ring的隐私黑历史不止这一桩

    亚马逊对这起诉讼暂时没有回应。但在功能上线时,公司曾表示面部数据是加密存储的,不会对外共享,未识别的面孔会在30天后自动删除。

    问题是,Ring在用户隐私这件事上,口碑一直不怎么样。2023年,亚马逊跟美国联邦贸易委员会(FTC)和解,赔了580万美元,原因是Ring的员工和承包商可以随意查看女性用户的私人视频——FTC的说法更狠:当时每个员工都能访问所有客户的视频,完全不需要什么业务理由。

    还有一件事,Ring跟执法部门的关系一直很暧昧,曾经允许警察在无搜查令的情况下向用户索要录像。这个权限后来在2024年1月取消了。今年超级碗期间,Ring推了一个用AI找走失宠物的功能”Search Party”,也引发了类似的隐私争议,随后Ring取消了跟监控公司Flock Safety的合作——这家公司被曝向ICE等联邦机构提供监控录像。


  • Tabby:32K Stars!开源自托管AI编程助手,让代码补全完全私有化

    Tabby:32K Stars!开源自托管AI编程助手,让代码补全完全私有化

    Tabby – 开源自托管AI编程助手

    🚀 项目简介

    Tabby 是一款完全开源、可自托管的AI编程助手,是 GitHub Copilot 的完美替代品。支持团队在本地或私有服务器上运行属于自己的代码补全引擎,100% 保障代码隐私安全。

    32K+
    GitHub Stars
    100%
    开源免费
    多IDE
    全面支持

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.8+ 或 Docker 环境
    • CPU版:4GB RAM(StarCoder-1B)
    • GPU版:16GB RAM + NVIDIA GPU(推荐)
    • 支持 Windows / macOS / Linux

    快速安装(Docker方式 – 官方推荐)

    # CPU版本
    mkdir -p ~/tabby/data
    docker run -it \
      --gpus all \
      -p 8080:8080 \
      -v $HOME/tabby/data:/data \
      -e TABBY_MODEL_REGISTRY=/data \
      tabbyml/tabby \
      serve --model StarCoder-1B --device cpu
    
    # GPU加速版本(需NVIDIA Container Toolkit)
    docker run -it \
      --gpus all \
      -p 8080:8080 \
      -v $HOME/tabby/data:/data \
      tabbyml/tabby \
      serve --model StarCoder-1B --device cuda

    本地直接安装

    # 通过Cargo安装(需Rust环境)
    cargo install tabby
    
    # 或直接下载预编译二进制
    # 从 GitHub Releases 下载对应平台版本
    tabby serve --model StarCoder-1B --device cpu

    IDE插件安装

    • VS Code:扩展市场搜索 “Tabby” 安装
    • JetBrains:IntelliJ IDEA / PyCharm / WebStorm 等在 Settings → Plugins 搜索 “Tabby”

    ✨ 核心功能

    🔐 完全自托管,代码100%隐私
    所有代码补全请求在本地或私有服务器完成,代码绝不离开你的基础设施,彻底解决代码泄露风险。
    🤖 多模型兼容
    支持 StarCoder、CodeLlama、DeepSeek Coder、CodeGen 等主流开源代码大模型,可按需选择和切换。
    ⚡ 全链路性能优化
    IDE插件端通过自适应缓存策略实现精准流式输出,补全响应速度小于1秒;模型服务侧解析代码为Tree Sitter标签,生成更有效提示词。
    🛠️ 支持离线使用与自定义训练
    模型下载完成后无需网络连接即可运行;支持基于自有代码库对模型进行微调,适配团队专属代码风格。
    🌍 多语言支持
    覆盖 Python、JavaScript/TypeScript、Java、Go、Rust、C++、Ruby、PHP 等主流开发语言。

    🎯 典型使用场景

    场景一:企业私有化部署AI编程助手

    对代码安全性要求高的企业/团队,可通过Tabby在私有服务器或Kubernetes集群上部署AI代码补全服务,让团队成员享受AI编程效率提升的同时,确保核心代码资产不泄露到第三方云服务。

    场景二:个人开发者本地AI编程

    个人开发者可在本地机器上运行Tabby,使用StarCoder-3B等中等规模模型,在CPU上流畅运行,享受免费、私密、低延迟的代码补全体验,完全替代付费的GitHub Copilot订阅。

    场景三:基于自有代码库训练专属模型

    团队可将自有代码库用于微调Tabby背后的代码大模型,使AI补全建议更贴合团队编码风格和业务逻辑,有效提升代码生成的相关性和准确性。

    💡 推荐理由

    作为一款开源AI编程助手,Tabby最打动我的是它对「代码隐私」的极致重视。在AI编程助手遍地开花的今天,大多数方案都要求你把代码发送到第三方云服务,而Tabby让一切都在你的掌控之中。

    它的部署灵活性也令人印象深刻——从轻量的CPU模式到高性能的GPU加速,从单机部署到Kubernetes集群,从个人使用到企业级权限管理,Tabby都能很好适配。加上它对多种开源代码模型的良好支持,你可以根据硬件条件和补全质量需求灵活选择。

    如果你在意代码安全、希望摆脱SaaS订阅费用、或者想深入了解AI编程助手的工作原理,Tabby绝对值得一试。这也是它能在GitHub上获得32K+ Stars、成为Copilot最佳开源替代品的原因。

    📊 支持模型与配置参考

    模型名称 参数规模 推荐配置 补全质量
    StarCoder-1B 1B 4GB RAM,CPU运行 基础
    StarCoder-3B 3B 8GB RAM,CPU运行 良好
    CodeLlama-7B 7B 16GB RAM,GPU运行 优秀
    DeepSeek-Coder-6.7B 6.7B 16GB RAM,GPU运行 优秀
    StarCoder-15B 15B 32GB RAM,GPU运行 最佳

    官方推荐大多数普通开发者选择 StarCoder-3B,在CPU上也可流畅运行,补全质量均衡。

    📥 下载地址

    🔥 对AI开源项目感兴趣?欢迎关注本栏目,每周带你发现最值得关注的GitHub热门AI项目!

  • 微软憋了很久的个人AI助理终于来了:Scout能替你接电话、安排行程,还能主动提醒你

    微软最近在Build大会上放了个新东西——一款叫Scout的AI个人助理,号称是他们在个人助理领域的第一次真正尝试。和之前嵌入在Microsoft 365应用里的Copilot不同,Scout是独立的、能力更强的个人助理,可以7×24小时运行,深度集成到你工作和生活的各个场景里。

    Scout和Copilot有什么不一样?

    之前的Copilot更像是一个”聊天机器人”,你得主动找它,它才会帮你做事。但Scout不一样,它是真正的”个人助理”——可以主动帮你处理事情,比如安排会议、报销费用、草拟邮件,甚至监控你的路况和日程,提醒你该出发去接孩子或者赴晚餐约会了。

    微软Scout企业副总裁Omar Shahine说:”这是一款个人助理,是我们首次向客户提供的真正的个人助理。用户需要明白,这个助理可以给你打电话,这是和聊天类AI完全不同的产品形态。”

    它能主动帮你做什么?

    Scout会在后台读取你的Teams对话、会议记录和邮件,自主学习对你重要的信息,然后主动推送相关内容。比如它知道你今天下午有个会议,它会提前提醒你准备资料;知道你每周五要去超市,它会帮你列好购物清单。

    现在Scout已经在微软内部测试了一段时间,有超过3000名员工正在使用。大家用它来安排会议、处理文书工作、预订差旅、填写表格,甚至还有人用它来追踪自己的健身目标——用Shahine的话说,”很多人用它来成为更好的自己,我们都有想要实现的目标,但往往因为没时间或者精力不够而无法完成,Scout可以帮到他们。”

    微软Scout AI个人助理示意图
    微软Scout AI个人助理可以深度集成Microsoft 365应用

    安全问题怎么解决?

    很多人可能会担心:Scout要访问我的Teams、邮件、日程,会不会泄露隐私?微软说他们已经考虑到了这一点——Scout运行在沙盒化的云环境里,默认被视为不可信程序,它不会获取任何密钥,也无法直接访问你的Microsoft 365数据。

    除此之外,微软还会用自家的全套安全能力管控Scout,包括Agent 365、Purview、Defender,同时会做常规的红队测试、隐私审查和安全审查,确保符合企业环境的安全要求。Shahine表示:”我们采取了微软运营服务、保护服务的一贯措施,我对这些做法很有信心。OpenClaw的能力非常强大,所以我们也会给客户预装一套精选的功能集合。”

    有意思的是,微软并没有开发OpenClaw的独立定制版本,而是直接为这个开源项目的核心技术做贡献。此前几个月,微软CEO Satya Nadella还曾把OpenClaw类比为”病毒”,OpenClaw的AI”技能”扩展也一直被安全从业者视为”安全噩梦”。现在微软用实际行动表明了态度——不是自己重造轮子,而是把开源项目变成企业级产品。


  • 谷歌给安卓加了道通话防火墙:AI深度伪造的诈骗电话,现在能自动识别了

    你有没有接过那种电话——来电显示是”Mom”,声音听起来也像,但对方一开口就要你转钱救急?最近这类AI深度伪造的诈骗电话越来越多了,谷歌终于给安卓用户出了个针对性的功能。

    AI诈骗电话是怎么骗过你的?

    诈骗者现在的套路是:先 spoof 一个你信任的号码(比如家人的号码),再用AI深度伪造技术把声音模仿得一模一样。你一看来电显示是”Mom”,声音也对,很容易就信了,等发现不对劲的时候,钱可能已经转出去了。

    谷歌在官方博客里解释:”如果一个诈骗者试图伪装成你信任的联系人,那个初始的确认信号就会缺失。你的设备会立刻注意到这一点,并且ping对方的实际设备来双重确认。如果对方的真实设备说’我现在没在打电话’,你屏幕上就会收到警告,建议你立即挂断。”

    这个功能是怎么工作的?

    其实原理有点像”设备间的数字握手”——当你和另一个使用Google Phone应用的联系人通话时,双方的手机都会发送一个静默确认信号来验证通话的合法性。

    这个功能默认是开启的,会在后台自动运行,你不需要做任何设置。而且谷歌把这个功能构建在RCS(富通信服务)之上,这意味着其他应用和公司也可以采用这项技术,以后可能会有更多的通话应用支持类似的反诈骗功能。

    谷歌安卓虚假通话检测功能示意图
    谷歌新推出的虚假通话检测功能会自动验证来电合法性

    同期还有其他安卓更新

    除了反诈骗通话功能,谷歌这次还推出了几个其他的安卓更新:比如Google Photos的”wardrobe”功能,可以帮你虚拟试穿衣服,下周起在美国、印度、巴西的安卓10+设备上推出;Google Play Books的”Catch me up”功能,可以帮你recap读到一半的故事,还能高亮段落提问;还有Circle to Search现在可以一次性搜索整套穿搭,不用再一件一件搜了,安卓14+设备现在就能用。


  • 微软搞出自己的推理模型了,OpenAI看了怎么想

    微软在Build 2026大会上扔下了一颗不太起眼的炸弹——他们发布了首款具备高级推理能力的自研AI模型,名字叫MAI-Thinking-1。这事的意义比听起来大:微软过去一直是OpenAI模型的重度依赖者,自己搞模型这件事,之前只做过一些试探性的尝试。

    微软官方介绍,MAI-Thinking-1是一款”中等规模模型”,在”关键”软件工程基准测试中与领先模型表现相当。更重要的是,它”完全基于干净数据从零开始训练,没有使用第三方模型的蒸馏数据”。

    微软为什么要自己做模型

    答案藏在时间线里。微软和OpenAI的关系在过去一年发生了微妙变化——双方重新协商了合作协议,弱化了此前的深度绑定。对微软来说,把全部AI能力押在一家公司身上,战略风险太高。

    自己做模型,意味着微软在AI能力上有了”备胎”,也意味着他们可以把模型能力更直接地整合进Windows、Office、Azure产品线里,不用每次都跟OpenAI谈条件和分成。

    微软MAI AI模型
    微软在Build 2026上发布MAI系列模型(图源:The Verge)

    这次不只是推理模型

    MAI-Thinking-1是这次发布阵容里最受关注的一款,但微软实际上一口气发了7个新模型,覆盖了多个方向:

    • MAI-Image 2.5(含flash版本):支持文生图和图像编辑
    • MAI-Transcribe-1.5:转录速度比竞品模型快5倍
    • MAI-Voice-2(含flash版本,即将推出):新增15种语言支持,更多语音选项
    • MAI-Code-1-Flash:推理效率高,已经集成到GitHub Copilot和Visual Studio Code

    “干净数据”这个细节值得注意

    微软特别强调,MAI-Thinking-1是”完全基于干净数据从零开始训练”的,没有用第三方模型的蒸馏数据。这句话说给谁听的?很大程度上是说给那些担心模型污染、版权纠纷、训练数据合规问题的企业客户听的。

    蒸馏(distillation)是业界常用手法——用大模型生成的数据去训练小模型,成本低效果好,但会引入原模型的偏见和错误,还可能踩版权红线。微软选择从零开始,训练成本肯定高了不少,但换来了数据主权的干净。

    推理模型的核心价值在于”慢思考”——不是秒回答案,而是把问题拆解、反思、逐步推导。这是当前大模型竞争的高地,谷歌(Gemini Thinking)、Anthropic(Claude思考链)、OpenAI(o系列)都在押注这个方向。

    对OpenAI意味着什么

    短期来看,微软还会继续深度使用OpenAI的模型——Azure OpenAI Service不会消失,Office里的Copilot也还会跑OpenAI的后端。但中长期看,微软有了自己的推理模型,议价能力提升,和OpenAI的合作关系会从”依赖”走向”互补”。

    对开发者来说,多一个选择从来不是坏事。MAI-Thinking-1如果真的在软件工程基准上能打,那它就是继Gemini Thinking、Claude Opus、GPT-o系列之后的又一个选项。

    📎 原文来源:The Verge — Jay Peters