标签: Codex

  • OpenAI给Codex加了6个新岗位插件,白领的AI同事上线了

    OpenAI周一扔出一个不小的更新:Codex不再只是程序员的玩具,他们给这款AI智能体一口气加了6个岗位插件,直接把触角伸进了数据分析、销售、产品设计这些典型的白领工作场景。

    背后的数据挺能说明问题。OpenAI在同步发布的一份内部报告里透露,Codex现在的周活跃用户已经突破500万,比2月份桌面应用刚上线时涨了6倍多。更有意思的是用户结构——开发者仍然是最庞大的群体,但知识型工作者的占比已经到了20%,而且这个群体的增速是其他群体的3倍以上。

    Codex的周活跃用户超过500万,知识型工作者目前约占用户总数的20%,且增长速度比其他群体快3倍以上。

    6个新插件,瞄准具体岗位

    这次推出的插件覆盖了6个岗位:数据分析、创意制作、销售、产品设计、股权投资、投行。每个插件都整合了对应的集成接口、操作说明和场景上下文,让Codex能够模拟特定岗位的工作方式。用OpenAI的话说,这些插件开箱就能用,当然你自定义得越多,它干得越顺手。

    这个打法看着眼熟——Anthropic今年2月就推过面向企业的智能体插件项目,5月又专门针对金融服务推出更细分的智能体。OpenAI传统上更偏消费者市场,拉企业客户的速度慢了半拍,直到3月才给Codex引入插件支持。这次算是追了上来,而且声势更大。


    不只是插件,还有两个新功能

    除了插件,OpenAI还顺手发了两个新功能。一个是Sites,让Codex把工作成果直接输出成可交互的托管网站,不再只是一堆本地文件。为了支撑这个功能,OpenAI拉了一帮合作伙伴进来,包括Wix、Base44、Replit、Lovable、Figma和Emergent,而且明确表示还要继续扩这个生态。

    另一个是Annotations(注释),用户可以指定Codex中某个文档或文件的特定部分,让AI在那段上下文里执行更精准的指令。这个设计挺实用的,尤其是处理长文档的时候。


    更大的一盘棋

    这次更新发布的三周前,OpenAI刚为了企业客户推出了一家新的合资企业,叫”OpenAI Deployment Company”,拿到了全球投资机构超过40亿美元的资金支持。这个公司的目标很明确:把OpenAI的工具更深地嵌进全球企业的运营里。

    OpenAI首席营收官丹妮丝·德莱瑟在声明里说了一句话,挺能代表他们现在的思路:”AI正变得能够在组织内部完成越来越有价值的工作,现在的挑战是帮助企业把这些系统整合到支撑其业务的基础架构和工作流中。”

    这话翻译过来就是:工具已经差不多了,接下来要把它真正塞进企业的日常运转里。Codex这波更新,明显是冲着这个目标去的。

  • OpenAI Codex周活冲到500万,这次不打算只给程序员用了

    OpenAI本周公布了一个数字:Codex每周活跃用户已经到了500万。这个数字比大多数人预期的要快,而这个工具的定位,也已经不再只是程序员的专属了。

    从编程工具到通用生产力工具

    Codex刚出来的时候,大家都觉得这就是个AI写代码的东西,程序员用用就算了。但OpenAI现在的说法很明确:Codex要覆盖的是所有跟信息和知识打交道的人,而不只是写代码的人。

    这个定位转变其实挺聪明的。写代码的人就那么多,但每天要处理文档、整理数据、搭建内部工具的知识工作者,数量是程序员的好几倍。Codex如果能让他们不用学编程也能”指挥”AI干活,这个市场就大得多了。

    Codex现在的能力已经超出ChatGPT的范畴——它可以构建可交互的托管网站和应用,还能根据新数据自动更新。

    新功能到底有什么用

    这次跟着500万用户数字一起公布的,还有几个实在的功能更新。最值得关注的是新的预览版本,企业客户现在已经可以用上了。

    • 支持构建可交互的托管网站和应用——不只是生成代码,而是直接跑起来
    • 支持用新数据持续更新生成的内容,不用每次都重新生成
    • 新插件生态上线,第三方工具可以接入Codex的工作流
    • 企业版支持更细粒度的权限和数据隔离控制

    有意思的是这次发布的时机。正好微软在办Build 2026大会,微软和OpenAI这种”亲密友敌”的关系,在AI圈已经不是秘密了。两边都在推自己的AI编程工具,但底层又深度合作,这种竞合关系估计还会持续很久。

    500万周活意味着什么

    500万周活,放在消费级AI产品里不算特别夸张,但Codex的用户价值密度很高。用Codex的人,通常是真的在用它干活,而不是随便玩玩。这个留存率和付费转化,应该比ChatGPT的普通用户要好不少。

    OpenAI这次强调”不只是给程序员用的”,某种程度上也是在为Codex的商业化铺路。程序员市场天花板太低,只有打进更广的知识工作者市场,这个产品才撑得起OpenAI的估值预期。

    OpenAI Codex generated document
    Codex为虚构的Blossom Widgets企业峰会生成的活动文档(图片来源:The Verge)
  • OpenAI给Codex加了六双”职业手套”,白领工作被AI盯上了

    OpenAI正在认真追逐企业用户。6月2日,这家AI实验室发布了Codex的一套新能力,目标很明确:把这款AI工具从程序员圈子扩展到更广阔的白领职场。

    跟新工具一起发布的,还有一份OpenAI内部报告,揭示了Codex在知识工作中的真实使用情况——结论超出很多人预期:它的用武之地,早就超出了软件工程。

    OpenAI Codex
    Codex正在从一款开发者工具转向知识工作者的日常助手(图:NurPhoto / Getty Images)

    500万周活用户,知识工作者增速是开发者的3倍

    报告里的数据值得细看:Codex目前每周活跃用户已经超过500万,自今年2月桌面应用上线以来增长了6倍以上。开发者仍然是最多的用户群体,但知识工作者已经占到用户总量的20%,而且增速是开发者群体的3倍还多。

    这意味着什么?意味着”AI写代码”这个故事已经不够用了。数据分析师、产品经理、设计师、金融分析师——这些人正在成为Codex增长最快的新用户群。

    “Codex现在有超过500万周活跃用户,自2月桌面应用上线以来增长了6倍以上。知识工作者已占用户总量的20%,增速是开发者群体的3倍以上。”

    六款岗位插件,开箱即用

    这次更新的重头戏是六款定向插件,分别对应六个白领岗位:数据分析、创意制作、销售、产品设计、股权投资、投资银行。用户可以在Codex应用内直接调用这些插件,每个插件都打包了对应岗位的集成工具、操作指引和场景上下文,让Codex能够模拟对应岗位的工作能力。

    打个比方,以前你让Codex”帮我分析这份数据”,它得靠你描述清楚背景。现在选了”数据分析”插件,Codex自带了数据分析师常用的工具链和思维框架,输出的东西更贴近一个真实数据分析师会给出的结果。

    当然,跟所有AI工具一样,这些插件的效果会随着自定义调整而提升,但OpenAI的意思是——开箱就能用,不需要太多配置。

    顺手把”Sites”功能也做了

    这次更新还有一个挺实用的功能叫”Sites”:Codex现在可以把工作成果直接输出成一个可访问的互动网站,而不是只生成本地文件。OpenAI已经拉了一串合作伙伴进来做这件事:Wix、Base44、Replit、Lovable、Figma、Emergent。后续还会扩大合作生态。

    另外还有一个”Annotations(标注)”功能,让你可以在Codex里框选文档或文件的特定部分,然后针对那一块发指令,上下文操作更精准。

    OpenAI在企业市场是个”后来者”

    这件事的背景挺有意思。Anthropic早在今年2月就推出了企业智能体项目,5月还上线了更聚焦金融场景的智能体。OpenAI此前一直更侧重C端用户,直到3月才为Codex引入插件支持。这次的动作,明显是在追赶Anthropic的企业服务布局。

    三周前,OpenAI刚推出了面向企业客户的合资公司”OpenAI Deployment Company”,拿到了全球投资机构超过40亿美元的融资,目标就是把OpenAI的工具更深地嵌到全球企业的业务流程里。首席营收官Denise Dresser的说法是:”AI已经能够在组织内部完成越来越有价值的工作,现在的挑战是帮助企业将这些系统整合到支撑业务的基础设施和流程中。”


  • OpenAI在2026年5月这波更新,藏着他们真正的野心

    OpenAI在2026年5月这波更新,藏着他们真正的野心

    2026年4月23日到5月28日这段时间,OpenAI密集发布了一堆更新。表面上看,就是发布了新模型、修了几个bug、加了两个功能。但如果你仔细看这波操作的逻辑,会发现他们真正想做的,是把AI从”聊天工具”变成”能连续工作几小时的数字化员工”。

    GPT-5.5来了,但重点不是”更聪明”

    4月23日,GPT-5.5在API、ChatGPT Plus/Pro、Codex、Copilot中上线。数字看着挺漂亮:支持100万token上下文,SWE-bench Verified得分88.7%,MMLU 92.4%,定价5/30美元每百万token。

    但真正有意思的是5月5日上线的GPT-5.5 Instant,它取代了GPT-5.3 Instant成为所有ChatGPT用户的默认模型。OpenAI内部测试显示,在高风险提示下,它的幻觉率比上一代降低了52.5%。用户标记过事实错误的真实对话中,不准确陈述减少了37.3%。

    GPT-5.5 Instant的输出也更简洁了,相同提示下输出字数减少30.2%。以前那种”好的!我很乐意帮助您…”的废话开头,现在少多了。

    不过有个细节值得注意:52.5%的幻觉降低,是在开启工具使用的高风险提示下测得的数据。如果不开启工具,纯靠模型自己生成长文本,GPT-5.5的幻觉率仍有86%,远高于Claude Opus 4.7的36%。所以,它的事实性优势主要来自工具引导和上下文工程,而不是基础模型本身有多牛。

    Codex CLI偷偷升级成了”持久自主运行时”

    5月7日到26日,Codex CLI连发4个版本。表面上是加了Vim编辑支持、修了几个bug、改进了UI。但5月21日v0.133.0的更新,才是这波操作的核心:目标模式(Goals Mode)默认开启

    这个”目标模式”是干嘛的?简单说,就是你定义一个结果和成功标准,然后Codex可以自己跑几个小时甚至几天,而且进度是跨轮次、跨会话、跨机器持久化的。目前这个功能在CLI、IDE扩展、ChatGPT应用里都已经正式可用。

    这意味着什么?以前你让AI帮你写代码,它写完就完事儿,你得自己测试、自己修bug、自己接着往下做。现在你可以直接甩给它一个目标,比如”把这个项目的所有单元测试覆盖率提升到80%”,然后你就可以去干别的了,它自己会想办法、自己测试、自己迭代,直到达成目标或者卡住。

    Codex目标模式示意图
    Codex目标模式让AI可以自主工作数小时

    其他几个更新也挺实用:v0.131.0支持通用的”@”选择器,可以一次性搜索文件、目录、插件、技能;v0.134.0支持对话历史搜索,还支持按服务器配置MCP环境变量。这些看起来是小事儿,但堆在一起,就是在把Codex从”交互式编码助手”升级成”持久自主运行时”。

    ChatGPT for Excel和Google Sheets,这步棋下得挺大

    5月5日,ChatGPT for Excel和Google Sheets正式发布。这个功能是在Excel和Google Sheets里加个侧边栏,让ChatGPT直接读写你的电子表格。

    有两个概念值得注意:技能(Skills)是可复用的操作手册,教ChatGPT如何处理你这个组织的电子表格工作流、格式和审核步骤;应用(Apps)允许侧边栏连接外部数据源(比如金融数据、内部数据库),让推理基于正确的上下文,而不只是靠公式推理。

    这个动作的信号很清晰:OpenAI不想让ChatGPT只是个”聊天框”,他们想让它嵌入到你的工作流里。Excel和Google Sheets是全世界上亿人的日常工具,把AI直接塞进去,比让你打开个网页聊天的使用频率高多了。

    商业和企业版用户可以免费试用到2026年6月2日,之后就要按套餐积分配额计费了。这个时间节点卡得挺准,给你一个月时间尝鲜,然后就开始收费。

    记忆源(Memory Sources):个性化推荐背后的隐私陷阱

    5月18-20日,记忆源功能向Plus和Pro用户的网页端开放。这个功能的核心是:当ChatGPT给你个性化回答时,你可以查看它引用了哪些来源——过往对话、保存的记忆、自定义指令、文件库中的文件、已连接的Gmail账户邮件。

    每个来源都可以修正、删除或标记为”不相关”。共享对话不包含来源列表,所以共享边界处的隐私是受到保护的。

    紧接着,Google日历集成也来了:连接日历后,ChatGPT可以起草会议议程、推送生日提醒、为即将到来的旅行推荐餐厅。

    这里有一个明显的隐私权衡:你连接了Gmail或日历之后,其中的内容可能会在回答中露出来。如果你忘了已经连接了Gmail,然后问它”我们的Q2战略”,它可能会引用一封你早就忘了的邮件线程。建议定期去审计一下记忆源面板。


    GPT-5.6的影子:到底发没发布?

    5月中旬,有用户发现Codex日志中短暂出现过gpt-5.6的部署映射条目,但很快就消失了,回滚成了gpt-5.5。这个现象符合后端金丝雀测试的特征:把少量生产流量路由到实验版本,测量性能和行为。

    所以,GPT-5.6大概率是在开发中。Polymarket的交易者认为,2026年6月30日之前公开发布的概率是80-89%。但这是博彩市场的信号,不是厂商的承诺。

    OpenAI目前没有发布GPT-5.6的模型卡、API端点、基准测试或者发布日期。所以如果你在规划Q3的路线图,建议先基于GPT-5.5开发,保持模型ID可配置,方便后续一行代码迁移。任何假设GPT-5.6六月发布的路线图,目前都只是押注,不是承诺。

    跟Claude Opus 4.7、Gemini 3.1 Pro比,GPT-5.5赢在哪?

    2026年5月,这三款旗舰模型在Artificial Analysis智能指数上只相差约3分。差异化不再来自原始能力,而是各自的优势领域。

    • GPT-5.5:在代理执行领域领先,Terminal-Bench得分82.7%(Opus 4.7是69.4%),OSWorld 78.7%。它有全新的Codex目标模式运行时和最深入的第一方工具集成。
    • Claude Opus 4.7:SWE-bench Pro得分64.3%(GPT-5.5是58.6%),长文本事实性幻觉率36%(同基准下GPT-5.5是86%)。写作质量更优,更适合风险敏感的企业场景。
    • Gemini 3.1 Pro:纯推理能力领先,GPQA Diamond 94.3%,ARC-AGI-2 77.1%,而且价格更低(输出约12美元每百万token,不到GPT-5.5或Opus 4.7的一半)。

    选型建议挺直白:自主代理和Office嵌入工作流选GPT-5.5,代码审查和高信任长文本选Opus 4.7,成本敏感的大规模场景或多模态视频选Gemini 3.x。

    开发者这个月实际踩了哪些坑

    文档是一回事,生产环境是另一回事。这个月开发者实际踩过的坑包括:

    • Codex 40万 vs API 100万上下文不匹配:给Codex喂接近API 100万限制的提示会报错”超出模型上下文窗口”。Codex内上限需控制在40万token。
    • 推理token计费:思考token按输出费率计费,不是单独的等级,而且计入上下文预算。需要谨慎设置reasoning_effort
    • 长文本幻觉:GPT-5.5长文本事实性幻觉率86%,跟Opus 4.7的36%差距明显。无检索接地的情况下多段落事实生成,是这个模型的最大弱点。
    • Codex 0.134配置文件迁移:旧配置文件会被拒绝,需要显式传入--profile或更新配置文件到新schema。
    • 记忆源隐私:如果连接了Gmail或日历但忘了,相关邮件内容会在上下文相关的回答中露出来。共享前务必审计记忆源面板。

    写在最后

    OpenAI这波5月更新的核心逻辑,其实不是在比谁的模型更聪明,而是在布局”AI能不能真正替人干活”。GPT-5.5 Instant降低幻觉、Codex目标模式支持长时间自主运行、ChatGPT嵌入Excel和Google Sheets——这些都是在把AI从”聊天工具”推向”数字化员工”。

    竞争对手也没闲着。Anthropic的Claude Opus 4.7在事实性和代码审查上仍有优势,Google的Gemini 3.5 Flash在成本和多模态上发力。这场AI战争,已经从”谁的模型分数高”转向”谁能真正嵌入到用户的工作流里”。

    对于开发者来说,现在最务实的策略是:先基于GPT-5.5构建,但保持模型ID可配置。GPT-5.6大概率会在Q3发布,到那时候,一行代码就能切换过去。但在那之前,先把能用的功能用起来,比等着”下一代模型”更实际。

  • OpenAI把Codex搬上Windows了,AI智能体直接帮你操作电脑

    OpenAI的Codex之前已经在Mac上能用”计算机控制”功能了,现在Windows用户也等到了。简单说,就是让AI直接”看”你的屏幕,然后在你的设备上帮你干活。

    这个功能的名字叫”computer use”,技术上跟Anthropic的Claude电脑控制是同一类东西——让AI理解屏幕内容,然后模拟人类操作:点按钮、输文字、开软件,整套流程自动化。

    不在电脑旁边也能管

    有个细节挺实用:你不在电脑跟前的时候,也可以通过ChatGPT手机应用查看Codex正在执行的任务,顺便管一管进度。对需要跑长任务的场景来说,不用守在电脑前了。

    Codex的”computer use”本质上是在模仿人类使用电脑的方式。它看屏幕、找按钮、点鼠标、敲键盘——只不过速度比人快得多,也不会累。

    OpenAI在抢智能体入口

    把Codex做成一个能操作你整个系统的智能体,这个方向不止OpenAI在走。Anthropic的Claude已经可以先用到电脑控制能力,微软也在把Copilot往这个方向推。大家的判断是一样的:未来的AI不只是回答问题,而是要能替你把事情做完。

    Windows这块市场OpenAI肯定不想让给别人。Mac版先上,现在补上Windows,基本覆盖大部分开发者群体了。


    安全和权限怎么算

    AI能操作你的电脑,这件事的便利性和风险是并存的。目前Codex需要用户主动授权才会开启这个功能,但往后这类能力的权限边界会是个持续的议题——毕竟,让AI”看见”屏幕内容,意味着它能接触到的信息范围相当大。

  • OpenAI Codex 登陆 Windows:AI 现在能直接操控你的电脑了

    OpenAI Codex 登陆 Windows:你的电脑现在可以被 AI 直接操控了

    OpenAI 的 Codex 之前在 macOS 上已经能用了,现在它的 “computer use”(电脑控制)功能正式来到 Windows。简单说,就是这个应用可以”看到”你的屏幕,然后在你的设备上直接执行各种任务。

    OpenAI 同时还说了一件事:哪怕你不在电脑旁边,也可以用 ChatGPT 应用来管理和查看 Codex 的任务进度。这对需要跑长任务的开发者来说挺实用的。

    Codex 的 computer use 功能本质上是让 AI 能够像人一样操作电脑——移动鼠标、点击按钮、输入文字、截图查看结果。

    为什么这个功能重要

    以前你想让 AI 帮你操作电脑,要么得手动把信息复制粘贴过去,要么得用专门的 RPA 工具。现在 Codex 能直接”看”屏幕,相当于给了 AI 一双眼睛和一只手。

    对开发者来说,这意味着一些重复性操作——比如跑测试、部署代码、处理批量文件——可以真正交给 AI 代理去完成,而不只是帮你写代码。

    跨平台的意义

    Windows 在全球桌面操作系统里占的市场份额比 macOS 大得多。Codex 登陆 Windows,意味着 OpenAI 的 AI 编程工具能触达的开发者数量会上一个数量级。

    这也和现在 AI 编程工具的竞争态势有关。Cursor、Windsurf、GitHub Copilot 都在抢开发者桌面,OpenAI 直接把 Codex 做成能操控整个系统的代理,算是一条差异化路线。


    目前这个功能还在推送中,Windows 用户可以在 Codex 应用里检查更新。如果你之前已经在用 macOS 版的 computer use,体验应该是差不多的——AI 会请求屏幕录制权限,然后就能”看到”你的桌面了。

  • OpenAI Codex 现已能控制你的 Windows 电脑

    OpenAI 的 Codex 在 Mac 端上线之后,现在终于轮到 Windows 用户了。这次更新把 computer use 功能带到了 Windows 平台,意思是这个应用现在能”看见”你的屏幕,还能在你的设备上直接执行各种任务。

    不用坐在电脑前也能管任务

    OpenAI 同时表示,你现在可以通过 ChatGPT 应用在离开电脑的时候管理和查看 Codex 的任务执行情况。这对需要跑长任务的开发者来说挺实用的——不用一直守在屏幕前,手机上就能看进度。

    Codex 的 computer use 功能正式登陆 Windows,AI 编程助手从”帮你写代码”进化到”直接帮你操作电脑”。


    Mac 端先跑,Windows 跟上

    事实上 Codex 的 computer use 功能在 Mac 上已经跑了一阵子了,这次 Windows 版本的到来算是补齐了主流桌面平台的覆盖。OpenAI 在 X(原 Twitter)上还专门发了条推文:”Windows users, this one’s for you.”,语气倒是挺轻松的。

    这个功能本质上是让 AI 能够理解屏幕内容并模拟人类操作——点按钮、填表单、切换窗口,都在这个能力范围内。对于需要做 UI 自动化测试或者批量操作的场景,这比传统的脚本方式要灵活得多。


    和 Claude 的 computer use 打对台

    Anthropic 的 Claude 早就有了类似的 computer use 能力,现在 OpenAI 把这块能力也补上了,两个头部玩家在”让 AI 直接操作电脑”这个方向上的竞争又多了一个维度。区别可能在于 OpenAI 把这套能力和 Codex 的编程场景绑得更紧——你写的代码,Codex 可以直接帮你跑起来、点按钮、看结果。