6月27日,OpenAI悄悄做了一个不一样的发布——不是全面开放,而是”有限预览”。GPT-5.6系列三款模型(Sol、Terra、Luna)正式亮相,但初始阶段只向约20家”可信合作伙伴”开放。这种做法在美国AI行业还是头一回,背后直接站着美国政府。
三款模型,三种定位
这次OpenAI换了一套命名逻辑——数字代表代际(5.6代),Sol/Terra/Luna代表能力层级,可以独立迭代。三款模型不是按参数规模划分,而是对应不同使用场景:
- Sol:旗舰型号,面向最复杂的任务——长周期编码、高级智能体工作流、网络安全研究。OpenAI给它配了
max推理模式(耗时更长但更精准)和ultra模式(调用子智能体并行处理复杂项目)。 - Terra:均衡型,主打日常办公场景的性能与成本平衡。高并发企业任务(客户支持、内部工具开发、文档分析)用这个最划算。
- Luna:轻量型,速度最快、成本最低。总结、草稿、常规自动化流程这类轻量任务,用Luna就够了。
跑分出来了,确实能打
基准测试成绩相当亮眼。Sol在TerminalBench 2.1(命令行任务)上开启ultra模式得分91.91%,刷新该基准的最高纪录;开启max模式也有88.76%,超过GPT-5.5的83.4%和Claude Mythos 5的88%。
在Agent’s Last Exam(专业工作流测试)上,Sol是唯一突破50%的模型(50.9%)。连轻量级的Luna,成绩也略微超过上一代旗舰GPT-5.5。
OpenAI内部评估认为,Sol和Terra达到了网络安全”高风险”阈值。但这不代表它们能自主生成完整的攻击exploit——内部夺旗测试显示,Sol能识别漏洞和利用原语,但还差最后一步。
美国政府站在发布台上
这次发布最不寻常的地方,是OpenAI在公告里直接说了:应美国政府要求,从有限预览开始。背景是特朗普政府6月2日签署的行政令,要求AI模型在广泛发布前经过30天的安全评估流程。
Anthropic的Mythos 5/Fable 5被政府叫停的事件,显然让OpenAI选择了更谨慎的路线。CEO Sam Altman在公告中也不掩饰对此的无奈——他认为政府前置审批如果常态化,会阻碍AI工具触达需要的用户。
目前的安排是:初始阶段仅向约20家机构开放,普通用户和企业的全面开放要等”未来几周内”逐步推进。OpenAI已将模型信息和发布计划同步给了美国政府。
价格:比前代便宜了
定价方面,GPT-5.6比前代GPT-5.5(输入$5/百万token,输出$30/百万token)要便宜。Luna尤其有竞争力:
- Luna:$1(输入)/$6(输出)每百万token
- Terra:$2.5/$15
- Sol:$5/$30
对比一下国产模型更有感觉:DeepSeek-V4-Flash只要$0.14/$0.28,GLM-5.2是$1.40/$4.40,Kimi-K2.6是$0.95/$4.00。GPT-5.6 Luna的定价处于行业中游——比国产模型贵,但比Claude Opus 4.8($5/$25)和GPT-5.5(与Sol持平)便宜。
有限预览阶段,能直接用上GPT-5.6的只有那20家机构。但OpenAI的方向是明确的:用分层命名让开发者更容易选模型,用更低的价格扩大使用面,同时在政府审查面前保持配合姿态。这个平衡能走多远,接下来几周见分晓。
发表回复