分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • Facebook给创作者做了个AI助手,想让他们别去TikTok和YouTube

    Facebook本周宣布,要把原来的Creator Studio工具重新设计成一个独立的AI伴侣应用,专门帮创作者在平台上把受众做起来。

    这件事的背后算盘很清楚:Facebook跟TikTok、YouTube抢创作者已经抢了很久了。给创作者更好的工具,他们才愿意留下来。而且,如果Facebook自己的AI助手够好用,创作者就不需要再去开ChatGPT想内容创意、分析数据了。

    Facebook创作者AI应用界面
    Facebook新的创作者AI应用界面(测试版)| 图片来源:Meta

    这个AI助手能干什么?

    新的应用里内置了Facebook6月4日刚推出的”AI创作者助手”。这个助手不是通用聊天机器人,它是专门针对创作者的需求训练的。它能根据创作者的内容风格、历史表现、受众互动情况,还有创作者自己设的目标,给出个性化建议。

    创作者可以直接问它问题,比如”我这个视频什么时候发最好?””大家在我最新那条帖子下面都在说什么?”因为是对话式的,你还可以接着问,比如”我的受众这三个月有什么变化?”

    以前要搞清楚这些,得自己去后台翻各种图表和仪表盘。现在直接问就行了,省了不少事。

    不只是问答,还能帮你回评论

    新的Creator Studio应用里还有一个用AI驱动的评论工具。它会把最重要的评论挑出来,然后用创作者平时的语气起草回复。当然,创作者可以编辑和确认之后再发,不是完全让AI乱回。

    每天打开这个应用,创作者会看到一个优先事项列表:最新帖子的表现怎么样、离自己设的目标还差多少、哪些评论需要回复。基本上把一天该干的事都帮你列好了。


    Meta最近在疯狂推独立应用

    这次的创作者AI应用,只是Meta最近一波新应用里的其中一个。上个月,他们推了一个叫Forum的独立应用,功能类似Reddit,是给Facebook Groups用的。

    4月,Meta还推出了一款叫Instants的应用,让用户在Instagram好友之间分享会消失的照片(很明显是在学Snapchat)。

    《纽约时报》本周二还报道说,Meta正在开发一款类似Polymarket的预测市场应用,内部代号叫”Arena”,不过还没正式推出。

    《华尔街日报》今年4月报道过,CEO扎克伯格告诉员工,AI带来的效率提升,会让公司有能力开发比历史上更多的应用。

    换句话说,以前Meta可能一年出不了几个新应用,以后说不定会快很多。AI帮他们省下来的人力和时间,会直接投入到做新东西上。

    目前还在测试阶段

    这个新应用目前只向部分创作者开放测试,还没全面推出。Facebook没说什么时候会向所有人开放。

    但方向已经很明确了:Meta要把AI塞进每一个它可能派上用场的地方。创作者工具只是一个开始,接下来估计还会有更多面向普通用户的AI功能,陆续装进Meta的各个应用里。

  • OpenAI首款自研芯片Jalapeño曝光:不再完全依赖英伟达

    周三,OpenAI终于把自己的第一款定制芯片拿了出来给人看。这款叫Jalapeño的推理处理器,是OpenAI跟Broadcom一块设计、一块造出来的。公司说,这颗芯片是专门针对OpenAI推理系统的需求定制的,而且开发过程中,OpenAI自己的AI模型也参与了芯片的设计工作。

    目前Jalapeño还在测试阶段,但OpenAI透露说,早期测试结果显示,它的性能功耗比要比目前业界最先进的方案强不少。这话听着有点虚,但考虑到OpenAI的体量,他们确实有底气这么说。

    OpenAI Jalapeño芯片概念图
    OpenAI首款自研芯片Jalapeño(概念图)| 图片来源:TechCrunch

    为什么要自己造芯片?

    这件事其实传了很久。OpenAI跟Broadcom的合作关系去年10月就正式公布了,但OpenAI要自研芯片的传闻,早在2025年初就开始到处飞。最核心的动机很简单:他们不想被英伟达牵着鼻子走。

    现在训练大模型、跑大模型,全得用英伟达的GPU。算力需求越大,OpenAI交给英伟达的钱就越多。自己造芯片,哪怕只能替代一部分英伟达的GPU,长期来看也能省下不少钱,更重要的是,不用再看英伟达的脸色。

    OpenAI总裁Greg Brockman在去年10月的一期官方播客里说过一段话,大意是:”我们对自己要跑的工作负载有很深的理解。我们一直在找那些现有方案服务不够好的特定场景,然后想办法造出能加速这些场景的东西。”

    Jalapeño能干嘛?不能干嘛?

    先说清楚,Jalapeño不是用来训练大模型的。它的定位很明确:专门做推理(inference)。也就是用户发一条指令,模型给出回答这个过程。OpenAI在公告里特别强调了这颗芯片在跑实时编程模型时的低成本表现。

    像预训练这种特别吃算力的活,短期内估计还是得靠英伟达的硬件。但推理成本的优化,对OpenAI的财务来说可能是个大事情。每次用户问ChatGPT一个问题,OpenAI都要付一次推理成本。如果能把这部分成本降下来,哪怕只降一点点,积少成多,对公司的盈亏平衡会有不小的影响。


    不是只有OpenAI在这么干

    自研AI芯片这件事,OpenAI不是第一个,也不会是最后一个。Google有自己的TPU(张量处理单元),亚马逊有Trainium,这些都是为了同一个目的:加速机器学习工作负载,减少对英伟达的依赖。

    但OpenAI这次做的,跟Google和亚马逊还不太一样。Google和亚马逊主要是给自己云服务里的客户用,OpenAI造这颗芯片,首要任务是服务自己的产品和模型。Codex、GPT系列,这些产品的推理需求,OpenAI比任何人都清楚。自己造芯片,等于把优化的主动权拿在了自己手里。

    OpenAI在公告里说了一段挺有意思的话:

    “OpenAI不仅在开发前沿模型或在模型之上构建产品,我们还在设计支撑这些模型的基础设施:芯片架构、内核、内存系统、网络、调度、部署系统,以及产品体验。因为OpenAI在整个技术栈上都有布局,每一层都可以围绕同一个目标进行优化:让模型更快、更可靠、对用户更便宜。”

    这段话翻译过来就是:我们不想只做软件,硬件我们也要自己搞。从最底层的芯片,到最上层的产品体验,全都要打通。

    Jalapeño这个名字…

    最后说个题外话,这颗芯片的名字Jalapeño(哈雷佩尼奥),是一种墨西哥辣椒。OpenAI给项目起名字一直挺随意的,之前GPT系列的内部代号也全是这种风格。至少比叫”OpenAI Chip 1.0″有意思多了。

    这颗芯片目前还在测试,什么时候能大规模用上,OpenAI没说。但方向已经很明确了:以后的OpenAI,不仅卖模型、卖订阅,还要卖自己造的芯片跑出来的推理能力。英伟达估计不太乐意看到这个局面。

  • 近400家美国地方报纸联合起诉OpenAI和微软:AI版权大战从巨头打到社区

    6月24日,纽约联邦法院收到一份重量级诉状:近400家美国地方报纸联合对OpenAI和微软提起版权侵权诉讼,指控这两家科技公司在未获许可、未支付任何报酬的情况下,系统性抓取、复制并”摄取”其受版权保护的新闻报道,用于训练ChatGPT和微软Copilot等AI产品。

    这不是第一家起诉OpenAI的媒体,但可能是规模最大、最具象征意义的一次。此前《纽约时报》、Ziff Davis、梅里亚姆-韦伯斯特和大英百科全书已经分别提起了诉讼,而这次,将近400家地方报纸——那些真正在覆盖美国各地社区日常新闻的”草根媒体”——站了出来。

    地方报纸起诉OpenAI版权侵权
    近400家地方报纸联合起诉OpenAI和微软丨来源:AI生成

    诉状里写了什么?

    原告在诉状中用了很直白的表述:OpenAI和微软”抓取、复制并摄取”(scraped, copied, and ingested)了他们的新闻作品,没有任何许可,也没有任何补偿。这些地方报纸花真金白银做采访、写报道、核实事实,结果AI公司把内容一股脑喂给了大模型,训练出来的产品还能直接回答用户的新闻问题——相当于用报纸的内容训练出了一个竞争对手。

    “被告利用这些新闻作品开发能够直接替代传统新闻报道的AI产品,从而损害了新闻出版行业的生存基础。”——诉状原文

    原告律师在法庭文件中强调,地方报纸是美国社区获取本地新闻的核心渠道——市议会开了什么会、本地学校预算怎么花、哪里新开了一家店,这些”接地气”的信息,都是地方报纸的记者跑出来的。AI公司免费使用这些内容,制造出能回答同样问题的AI产品,本质上是在”搭新闻机构巨额投资的便车”。

    OpenAI的”选择性付费”策略

    这场诉讼最刺痛人的地方在于:OpenAI并不是完全不付钱。过去两年,OpenAI已经和Axel Springer(旗下有Business Insider、Politico)、英国《金融时报》、美联社、法国《世界报》等大型国际媒体达成了付费授权协议。换句话说,大媒体有谈判筹码,能拿到钱;而地方报纸没有,就被白白用了内容。

    这种”掐尖式”的授权策略,让中小型出版商特别愤怒。他们觉得,OpenAI是在用”分化瓦解”的方式逐个击破——先和大玩家和解,让小玩家陷入孤立无援的境地。但这次近400家报纸联合起来,就是要告诉OpenAI:我们虽然各自很小,但加起来不好惹。

    Timing对OpenAI很糟糕

    这起诉讼的Timing,对OpenAI来说相当棘手。据报道,OpenAI正在筹备IPO,但其2025年财报显示亏损高达385亿美元。持续增加的版权诉讼,会直接变成IPO招股书里的”法律风险”章节,投资者读了之后,对估值的看法可能会大打折扣。

    更严重的是,如果法院最终判决OpenAI需要为训练数据支付赔偿,那这个金额可能不是几千万美元能搞定的——大模型训练用到的数据量实在太大,按传统版权计费方式算下来,可能是个天文数字。这也是为什么OpenAI拼命想和大型出版商单独和解,而不是等法院给个统一规则。


    这不只是钱的问题

    地方报纸的困境,其实已经持续了十几年。广告收入被Google和Facebook吃掉,数字化转型又烧钱,很多地方报纸早就撑不下去了。现在AI来了,直接用它们的内容训练模型,连”引流”这个最后的价值都被剥夺了——用户问ChatGPT就能拿到新闻要点,为什么还要去报纸网站看全文?

    这起诉讼的走向,很大程度上会影响AI行业未来的数据使用规则。是继续”先用了再说”,还是建立一套透明的内容授权机制?答案可能要在法庭上见分晓了。

  • 苹果Vision Pro硬件负责人跳槽OpenAI,Jony Ive团队再添一员大将

    彭博社昨天(6月26日)爆了个挺炸的消息:负责Vision Pro头显和智能眼镜项目的苹果副总裁保罗·米德(Paul Meade),本周内就要离职,目的地是OpenAI的硬件部门。

    米德不是一般人物。2010年加入苹果,最早在iPhone和iPad团队干活,2017年转到视觉产品团队,一路把Vision Pro从概念推到发布。七年时间,这玩意儿终于在2024年上市,定价3499美元,被苹果寄予”下一代计算平台”的厚望。

    苹果高管跳槽OpenAI概念图
    苹果硬件高管流向OpenAI,AI硬件竞赛升温丨来源:AI生成

    去OpenAI干什么?

    米德去OpenAI,是加入去年被OpenAI收购的硬件创业公司io Products的团队。这家公司是谁创办的?乔尼·艾夫(Jony Ive),苹果的前首席设计官,也就是iPhone、iPad、MacBook那个标志性设计背后的灵魂人物。

    去年OpenAI把io Products买下来,外界就一直在猜:萨姆·奥特曼(Sam Altman)和乔尼·艾夫到底要做什么硬件?现在答案逐渐清晰——他们在组建一支豪华硬件团队,而米德是这个拼图里关键的一块。他带来的,是苹果内部关于高端硬件从零到一整套流程的实战经验。

    “米德将参与OpenAI即将推出的一系列人工智能设备的研发。”——彭博社援引知情人士

    苹果的当口,Timing很微妙

    这波人事变动的Timing,对苹果来说相当不凑巧。就在前几天,苹果刚宣布蒂姆·库克(Tim Cook)的接班人是约翰·特努斯(John Ternus),新的CEO时代即将开启。高管层本来就在洗牌,现在连Vision Pro和智能眼镜项目的硬件一把手也被OpenAI挖走了。

    更尴尬的是,Vision Pro刚宣布涨价。原因?据报道是RAM短缺。一个本就售价3499美元的头显,还要再涨一波,消费者的热情本来就不高,这下更难卖了。与此同时,苹果的智能眼镜项目还在开发当中,正是需要核心硬件人才的时候,结果负责人跑了。

    苹果和OpenAI发言人都拒绝置评。但市场已经在用脚投票——苹果的硬件护城河,正在AI时代被一点点蚕食。

    AI硬件竞赛,已经开打

    把视角拉远一点,你会发现这次人事变动背后,是一场正在升温的AI硬件竞赛。OpenAI有了乔尼·艾夫的设计能力,现在又补上了米德的硬件工程经验,软件+设计+工程的三叉戟正在成型。

    谷歌有Pixel、微软有HoloLens、Meta有Ray-Ban智能眼镜和Quest头显,而现在OpenAI也要有自己的硬件了。苹果在AI软件层面本来就不占优,如果连硬件人才也开始流失,那”下一代计算平台”的争夺战,天平正在发生微妙的变化。


    保罗·米德不是第一个离开苹果加入AI前沿公司的硬件人才,也不会是最后一个。这场人才大战的背后,是整个科技行业对”AI原生硬件”的押注。苹果能不能守住自己的地盘,接下来的12个月很关键。

  • 亚马逊再砸130亿美元押注印度,全球AI算力竞赛找到新战场

    安迪·贾西去了一趟新德里,见了印度总理莫迪。回来之后,亚马逊宣布了一件事:追加130亿美元,扩建在印度的AI和云基础设施,时限到2030年。

    这笔钱主要用来扩充亚马逊云科技(AWS)在孟买和海得拉巴的数据中心容量。看起来只是一次例行扩建,但把它放在最近几年的脉络里看,意义不太一样。

    亚马逊印度AI数据中心概念图
    亚马逊在印度孟买和海得拉巴扩建AI数据中心

    三年三次,加码越来越狠

    这是亚马逊三年内第三次对印度做出重大投资承诺。2023年,贾西和莫迪见面后宣布到2030年投入150亿美元,其中127亿专门给AWS。2025年12月,亚马逊又把承诺总额推高到350亿美元。加上这次的130亿,亚马逊在印度累计承诺的投资总额已经到了480亿美元。

    当然,科技公司宣布的”长期承诺”往往同时包含资本支出和运营支出,不等于马上就要花掉的新基建投资。但480亿美元这个数字本身,已经足以说明亚马逊对印度市场的定位——不只是”重要”,而是”绝不能丢”。

    印度正在成为全球AI算力竞赛中各方都想拿下的那个”落脚点”。微软、谷歌、亚马逊,一个都没缺席。

    不是亚马逊一个人在跑

    微软2025年12月说要在2029年之前往印度投175亿美元。谷歌2025年10月宣布150亿美元,用于在印度建AI枢纽和数据中心基础设施。这两家加起来,已经和亚马逊的承诺总额差不多了。

    数据中心这个项目,砸钱的不只是美国科技公司。澳大利亚的AirTrunk承诺投300亿美元在印度建5吉瓦的AI数据中心;加拿大养老金投资委员会(CPP Investments)也进来了;印度本土的Reliance Industries和Adani Group,分别拿出了1100亿和1000亿美元的AI投资计划。

    • 微软:175亿美元,2029年到位
    • 谷歌:150亿美元,建AI枢纽和数据中心
    • AirTrunk:300亿美元,5吉瓦数据中心容量
    • Reliance:1100亿美元AI投资计划
    • Adani:1000亿美元投向AI数据中心

    印度打的是什么算盘

    新德里方面也在主动出牌。2026年2月,印度政府推出了一项税收优惠政策:外国云服务商如果把计算工作负载放在印度的数据中心、并且服务的是海外客户,那么这部分收入可以享受免税待遇,一直持续到2047年。

    这个政策指向很明确——印度不只是想当AI技术的消费市场,更想成为支撑全球AI运算的基础设施提供方。电价相对便宜、土地成本不高、政府愿意给税收优惠,这几个条件加在一起,对算力密集的AI产业确实有吸引力。


    亚马逊没忘记自己的老本行

    除了云和AI基础设施,亚马逊在印度的零售和物流网络也在同步扩张。今年计划新开20多个履约中心,以及超过100个最后一英里配送站。主打快速配送的”Amazon Now”服务,正在推进到全国300多个城市和乡镇。

    这个赛道现在挺挤的。Eternal旗下的Blinkit、Swiggy的Instamart、Zepto,还有沃尔玛控股的Flipkart,都在抢即时配送这块蛋糕。Flipkart上周刚说要在2026年底前在全国开1500个微型履约中心,亚马逊这边的压力不小。

    从AWS到即时配送,亚马逊在印度的这笔130亿美元新投资,表面上是在跟上AI基础设施的全球竞赛,实际上也在为更长远的印度市场布局做准备。480亿美元会不会全部落地、什么时候落地,还得接着看。

  • Claude付费用户悄悄涨了75%,这家”企业向”AI公司正在撬动ChatGPT的消费者地盘

    很多人对Anthropic的印象还停留在”那是家做企业生意的公司”——开发者用Claude Code写代码,公司用它搭AI工作流,消费者市场?那是ChatGPT的地盘。

    一家做信用卡交易数据分析的公司Indagari,最近给出了不太一样的数据。他们分析了约2800万美国消费者的匿名信用卡交易记录,时间跨度从2025年到2026年5月10日,覆盖了订阅付费和API token购买。结论很直接:Claude在消费者端的付费用户,正在稳定增长。

    Claude与ChatGPT消费者市场竞争
    Claude正在消费者市场悄悄追赶ChatGPT

    增长从哪里来

    具体数字Indagari没有披露,但他们看到的趋势是”持续向右上方走”。自2026年1月以来,Claude在这2800万人的样本里,付费消费者收入和用户数增长了大约75%。

    有意思的是,这个增长在三月份还经历过一次跳涨——当时Anthropic公开拒绝让自家的模型被特朗普政府用于大规模监控美国公民和开发自主武器。这件事在消费者圈子里反而成了加分项,之后增长并没有回落,而是继续保持上行。

    Anthropic拒绝配合政府大规模监控这件事,反而让更多普通消费者愿意掏钱订阅Claude。在AI公司争相和政府合作的当下,这个选择挺少见的。

    学Claude的人越来越多了

    另一组数据来自在线教育平台DataCamp。他们有大约2000万用户,教的是AI技能和数据分析。DataCamp说,”Claude”现在已经是他们网站上被搜索次数最多的词,比”AI”这个统称还热门。

    在自费学习的消费者群体里,Claude相关课程的需求量是ChatGPT课程的3倍。过去30天里,Claude课程的需求增长了18倍。不过在企业客户那边,ChatGPT的课程仍然更受欢迎——公司出钱培训员工的时候,还是更认ChatGPT。

    ChatGPT还是老大,但差距在缩小

    当然,把Claude和ChatGPT摆在同一个量级上说,目前还为时尚早。Sensor Tower的数据很清楚:ChatGPT在各个平台上的总用户数和付费用户数,仍然远远领先。只是ChatGPT基数太大,近期的增长率相对平缓,而Claude从较小的基数往上走,增速看起来就更醒目。

    Indagari的数据也印证了这一点——ChatGPT的付费用户绝对数量还是更多,但Claude从消费者口袋里赚到的钱,2026年以来确实在快速追赶。


    麻烦事还没完

    就在数据看起来一片向好之际,Anthropic又碰上了美国政府这道坎。本月早些时候,美国政府禁止Anthropic向非美国公民提供其最强大的网络安全模型Mythos 5和Fable 5,原因是担心模型被滥用。Anthropic的应对是把这两款模型暂时全网下线,目前还没有明确何时恢复。

    这件事对消费者业务的影响目前还看不清楚。政府限制的主要是非美国用户的访问,对美国本土消费者的订阅意愿影响可能有限。而且Anthropic的企业和开发者用户数据也在继续增长,看起来并没有因为这场风波而受到明显冲击。

    眼下OpenAI和Anthropic都站在准备上市的门槛上,外界对这两家公司的业务健康度的好奇心比以往任何时候都强。从目前能拿到的各种数据来看,Anthropic在消费者市场的这波增长,可能不是昙花一现。

  • 拿下5000万美元融资,这家公司要用「数字世界」逼出AI Agent的真本事

    Patronus AI 数字世界测试
    Patronus AI 用”数字世界”测试AI Agent

    AI Agent这两年进化得越来越快,从最开始只能答答题,到现在能自主跑完一整套多步骤的复杂任务。但有个问题一直没人能很好地回答:你敢把自己的行程预订、财务分析交给一个还没被充分验证过的agent吗?

    模型厂商和做agent的创业公司心里也清楚,光拿个高分基准测试成绩说明不了什么问题——agent在实际场景里能不能把事做对,才是真正的考验。

    “数字世界”是个什么玩法

    2023年,两个前Meta AI研究员Anand Kannappan和Rebecca Qian创办了Patronus AI。他们的思路很直接:既然Waymo是通过先构建合成世界来测试自动驾驶汽车应对极端天气、小孩追球这些罕见危险场景的能力,那AI agent为什么不能用类似的办法?

    Patronus做的就是这件事:用他们称之为”数字世界模型(digital world models)”的技术,创建网站和内部系统的副本。agent在训练完后,会被扔进这些模拟环境里接受压力测试——强化学习会在这个过程中迭代:任务完成了给奖励,出错了给惩罚。

    Notable Capital的管理总监Glenn Solomon说,前沿AI实验室和很多新兴创业公司现在都是他们的客户,对模拟环境的需求几乎是”无法满足的(insatiable)”。

    为什么Patronus能拿到5000万美元

    营收数据说话:过去一年,Patronus的营收增长了15倍。这不是小打小闹的POC(概念验证),而是实打实的客户需求在推动。本周四,公司宣布完成5000万美元B轮融资,由Greenfield Partners领投,Notable Capital、Lightspeed、Datadog和三星跟投。加上这一轮,Patronus总融资额已经达到7000万美元。

    投资人看中的是这个赛道的刚需。AI agent有个很讨厌的习惯:走捷径。它们看起来好像把任务做完了,实际上偷工减料,结果就是任务没被正确完成。Solomon说:”Patronus特别擅长发现这些取巧行为,确保模型被追责。”


    目前做到哪一步了

    Kannappan说,目前主要聚焦在”可验证的问题”上——就是那些你能立刻检查对错的任务,比如软件工程和金融分析。但这远不是终点。”有很多领域是非常难以验证的”,他补充道。

    Patronus的长期目标是构建能让agent运行10小时、10天甚至10周的环境。这个野心不小——意味着他们要模拟的不只是单次交互,而是长时间的、开放式的任务执行过程。

    竞争对手方面,Patronus认为主要对手其实是各家AI实验室自己搭的评估团队。的确,OpenAI、Anthropic、Google这些大厂都在内部做模型评估。但Patronus的差异化在于:它做的是自动化评估,不需要人类参与。相比之下,Mercor和Surge这类依赖人类数据的公司,走的是另一条路。

    AI agent能不能真正被大规模投入使用,测试和评估是很关键的一环。Patronus拿到这笔钱之后,这个赛道估计会变得更热闹。毕竟,谁能证明自己的agent最可靠,谁就能在接下来的商业化竞争中占得先机。

  • OpenAI GPT-5.6 因政府要求限制发布,监管大幕刚拉开

    OpenAI GPT-5.6 政府监管
    OpenAI 最新模型 GPT-5.6 的发布受到美国政府限制

    OpenAI本周五证实,应美国政府要求,它正在把最新一代模型GPT-5.6的发布范围压缩到”一小群受信任的合作伙伴”。这件事的蹊跷之处在于,政府没有发正式禁令,而是”要求”企业自觉,企业也真的照做了。

    这一代GPT-5.6一共有三个型号:Sol是旗舰,Terra是日常使用的均衡版本,Luna则是速度更快、成本更低的选项。按理说Sol是OpenAI目前最强的模型,但特朗普政府把三个型号的发布全都限了。OpenAI的说法是,预览版只给那些”参与情况已与政府共享”的合作伙伴。

    特朗普政府这波操作不是孤立事件。此前Anthropic发布其最强公开模型Fable 5之后,政府直接下令禁止任何外国国民访问,导致Anthropic不得不把整个模型下线。

    政府到底要干什么

    前白宫AI顾问、即将入职OpenAI的Dean Ball说得很直白:特朗普最近签的那项行政令,要求特定AI公司在发布前最多30天把最先进的模型提交政府审查,这实际上是搞出了一个”事实上的非自愿许可制度”,对前沿AI实施了强力限制。

    Ball还指出一个更棘手的问题:政府并没有拿出明确的安全标准。这意味着什么?模型发布可能被无限期推迟。对中国来说这可能是好消息,对美国那些砸了几十亿美元建AI基础设施的公司来说,这简直是噩梦。

    OpenAI这次虽然照做了,但态度很明确:这不该成为长期默认做法。公司在周五的博客里写得很清楚:”我们不认为这种政府审查流程应该成为长期默认。它让用户、开发者、企业、网络防御者和全球合作伙伴都无法获得最好的工具。”

    GPT-5.6 Sol到底强在哪

    撇开监管风波不谈,GPT-5.6 Sol确实是OpenAI目前最强的模型。根据OpenAI的说法,Sol在编码、生物和网络安全方面的代理能力都有提升,还引入了”max”推理努力模式和”ultra”模式——后者用协调的子代理来解决高度复杂的任务(当然,你的token消耗量也会随之飙升)。

    OpenAI宣称GPT-5.6 Sol在几个基准测试中都表现优异,编码工作流甚至略优于Anthropic的Claude Mythos 5(没错,就是本月也被特朗普政府实际上禁掉的那款)。而且Sol的性价比更高——输出token用量只有Mythos预览版的三分之一。


    安全方面,OpenAI强调Sol搭载了目前最强大的安全堆栈,对对抗性攻击做了深度加固,而且故意优化为优先支持防御性网络安全工作,而不是进攻性渗透。换句话说,这个模型的设计目标就是难被越狱,同时优先教用户怎么防御攻击,而不是怎么入侵系统。

    OpenAI还学乖了——Anthropic的Fable 5当初就是因为过度谨慎栽了跟头。Fable 5上线那短短几天里,只要分类器检测到高风险话题(比如网络安全、生物、化学),它不光会拒绝提示词,还会偷偷把请求路由到一个旧模型。这种过度谨慎的流程和”暗箱降权”引发了大量误报和用户反弹。OpenAI这次把安全护栏直接内置到核心模型行为里,而不是靠上面叠一个独立过滤器。

    定价和开放时间表

    GPT-5.6三个型号的定价分了档:Sol是每百万输入token 5美元、输出token 30美元;Terra正好是一半;Luna则是1美元和6美元。OpenAI还改进了提示词缓存,让重复提示的成本更便宜、也更可预测。

    目前的限制只是”短期步骤”,OpenAI说接下来几周会让GPT-5.6走上更广泛应用之路,同时正与政府合作制定新的行政令框架,涉及网络安全,以及”未来模型发布的可重复流程”。

    话说回来,政府伸手管模型发布这件事,才刚刚开始。Anthropic的Mythos风波还没完全平息,OpenAI又被迫缩小发布范围,接下来轮到谁?谷歌?Meta?这场AI监管大戏,估计还有得演。

  • OpenAI联手博通九个月拿出第一颗自研芯片,Jalapeño能不能撼动英伟达?

    OpenAI联手博通九个月拿出第一颗自研芯片,Jalapeño能不能撼动英伟达?

    6月24日晚上,OpenAI在旧金山和帕洛阿尔托两地同步开发布会,亮出了一颗以墨西哥辣椒命名的芯片——Jalapeño。这是OpenAI成立九年来的第一颗自研芯片,从立项设计到成功流片,只用了九个月。

    OpenAI Jalapeño AI推理芯片
    OpenAI与博通联合发布的首款自研AI推理芯片Jalapeño,从设计到流片仅用时九个月。

    发布会现场,博通CEO陈福阳(Hock Tan)和总裁Charlie Kawwas把首批工程样片交到了OpenAI CEO山姆·奥特曼和总裁格雷格·布罗克曼手里。这个画面挺有象征意义的——一家靠算法和模型起家的AI公司,正式迈进了硬件领域。

    九个月做出一颗芯片,这是什么概念

    正常来说,一颗复杂AI芯片从设计到流片,周期通常是18到24个月。Jalapeño只用了九个月,部分原因是OpenAI自己参与了开发流程——AI帮工程师加快了某些设计工作。

    但更关键的是分工。OpenAI负责芯片的底层架构设计,博通负责硅片实现(代工制造)和网络硬件(包括Tomahawk交换芯片),加拿大电子制造服务商Celestica负责板卡与机架系统集成。这种分工模式让OpenAI能专注于自己最懂的部分——AI模型需要什么样的计算——而把制造和集成交给有经验的人。

    博通CEO陈福阳在接受路透社采访时说,Jalapeño的性能”可与英伟达Blackwell芯片和谷歌TPU相媲美”。他同时透露,这款AI加速器相比传统GPU可节省约50%的成本。

    专门优化的ASIC路线

    Jalapeño不是通用GPU,而是一款面向大语言模型推理场景量身打造的ASIC(专用集成电路)。与英伟达GPU相比,ASIC可编程灵活性更低,但可以针对AI专属任务做深度优化,成本优势显著。

    在架构上,Jalapeño重点优化了数据流,减少数据移动,让计算、内存与网络资源的配置更均衡,实际利用率更接近理论峰值。OpenAI硬件负责人理查德·何(Richard Ho)说,团队围绕”对前沿AI模型最为关键的内核、内存传输、网络以及服务模式”对架构做了全面优化。

    首批工程样片已经在实验室以量产标准的频率和功耗条件下稳定运行机器学习任务,还成功跑通了OpenAI今年2月推出的代码模型GPT-5.3-Codex-Spark。早期测试显示,Jalapeño的每瓦性能(能效比)将显著优于当前业界最先进水平。

    只供内部使用,不对外销售

    一个值得注意的细节:Jalapeño芯片和配套服务器系统均不会对外销售,只供OpenAI内部使用。配套服务器由天弘科技负责生产。

    这意味着OpenAI做这颗芯片,目的不是跟英伟达打擂台卖芯片,而是给自己建一条算力的”后路”——降低对英伟达GPU的依赖,同时压低自己的推理成本。

    这个策略不难理解。OpenAI每年花在算力上的钱是个天文数字,而且英伟达GPU并不总是那么容易拿到。能自己控制供应链,对OpenAI这样的公司来说,战略价值远大于财务账面上省的那点钱。

    部署时间表和后续规划

    按照OpenAI的规划,Jalapeño将在2026年底前开始小规模部署,2027年快速爬坡,2028年上半年实现全面规模化量产。远期规划总耗电量最高将达到10吉瓦,配套建设千兆瓦级数据中心集群。

    OpenAI把Jalapeño定位为”多代计算平台的首个里程碑”。布罗克曼说:”通过自主研发更多底层技术环节,我们可以用更高效率提供智能服务,持续推动前沿人工智能技术实现规模化普惠落地。”

    芯片发布也让人联想到OpenAI的IPO传闻。奥特曼最近表示,公司正考虑”在未来一年内”进行公开上市。Coinbase已经推出了与OpenAI相关的Pre-IPO期货。自己掌握芯片供应链,对于一家准备上市的公司来说,绝对是加分项。


  • 科技公司一边赚大钱,一边拿AI说事裁员——这波操作让整个行业都看傻了

    科技公司一边赚大钱,一边拿AI说事裁员——这波操作让整个行业都看傻了

    Oracle刚在监管文件中披露,过去12个月砍掉了21000个岗位,占全部员工的13%。公司说得直白:AI技术部署导致岗位减少,而且还会继续。这份6月22日提交的文件中,这句话安静地躺在密密麻麻的财务数据之间,却比任何公关稿都更能说明问题。

    2026年科技公司AI裁员潮
    2026年,科技公司一边公布创纪录的营收,一边以AI为由大规模裁员,这种分裂感让整个行业都感到不安。

    更要命的是,Oracle不是个例。2026年5月,科技行业单月裁员数量创下近年新高,而AI是头号理由——这是美国再就业公司Challenger, Gray & Christmas的统计结果。一边是财报上的营收新高,一边是HR系统里的裁员名单,这种分裂感让整个硅谷都弥漫着一种说不清的气氛。

    从GitLab到Meta,谁在拿AI开刀

    6月3日,GitLab宣布裁掉约350人,占员工总数14%。CEO Bill Staples的解释是:AI工作负载正在把竞争对手逼到墙角,公司要搞一场”代际级别的基础设施重建”,支撑他认为会增长100倍的需求。与此同时,GitLab第一季度营收2.64亿美元,同比增长23%。

    Google的情况更微妙。过去一年,Google Cloud部门悄悄裁人,包括威胁情报组和Mandiant相关的网络安全团队——而Cloud营收同比增长63%,首次突破200亿美元。过去12个月里,Google裁掉了超过三分之一管理小团队的管理者。公司从来没公布过一个总数字,裁员通过绩效评估、自愿买断和结构重组分批完成,外界估算2026年累计裁了1500到3000多名工程师。

    Intuit裁掉约3000人(占17%),CEO说是为了”降低复杂度,把资源重新分配到AI”。Meta裁掉约8000人(10%),同时把约7000人转进AI岗位——据说是他们很不情愿地进去了。

    Cloudflare的操作更绝。5月7日,公司裁掉约1100人(20%的员工),而当天公布的季度营收6.398亿美元,同比增34%,是公司历史上单季最高。CEO Matthew Prince后来写道,被裁的”绝大多数都是衡量者”——中层管理、财务、法务、内审、收入确认。AI直接让这些岗位变得多余。

    “AI让我裁员”这个说法,站得住脚吗

    TechCrunch在本月早些时候刊出一篇文章,标题直白——”AI裁员潮正在变成一个火药桶”。文章提出一个很多人私下在想的问题:这一轮裁员的真正原因到底是什么?

    一个无法忽视的事实是,这一大批被裁的岗位,有不少是在疫情期间大扩张时招进去的。2020到2022年,科技公司疯狂招人,觉得疫情催生的数字化趋势会永久持续。现在裁的,有不少就是当年招的。拿AI当理由,对外有个说法,对内也有个交代。

    但另一面,AI确实在改变工作方式。Coinbase裁掉700人(14%),CEO Brian Armstrong说AI让工程师”几天内完成过去一个团队几周才能做完的事”。Snap裁掉约1000人(16%),CEO Evan Spiegel给SEC的备忘录里写:AI进步让团队能够减少重复工作、提高速度。Block(Jack Dorsey的公司)更狠,直接裁掉4000人,员工总数从超过10000降到不足6000——Dorsey在X上写,AI工具正在从根本上改变构建和运营公司的方式。

    普通打工人该怎么看这波浪潮

    把这些数字加在一起:Oracle 21000、GitLab 350、Google约3000、Intuit 3000、Meta 8000、Cisco 4000、Cloudflare 1100、GM 500-600、Coinbase 700、PayPal约4500、Microsoft(自愿买断,人数未定)、Snap 1000、IBM 3000-9000、Atlassian 1600、Dell 11000、Block 4000、Salesforce 1000、Amazon 16000。加起来已经超过六万人。

    这还只是公开披露的部分。实际上,很多公司的裁员是通过”绩效评估”悄然完成的,外界根本无从统计。AI给了一个体面的说法:不是我们想裁,是技术在进步。

    对还在职的科技从业者来说,这波浪潮传递的信号很直接:会跟AI协作的人,留下;只做重复性工作的人,风险越来越高。这不一定是坏事,但确实是正在发生的事。