分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • ChatGPT现在能连你的银行账户了,OpenAI把金融助手这件事做了

    ChatGPT现在能连你的银行账户了,OpenAI把金融助手这件事做了

    OpenAI在5月15日悄悄地给ChatGPT Pro用户推了一个新功能——个人金融仪表盘。简单说就是:你授权ChatGPT访问你的银行账户、信用卡、投资账户,它帮你分析花了什么钱、订阅了哪些服务、投资表现怎么样、接下来要付哪些账单。

    这件事的技术底层是Plaid——一家专门做金融账户连接的服务商。Plaid支持超过12,000家金融机构,包括嘉信理财、富达、大通、Robinhood、美国运通、第一资本这些主流平台。授权流程是标准的Plaid界面,不是OpenAI直接碰你的登录凭证。

    ChatGPT个人金融仪表盘截图
    ChatGPT个人金融仪表盘界面(来源:OpenAI)

    你能用它干什么

    官方给的例子挺接地气的。比如你问它”我最近是不是花多了,跟之前比有什么变化?”——它能拉取你近期的消费数据,给你一个对比分析。或者你说”我想在未来5年在我住的城市买房,帮我做个计划”——它会结合你的收入、支出、储蓄情况,给你一个分阶段的目标拆解。

    目前这个功能只向美国地区的Pro用户开放预览,网页端和iOS都能用。OpenAI说他们正在跟Intuit谈合作,后续如果接上了,就能做更复杂的事情——比如你卖了一笔股票,它帮你估算税务影响;或者你申请信用卡,它评估一下你的获批概率。

    OpenAI说,每个月已经有超过2亿用户向ChatGPT问金融相关的问题。所以这个功能某种程度上是把原本就大量发生的对话,升级成了能直接读取数据的版本。

    隐私这件事怎么处理

    金融数据是最敏感的个人数据之一,OpenAI在隐私说明上还是做了些功课。你可以在设置>应用>金融里面断开某个账户的连接,断开之后,同步过来的数据会在30天内从ChatGPT里删除。你也能单独删除某些金融相关的记忆。

    不过话说回来,把银行账户接进去这件事,对大多数人来说心理门槛还是挺高的。OpenAI也知道这点,所以先向Pro用户开放——这批用户对ChatGPT的信任度相对高,也更愿意尝鲜。等跑顺了,再向Plus用户推广。


    为什么现在做这件事

    这件事其实有个前奏:2026年4月,OpenAI收购了个人金融初创公司Hiro的团队。Hiro背后有Ribbit、General Catalyst这些顶级金融科技VC撑腰,团队在金融数据和AI的交叉上有不少积累。OpenAI说Hiro团队的专业能力对推出这个产品很有帮助。

    更大的背景是,AI公司们正在意识到:通用聊天机器人能回答所有问题,但用户在问健康、金融、个人生活这些敏感话题时,其实想要的是专门优化的产品。Anthropic已经推出了健康相关的工具,Perplexity这个月也发布了基于Computer agent的金融研究产品。OpenAI现在是直接把金融功能嵌进ChatGPT里。

    长期来看,这件事如果做成,ChatGPT就不只是一个聊天机器人了——它会变成你财务生活的数字管家。这个位置一旦站稳,用户的切换成本会非常高。

  • OpenAI砸40亿美元成立部署公司,顺便把Tomoro买了

    OpenAI砸40亿美元成立部署公司,顺便把Tomoro买了

    OpenAI这周干了件大事——掏了超过40亿美元,成立了一家专门帮企业落地AI的新公司。名字很直白,叫”OpenAI Deployment Company”。说白了,就是以前卖模型,现在直接派人到你公司里帮你把AI用起来。

    为了把这件事做成,OpenAI顺便把一家叫Tomoro的AI咨询公司给收购了。这家公司不是昨天才成立的——它2023年就跟OpenAI合作过,客户名单里有美泰、红牛、乐购、维珍大西洋航空这些大牌子。收购完成后,Tomoro大概150个资深AI工程师和部署专家直接并入新公司。

    Tomoro的团队不是来OpenAI总部坐班的——他们会被派驻到客户现场,跟企业各个团队一起工作,找AI能真正产生价值的地方。

    为什么要做这件事

    过去这两年,OpenAI在消费者端赚足了眼球——ChatGPT的周活用户数字每次财报季都是亮点。但企业端这边,Anthropic的Claude其实跑得更快。很多公司在评估”到底用哪家的基础模型”时,Claude在企业级场景里的口碑确实不错。

    OpenAI这次成立部署公司,摆明了是要补上这块短板。光有模型不够,得有人帮客户把模型真正用起来——做集成、做定制、做业务流程改造。这块市场,咨询公司(埃森哲、德勤)和技术服务商都在抢,OpenAI现在是自己下场了。


    钱从哪来,谁在背后

    这40亿美元不是OpenAI自己全出的。TPG领投,安宏资本(Advent)、贝恩资本、布鲁克菲尔德(Brookfield)作为联合牵头创始合作方一起进来。OpenAI持有多数股权并掌控运营——也就是说,这家部署公司是个合资企业,但OpenAI说了算。

    有意思的是,路透社上周还报道说,OpenAI和Anthropic分别跟私募股权机构成立了合资公司,正在谈收购更多帮企业做AI落地的服务商。这个赛道突然就热了——因为大家意识到,卖API调用次数这件事,天花板是看得见的。真正赚钱的是帮企业把AI嵌进业务流程里,那种合同是长期的、高黏性的。


    这对行业意味着什么

    这件事释放了一个挺明确的信号:AI大模型公司的竞争,已经从”谁的模型更强”转向”谁能帮客户真正把AI用起来”。模型能力会有差距,但这个差距在缩小。真正的壁垒是——谁有更多的工程师能派到客户现场,谁有更多的行业落地经验,谁能帮客户把AI变成业务流程里真正产生价值的东西。

    Anthropic之前在企业端跑得快,一部分原因是它的模型在代码生成、数据分析这些场景里确实好用,另一部分原因是它更早地在开发者生态上投入。OpenAI这次直接收购Tomoro、组建150人的部署团队,是在用”堆人”的方式快速追上。

    对那些正在犹豫”要不要上AI”的企业来说,这其实是个好消息——以后不光是买个模型回去自己折腾,大厂会直接派人来帮你做。当然,费用估计也不会便宜。

  • 这家公司帮70万创作者,把数据卖给AI实验室

    这家公司帮70万创作者,把数据卖给AI实验室

    过去几年里,创意市场和平台圈发现了一件事:他们手上握着的数据,是一座金矿。这些数据可以用来训练自己的AI模型,也可以授权给其他AI实验室换钱。

    Wirestock选了后者。

    Wirestock团队
    Wirestock团队(来源:TechCrunch)

    这家公司原本的业务是帮摄影师在Shutterstock等图库平台上分发和销售作品。2023年,他们转型成了数据供应商,现在向AI实验室提供图像、视频、设计资产、游戏和3D内容等数据集。

    “一开始,我们的很多交易只是卖现成的东西,比如我们现有的图库。但后来变成了大量定制内容数据的需求,这给创作者带来了新机会,平台就这样起飞了。”——Wirestock联合创始人兼CEO Mikayel Khachatryan

    70万创作者,4000万美元年营收

    Wirestock说平台已经签约了超过70万名艺术家和设计师,他们为数据收集完成各种任务,类似Fiverr平台上的自由职业者。

    公司周四宣布,已完成2300万美元的A轮融资,用于建设新的数据供应业务。这轮融资由Nava Ventures领投,谢丽尔·桑德伯格联合创立的SBVP、Formula VC、I2BF Ventures跟投。

    Khachatryan表示,Wirestock目前为6家最大的基础模型制造商提供多模态数据,但拒绝透露具体名称。他提到公司目前的年营收运行率为4000万美元,迄今已向贡献者支付了1500万美元。


    AI数据供应链的生意

    随着AI实验室竞相改进模型,对数据供应服务的需求极高。像Surge、Scale AI、Mercor这样的公司,凭借对不同类型数据集的需求,几乎在一夜之间建立了价值数百亿美元的业务。

    Wirestock想专注于为助力创意用例的模型提供数据,比如图像和视频生成。公司也在探索音频和音乐等其他模态。

    Nava Ventures创始人Freddie Martignetti说,他的基金一直在寻找在数据采购和精炼方面创新的初创公司。”我认为Wirestock对基础模型和超大规模计算服务商需要什么多模态数据有深刻理解,以创建更像人类的系统。我们论点的基石是,多模态数据将变得越来越重要,不仅是为了创建图像或视频,而是让模型完成现实世界的任务。”

    Wirestock目前有60名员工,将利用新资金招聘研发、工程和产品岗位人员。公司还在开发供AI实验室协作的企业级数据集软件。

  • 这家做AI视频的公司,想在世界模型赛道上赢过Google

    这家做AI视频的公司,想在世界模型赛道上赢过Google

    Runway可能是硅谷最不像硅谷公司的AI初创企业。没有斯坦福辍学生创始人,没有前谷歌员工光环,也没有动辄上亿美元的种子轮让他们有资本忽略营收。三个联合创始人里两个来自智利、一个来自希腊,在纽约大学Tisch艺术学院认识的,公司也诞生在纽约,不是帕洛阿尔托。

    但他们很可能成为当下最具影响力的AI公司之一——不是因为已经建成了什么,而是因为正在尝试构建的下一代技术。

    “我们本质上受限于自己对现实的理解。语言模型的训练数据是对现有人类知识的提炼,但要突破这个限制,我们需要利用更少偏见的数据。”——Runway联合创始人兼联席CEO阿纳斯塔西斯·杰曼尼迪斯

    押注世界模型,不走语言模型的老路

    过去几年,AI行业的主流假设是”智能存在于语言之中”。OpenAI的ChatGPT、Anthropic的Claude这些大火的大模型,都是这一思路的产物。但Runway和部分竞争对手押注了完全不同的方向:他们认为下一代AI智能不会从文本中诞生,而是来自视频和世界模型——这类模型学习的是世界的运行规律,而不只是人类描述世界的方式。

    Runway三位联合创始人
    Runway三位联合创始人(来源:TechCrunch)

    Runway成立于2018年,凭借视频生成模型和AI工具建立了行业声誉,旗下最新模型是Gen-4.5,用户可以通过文本提示生成可编辑的电影级内容。目前Runway的技术已经应用于电影制作人和广告公司的工作流,还与狮门影业、AMC电视网等大型媒体公司签署了合作协议。

    估值53亿,但真正的对手是谷歌

    Runway目前的估值为53亿美元,2026年第二季度公司新增了4000万美元的年度经常性收入。过去6个月里,公司已经将计划落地,业务从视频生成拓展至世界模型领域:2025年12月推出了首个世界模型,还计划2026年再推出一款新模型。

    但Runway并不是唯一一家走这条路线的企业,Luma、World Labs等初创公司也在做类似的事情,谷歌的Genie世界模型也指向了同一个方向。所有参与方追求的目标本质上是同一个:创造能够解决人类最棘手问题的AI。


    非典型背景,反而是优势

    Runway累计融资8.6亿美元,其中2026年2月完成了3.15亿美元的融资。这个融资规模和最直接的竞争对手Luma AI(9亿美元)、World Labs(12.9亿美元)大致相当。但Runway还要和OpenAI、谷歌等巨头竞争,后者在算力、资金上的优势非常明显。

    联席CEO巴伦苏埃拉说:”规则只是他们编造出来的。他们说硅谷就是初创公司该待的地方,为什么?那都是编造出来的规则。把所有规则都擦掉,重新来过。”这种不按常理出牌的文化,反而让Runway在巨头林立的AI赛道上找到了自己的位置。

  • 不用博士学位也能做药物发现?SandboxAQ把科学AI模型塞进了Claude

    制药行业有个公开的秘密:找到一种能上市的药,平均要烧10年、砸几十亿美元,而且大多数候选分子死在半路上。AI喊了好几年要改变这个游戏,但现实是:你还得是个计算化学博士才能用那些”AI工具”。

    SandboxAQ不这么想。这家从Alphabet拆分出来的公司(前谷歌CEO埃里克·施密特是董事长),刚刚把自己的科学AI模型直接塞进了Claude里。现在你跟Claude聊天,就能让它帮你跑分子模拟——不用写代码,不用搭服务器,甚至连”量子化学”是什么都不用太懂。

    SandboxAQ的AI模拟业务总经理Nadia Harhen说得很直白:”这是第一次在frontier大语言模型上部署frontier定量模型,用户可以直接用自然语言访问。”以前想用他们的模型?先自己搭一套数字基础设施吧。

    不是”更聪明的AI”,是”更好用的AI”

    行业里做AI制药的公司不少,Chai Discovery、Isomorphic Labs(DeepMind分拆的那家)都在卷模型精度。SandboxAQ选了另一条路:不卷模型,卷界面。

    他们的核心产品叫LQM(Large Quantitative Models,大型定量模型)。跟GPT-5.5或者Claude这些聊天模型不一样,LQM是基于物理规则建的,能跑量子化学计算、模拟分子动力学——说人话就是:它能在实验室造出分子之前,预测这个分子在真实生物环境里会怎么表现。

    SandboxAQ的AI药物发现可视化
    SandboxAQ将LQM集成到Claude中,让药物发现变得更易用 | 图片来源:Getty Images

    施密特押注的”定量经济”

    SandboxAQ已经融了超过9.5亿美元,业务线不止药物发现,还覆盖网络安全、AI模拟。他们的逻辑是:有些行业(生物制药、金融服务、能源、先进材料)加起来超过50万亿美元的”定量经济”,需要的不是聊天机器人,而是能处理科学计算的AI。

    LQM用真实实验室数据和科学方程训练,不是靠”读完整个互联网”来获得智能。这也是为什么它之前很难用——你得像操作一台高能物理实验室的设备那样操作它。

    现在跟Claude集成之后,药物研发人员可以直接问:”帮我找一个能结合这个蛋白质的分子候选者,要求口服生物利用度高。”Claude会调用LQM跑模拟,然后把结果用自然语言解释给你听。


    这事儿为什么重要

    AI制药喊了三四年,但真正落地的成功案例并不多。一个核心原因是:模型是给专家用的,专家不够用。如果SandboxAQ这条路走通了,药物研发(以及其他科学计算领域)的门槛会大幅下降——不只是速度更快,而是”谁都能做”。

    当然,现在说”制药行业要变天”还早。但至少,那些没有计算化学博士的小型生物科技公司,现在有机会用上跟辉瑞、诺华一个级别的模拟工具了。

    这大概是AI真正”民主化”该有的样子:不是让每个人都能生成一个漂亮的PPT,而是让每个研究者都能用上以前只有大药厂才用得起的工具。

  • Cerebras上市首日暴涨108%:AI芯片赛道跑出了2026年第一个超级IPO

    5月14日,AI芯片公司Cerebras Systems正式登陆纳斯达克,交易代码CBRS。这一天的表现,用”疯狂”来形容不为过。

    发行价定在185美元,远高于最初115-125美元的定价区间(后来上调至150-160美元,还是不够)。开盘价直接跳到385美元,较发行价暴涨108%。收盘价311.07美元,较发行价上涨68%,对应估值约660亿美元。

    这是2026年科技行业第一个大型IPO,而且一上来就给市场秀了一把肌肉。

    Cerebras纳斯达克敲钟仪式
    Cerebras在纳斯达克敲钟开业(图源:TechCrunch)

    Cerebras是谁?凭什么值这么多

    简单说,Cerebras是英伟达的竞争对手。它做了一件很硬核的事:造出了专门针对AI场景设计的大型芯片。这种芯片在AI推理(就是模型响应你提问时做的那些计算)上特别有优势。

    这家公司差点没上成市。2024年它首次提交IPO申请,但因为接受了阿布扎比G42集团的大额投资,被美国外国投资委员会(CFIUS)盯上了,审查拖了很久。再加上当时G42几乎贡献了它的全部营收,财务结构不太好看,IPO就搁置了。

    转机出现在2026年。更新财报后,投资者看到了一个完全不同的Cerebras:2025年营收5.1亿美元,同比增长76%;实现了2.378亿美元的净利润,而前一年还亏着近5亿美元。客户也拓宽了,不再只靠G42,现在包括OpenAI、亚马逊云科技(AWS)等。

    这个IPO为什么重要

    • 它证明AI芯片不只是英伟达一家独大,资本市场愿意给其他玩家机会
    • 它为其他想上市的AI产业链公司打了个样——只要财务数据够硬,市场会给出惊人的估值
    • 它反映出投资者对AI推理需求的长期看好,这块市场还远没到天花板

    Cerebras的CEO Andrew Feldman在上市当天的采访中说了一句话挺有意思:”用IPO募资来支持增长,这才是正确的方式。”看来他对公司的长期增长很有信心。至于这个信心能不能兑现,就看Cerebras能不能在英伟达的阴影下真正打出一片天了。

  • Anthropic悄悄把这家公司买了,OpenAI和Google都用过它的工具

    昨天(5月18日)有一桩收购案值得聊一聊——Anthropic把纽约初创公司Stainless收了。金额没公布,但The Information说超过3亿美元。

    Stainless是做什么的?简单说,它帮开发者自动生成和维护SDK(软件开发工具包)。你有个API,它能读你的API规范文件,然后自动生成Python、TypeScript、Kotlin、Go、Java等多个语言的SDK代码。更省心的是,当你的API变了,它还能自动更新对应的SDK。

    这件事最有意思的地方在于:Stainless的客户里,有OpenAI、Google、Cloudflare。

    为什么这家公司值3亿美元

    AI公司都在卷Agent(智能体),而Agent要能干活,就得能调用各种外部工具。这就需要一个好用的SDK,让AI系统能顺畅地跟外部软件对话。Stainless干的就是这个——它把”让AI连接工具”这件事变得极其简单。

    OpenAI、Google这些大厂都在用它的工具,说明这块确实是刚需。而现在,这个工具归Anthropic了。

    Anthropic打的是什么算盘

    收购完成后,Stainless会停止对外服务,也就是说OpenAI、Google他们以后没法继续用这个工具了。这对竞争对手来说是个不小的打击——毕竟换个SDK工具链不是一朝一夕的事。

    对Anthropic自己来说,Stainless的软件从Anthropic API上线第一天起就在支撑官方SDK的生成。现在直接收进来,等于把这套能力完全内化,以后基于Claude做开发的体验会更丝滑。


    这件事背后反映出的趋势是:AI公司之间的竞争,已经从模型能力卷到了开发生态。谁能给开发者提供更好用的工具,谁就能留住更多开发者,而这个战场上,Anthropic刚刚拿到了一张重要的牌。

  • Google I/O 2026今天开幕,Gemini 4.0要正面硬刚Claude






    Google I/O 2026今天开幕,Gemini 4.0要正面硬刚Claude

    美西时间5月19日10点(北京时间明天凌晨2点),Google I/O 2026将在山景城Shoreline圆形剧场开幕。这是谷歌连续第三年把开发者大会变成”AI发布会”——但你如果只盯着模型基准测试分数,可能会错过真正值得看的东西。

    Gemini 4.0:谷歌的”必须赢”时刻

    从上次Google I/O到现在,AI领域的叙事主导权基本被Anthropic和OpenAI轮着拿。Claude Opus 4.5在长上下文推理上碾压全场,GPT-5.5的数学能力又把Gemini 3.0挤到了第三。这次Gemini 4.0如果拿不出接近Claude Mythos Preview的成绩(GPQA 94.6%),谷歌今年在AI叙事上就又要当配角。

    外界预期Gemini 4.0会在多模态推理、Workspace集成深度、Agent可靠性这三个方向上发力。特别是Agent可靠性——这是企业客户愿意付钱的关键,也是谷歌云如果能把Gemini嵌进企业工作流的机会。

    外界预测Gemini 4.0的参数规模可能达到3万亿级别,但参数规模已经不是重点。重点是:它能不能在企业生产环境里稳定运行,而不是在 benchmark 上刷分。

    Android XR眼镜:谷歌的硬件”第三次尝试”

    谷歌在硬件上栽过的跟头太多了——Google Glass、Daydream、Pixelbook,每一个都曾是”下一代计算平台”。这次的Android XR眼镜,谷歌学聪明了:不搞封闭生态,拉上三星、Warby Parker、Gentle Monster、XREAL一起做。

    无屏版2026年就能买到,价格区间会很宽——从入门级到高端产品都会有。关键是交互:免提召唤Gemini,用眼动追踪+语音操作。如果体验能做到”戴上去就不想摘”,这可能是谷歌第一次在硬件上真正威胁到Meta Ray-Ban的位置。

    Aluminium OS:ChromeOS的”Android化”

    这个泄露了好几个月的”ChromeOS替代系统”,本质上是把Android的应用生态搬到一个更像桌面操作系统的壳里。16分钟的泄露上手视频显示:底部有dock、支持虚拟桌面、Android应用以窗口模式运行。

    为什么要做这个?因为Chromebook在教育市场站稳了,但在生产力市场完全打不过MacBook和Windows。Aluminium OS如果能让Android应用无缝在”类桌面”环境里运行,对谷歌来说是一个把Android生态优势延伸到笔记本电脑市场的机会。


    Google Cloud Agentic Toolkit:企业AI的”最后一公里”

    这部分可能是最容易被忽略、但实际影响最大的发布。Google Cloud Agentic Toolkit如果能在定价和API稳定性上给出明确承诺,很多企业客户会认真考虑把Agent工作流从AWS/Azure迁移到Google Cloud——前提是Gemini 4.0的企业级可靠性确实到位。

    PwC前几天刚宣布把Claude部署到全球几十万员工,用的就是Anthropic的Model Context Protocol对接企业数据。谷歌如果不能在I/O上拿出类似的”企业AI落地方案”,光有更好的模型也没用——因为企业客户要的是”能跑起来的方案”,不是”分数更高的模型”。

    该怎么看这场发布会?

    如果你期待谷歌在I/O上”一统AI江湖”,可能会失望。但如果你关心的是:Android能不能在AI时代继续保持30亿设备的生态优势、谷歌云能不能在企业AI市场分到更多蛋糕、Gemini能不能从”好用的研究工具”变成”能赚钱的生产工具”——这些问题的答案,会在接下来48小时内慢慢浮现。

    谷歌有什么?Android 30亿+设备、全球最完整的搜索数据、Workspace的2亿+企业用户。这些是所有竞争对手都没有的”地面部队”。AI的竞争已经从”谁的模型更强”变成了”谁的生态更大”——在这一局,谷歌手里的牌其实比大多数人想的好。

    📎 原文来源:综合自 Build Fast with AI (2026-05-18)、Google I/O 2026 前瞻报道


  • 普华永道把Claude塞进了全球几十万员工的电脑里






    普华永道把Claude塞进了全球几十万员工的电脑里

    5月14日,Anthropic和普华永道(PwC)宣布把战略联盟扩大到一个新量级——Claude要进全球几十万专业人士的工作流。这件事的意义不只是”又一家大公司用了AI”,它其实标志着企业级AI从”试点”正式走向”生产部署”。PwC计划先在美国培训并认证3万名专业人员使用Claude,然后推广到全球网络。

    为什么是现在?

    PwC美国CEO Paul Griggs说得很直白:”AI的对话已经从可能性转向执行。”这句话背后有个残酷的现实——企业买了AI工具,但80%的试点项目死在了PoC阶段,根本没上线。PwC这次不一样,它自己先当”客户零号”(Customer Zero),把Claude在内部跑通了,才推给客户。

    具体怎么跑通的?PwC先把Claude用在自己的财务流程里——会计分录、差异分析、RFP撰写、年度预算优化。这些场景跑顺了,才打包成方案卖给客户。这种”自己先吃狗粮”的路径,比那些直接卖AI咨询的公司靠谱得多。

    效率数据:从10周到10天

    PwC给出的数据是:在已上线的生产部署场景中,客户报告交付时间缩短最高达70%。保险承保周期从10周压缩到10天;安全事件响应从数小时降到数分钟;一个卡了几个月的HR转型项目,1周出原型,2个月完整上线。

    这些数字不是PPT上的数字,是PwC已经在跑的案例。Anthropic CEO Dario Amodei在声明里直接用了这些数字——保险承保10周变10天,安全任务从小时级降到分钟级。对AI公司来说,敢把客户的具体效率数据写进官方新闻稿,说明他们真的有信心。

    三个主攻方向

    PwC和Anthropic把这次数百亿级的合作拆成了三个主攻方向:

    • Agentic技术构建——用Claude Code给大企业交付生产级软件,周期从”季度”压缩到”周”。覆盖金融、制药、医疗、消费品等行业。
    • AI原生交易服务——重新设计并购尽调的全流程,让AI Agent配合交易团队工作,压缩从投资逻辑到价值捕获的周期。
    • 企业职能重塑——用AI原生运营模式重构财务、供应链、HR、工程等职能部门。这不是”加点AI功能”,是把整个职能的工作方式重来一遍。

    还有一个独立的业务单元叫”CFO办公室”,完全基于Claude构建,专门为客户的财务组织做转型。首批盯准的是银行、保险、医疗这些对准确性和可审计性要求极高的行业。

    Claude的全产品矩阵进场

    这次部署不是只用一个聊天窗口。PwC会把Claude的全产品矩阵都推进去:

    • Claude——通用AI助手,已经内置在PwC的内部助手ChatPwC里
    • Claude Code——给工程团队写代码、做主框架现代化
    • Claude Cowork——直接嵌进电子表格、文档、演示软件,通过Anthropic的Model Context Protocol连接企业数据

    为什么这件事值得关注?

    PwC这次的动作,本质上是把”AI咨询”从卖PPT升级成了卖”可运行的系统”。它成立了和Anthropic的联合卓越中心,还加入了Anthropic的1亿美元Claude合作伙伴网络——这个网络专门背书那些能帮企业把AI真正部署上线(而不是只做试点)的服务公司。

    对国内做AI to B的团队来说,这个案例值得仔细看。PwC的打法是:先自己把流程跑通,拿到可验证的效率数据,再打包成方案。这种路径虽然慢,但一旦跑通,客户的付费意愿和续约率会高得多。

    Anthropic这边也拿到了它最需要的东西——在金融、医疗、生命科学这些”准确性比炫技重要”的领域里,有PwC这种级别的系统集成商帮它铺渠道。Dario Amodei说Claude的定位是”企业操作系统而不是聊天机器人”,这次合作算是给这句话补上了落地的一课。

    📎 原文来源:Anthropic官方新闻 – PwC Expands Alliance with Anthropic(2026年5月14日)


  • GPT-5.5 Instant全面上线:ChatGPT默认模型升级,数学推理大涨24%

    OpenAI在5月5日把这周默认模型换成了GPT-5.5 Instant,替代了之前的GPT-5.3 Instant。这次升级不是小修小补——数学测试AIME 2025从65.4分拉到81.2分,多模态推理MMMU-Pro从69.2涨到76分。如果你用过GPT-5.3觉得数学推理还差点意思,这一版能感觉到明显进步。

    GPT-5.5 Instant 记忆功能更新
    GPT-5.5 Instant 新增记忆功能,可引用过往对话和关联Gmail账户(图源:OpenAI)

    幻觉率下降,但OpenAI没给具体数字

    OpenAI在公告里说GPT-5.5 Instant在法律、医疗、金融这些高风险领域的幻觉减少了,但没公布具体百分比。TechCrunch的报道也确认了这一点——知道它减少了,但不知道减少了多少。对比隔壁Claude时不时自己编造个引用来源,GPT-5.5 Instant这波升级至少在”不乱说”这件事上下了功夫。

    GPT-5.3 Instant的AIME 2025分数是65.4,GPT-5.5 Instant是81.2——这个跳跃幅度相当于从”能做对大部分”到”基本不会错”。多模态推理的提升同样显著,这意味着看图做题、理解图表这些能力也跟着涨了。

    新记忆功能有点东西

    这波更新最实用的功能,是GPT-5.5 Instant新增的记忆能力。模型现在可以引用你之前的对话记录、上传过的文件、甚至关联的Gmail账户内容来生成更个性化的回复。比如你之前跟它讨论过某个项目,下次接着问的时候它记得上下文,不用你重新介绍背景。

    • ChatGPT Plus/Pro用户:已可使用(网页版)
    • 移动端:即将推出
    • Free/Go Business/企业用户:未来几周内开放
    • 记忆来源可视化:用户可查看、编辑、删除记忆源

    默认模型这件事意味着什么

    ChatGPT的默认模型,全球有数亿人在用。把GPT-5.5 Instant设成默认,等于OpenAI在对用户说:这是目前综合体验最好的模型,不需要你手动切换。对比Anthropic那边要用户自己选Opus还是Sonnet,OpenAI的策略更直接——我帮你选好了,你就用这个。

    从GPT-5.3到GPT-5.5,中间隔了不到两个月。这个迭代速度说明OpenAI现在已经把模型升级做成了”持续交付”模式,而不是以前那种一年一次大版本的节奏。对开发者来说,这意味着API背后的模型能力在悄悄变强,但你不一定能感知到具体是哪天升级的。