博客

  • 被Apple封杀4个月,Replit终于重回iOS

    Vibe coding平台Replit的CEO Amjad Masad上周五在X上宣布:他们终于跟Apple”把事情谈妥了”,4个月来第一次推送了iOS更新。

    这事儿得从今年3月说起。当时Apple悄咪咪地封掉了Replit和其他一堆vibe coding应用的App Store更新权限,条件是必须改点东西——比如把AI生成的应用预览功能搬到浏览器里,不能在App内直接显示。

    Apple的要求很明确:vibe coding类应用必须调整功能,可能包括将生成的应用预览移至浏览器。这一限制并非只针对Replit,而是适用于所有同类应用。

    什么叫”vibe coding”?

    简单说就是用自然语言描述你想做啥,AI帮你生成代码,你几乎不用手写。Replit是这波浪潮里的明星产品,用户量涨得飞快。但Apple的App Store审核指南对这类”自动生成内容”的应用一直很谨慎,担心用户体验失控或者产生 inappropriate content。

    According to reports from The Information and TechCrunch, Apple’s restrictions weren’t just about Replit — they’d blocked updates for multiple vibe coding apps until they made the required changes.


    Replit做对了什么?

    Masad没细说具体改了啥,但按照Apple的要求,大概率是把”AI生成应用的实时预览”这个功能从App内移到了浏览器。用户在Replit App里写提示词,生成的代码和预览得通过Safari或者别的浏览器查看。

    这个妥协方案其实也说得通。App Store里塞个能自动生成完整Web应用的预览器,审核团队确实会担心:万一生成的页面有违规内容咋办?放到浏览器里,责任边界就清晰多了。

    这对vibe coding行业意味着什么?

    • Apple的态度很明确:你可以做vibe coding工具,但生成内容的展示方式得符合App Store规则
    • 其他vibe coding平台(比如Cursor、v0.dev的移动端)估计也在经历类似谈判
    • 对用户来说,体验会稍微麻烦点(要跳浏览器),但至少还能用
    • Replit能重新上架,说明Apple并不是要封杀这个品类,而是要”规范”它

    Masad在X上说”worked things out with Apple”的时候,语气挺轻松的。但背后这4个月的拉锯战,估计没那么愉快。好在结果不错——Replit的用户终于能在iOS上收到更新了。

  • ArXiv出手了:用AI写论文不检查?直接封号1年

    预印本平台ArXiv最近干了件大事。他们更新了 submission 政策——以后要是你的论文里出现”AI完全代写且没人工核对”的实锤证据,作者会被封号整整一年。

    这事儿说起来挺有意思。ArXiv那帮管理者(领导核心是计算机科学版块主席Thomas Dietterich)直接在X和Bluesky上发了公告,核心意思很明确:如果发现论文里有”无可争议的证据”证明作者根本没检查LLM生成的结果,那整篇论文的内容都不可信。

    “如果发现论文存在无可争议的证据表明作者未检查LLM生成的结果,这意味着我们无法信任论文中的任何内容。”——Thomas Dietterich,ArXiv计算机科学版块主席

    什么样的证据算”无可争议”?

    Dietterich说得很具体:幻觉参考文献(hallucinated references)、论文里残留的LLM提示词或对话记录,这些都属于”铁证”。一旦被发现,处罚很直接——1年内禁止向ArXiv提交任何论文,1年后再想投稿,必须先在有同行评审的知名期刊/会议上发表过才能解锁资格。

    Business research concept
    学术研究需要真实贡献,而非AI生成的”垃圾论文” (图片来源:Getty Images)

    注意啊,这政策不是”完全禁止用LLM”。人家说得清清楚楚:你可以用AI辅助写作,但必须对生成的内容”负全部责任”,不管内容是咋生成的。如果你直接从LLM复制粘贴了”不合适的语言、抄袭内容、偏见内容、错误、失误、不正确的参考文献或误导性内容”——那都是你的责任。

    执行方式:一次出局

    Dietterich跟404 Media说,这是”一次出局”(one-strike)规则。不过执行前得走流程:版主先标记问题,然后版块主席确认证据,最后才处罚。作者要是不服,也可以申诉。


    为啥现在管这么严?

    最近有同行评审研究发现,生物医学研究领域伪造引用的情况在飙升,大概率跟LLM的使用有关。其实不止科学家,好多人都被AI生成的假参考文献坑过。

    ArXiv这两年一直在跟”AI垃圾论文”斗智斗勇。之前就已经要求首次投稿的作者必须找个”有信誉的作者”背书,现在又出了这个1年封号的政策。再加上ArXiv刚从康奈尔大学独立出来变成非营利组织,筹钱能力更强了,估计后续还会有更多手段来对付AI slop。

    • 政策并非完全禁止LLM,而是要求作者对内容负责
    • “铁证”包括幻觉参考文献、残留的LLM对话记录等
    • 处罚:1年封号 + 后续投稿需先通过同行评审
    • 执行流程:版主标记 → 版块主席确认 → 处罚(可申诉)
  • Anthropic企业客户数逆袭OpenAI,Ramp数据揭示AI市场变天

    Ramp数据说了什么

    金融科技公司Ramp发布了最新AI指数,样本覆盖超过50000家使用Ramp的企业。结果有点出人意料:34.4%的参与公司正在付费使用Anthropic的产品,比例高于所有其他AI厂商;OpenAI的这一数字是32.3%。这是Anthropic第一次在这个统计里登顶。

    Ramp的经济学家Ara Kharazian解读说,Anthropic在金融、科技和专业服务这些高技术含量的行业里已经跑在前面。OpenAI倒是在更广的企业群体里还保持着领先,但差距正在缩小——而且缩小的速度比很多人预期的快。

    过去一年是Anthropic增长最猛的阶段之一。2025年5月的时候,只有9%的企业愿意为它付费,随后一年内这个比例往上窜了26个百分点。同一时期OpenAI的份额反而小幅下滑了1%。

    不止Ramp一家这么说

    这个结果不是孤例。OpenRouter的排行榜里,OpenAI最后一次在Anthropic前面还是2025年12月的事。从那以后,风向就开始变了。

    当然Ramp的数据有局限性——它只统计用Ramp的企业,不能代表整个市场。但五万家公司的样本量,参考价值还是有的。而且全市场采用AI产品的企业比例这一年增长了9%,说明饼在变大,但Anthropic抢到的份额更猛。

    Anthropic做对了什么

    Kharazian在他博客里说,他对Anthropic这个优势能不能长期保持持谨慎态度。但他也承认,这一年的增长已经证明Anthropic的路子走对了。

    策略说起来不复杂:先从技术型用户切入,把这群人的需求摸透、产品做到位,然后再借着Cowork这类工具往更广的用户群扩展。比起一上来就铺天盖地打广告,这种打法在To B市场反而更扎实——客户一旦用顺手了,切换成本不低。

    • 金融、科技、专业服务等高技术行业率先采用Anthropic
    • 产品执行力到位,技术型用户口碑传播效应明显
    • Cowork等协作工具降低扩展门槛,从专业用户向通用场景渗透

    OpenAI那边呢

    OpenAI并不是输了。它的用户基数更大、覆盖面更广,在很多人眼里ChatGPT仍然是AI的代名词。但企业采购决策越来越理性,不只是看名气,更看谁家模型在自己的业务场景里表现更好、价格更合理、API更稳定。

    Anthropic的Claude在这些维度上过去一年进步很快,尤其在长上下文处理、指令遵循和安全性上,很多企业用户给出了不亚于甚至超过GPT系列的评价。加上Anthropic在定价上比OpenAI更激进一些,企业客户用脚投票不难理解。


  • Google I/O 2026本周开幕,但真正值钱的不是Gemini 4.0

    模型版本只是开胃菜

    按约3到4个月一轮的节奏算,2月刚发布Gemini 3.1 Pro,这次I/O更可能看到Gemini 3.2或3.5。Gemini 4.0不是没可能,只是概率没那么高。对投资者来说,模型叫什么名字不重要,重要的是Gemini能不能进更多核心服务,比如Gmail、Maps,还有Genie 3、Gemma 4这些周边生态能不能跟上。

    Google还可能更新Gemini Health、Android XR智能眼镜,把旅行场景塞进Google Canvas。这些产品要是能拧成一个统一入口,Gemini就不再是聊天或者生成工具,而是变成操作层——这个定位比模型版本号值钱多了。

    过去两年,Google陆续推出Gemini 1.0 Pro、1.5 Pro、2.0 Flash、2.5 Pro、3 Pro和3.1 Pro。截至2026年一季度末,Google产品套件订阅用户达到3.5亿。

    AI搜索的算盘

    搜索依然是Google估值的核心。这次I/O最值得盯的是AI-O、AI-M和Gemini搜索体验怎么融合,还有Chrome在这个框架里站什么位置。Google管理层在一季度业绩会上提到,来自这些新入口的更长、更复杂查询,提供了更多基于意图的数据——这句话直接关系广告价值。

    传统上约20%的查询具备商业属性。如果AI搜索能让更多查询变成可识别、可匹配、可投放的商业意图,搜索广告的天花板就会往上走。对广告主来说,问题不在于AI功能是否先进,而在于同样CPA下能不能带来更多转化。

    一季度Google查询量创历史新高。2026年4月,Google全球搜索份额90.0%,环比增加10个基点。Chrome全球份额68.0%,环比增加130个基点。这些入口如果继续扩大,AI搜索的商业化基础会更稳。

    Gemini发布节奏相关配图
    Gemini模型迭代节奏(图源:网络)

    广告变现才是重头戏

    如果Google I/O回答”AI能力到哪里”,5月21日的Google Marketing Live就回答”AI怎么赚钱”。目前AI驱动的广告活动已经占搜索广告支出的30%以上,覆盖了AI Max、P-Max、Demand Generation等工具。

    AI Max将是GML上最关键的观察点。这个工具在2026年4月结束beta测试,计划在9月完全取代Dynamic Search Ads。早期结果显示,AI Max完整功能组合带来14%更多转化;通过更宽的搜索词匹配,在相近CPA下带来7%更多转化。

    • AI Max for Shopping、Search Campaigns for Travel等垂直优化工具正在推进
    • Ads Advisor提供代理式辅助,Smart Bidding Exploration在搜索活动中带来约27%更多转化
    • Campaign Total Budgets减少约66%的手动预算调整

    代理式购物瞄准交易闭环

    Google的购物业务正在从商品发现入口,向更深的交易链路延伸。UCP、Direct Offers、Agentic Checkout,以及Google Shopping和Chrome中的代理式购物体验,将是I/O和GML共同的观察点。这个变化不是简单增加购物按钮,而是减少从搜索、比较、选择到结账之间的摩擦。

    Google近期把合作伙伴扩展到若干大型电商公司,还有Meta、Microsoft、Stripe,之后又加入Klarna和Affirm。支付、分期、结账和广告投放如果被串联起来,Google Shopping的商业角色会更重。Chrome在全球68%的份额(美国50%)如果嵌入代理式购物和个性化推荐,Google将在搜索之外获得新的商业入口。

    云业务正在改写估值逻辑

    Alphabet过去的估值核心是搜索广告,但Google Cloud正在成为更重要的变量。一季度Google Cloud收入200.28亿美元,同比增长63.4%;backlog达到4623亿美元,环比接近翻倍,同比增长400.3%。同期token消耗环比增长60%。

    Google Cloud收入有望从2025年的587.05亿美元增至2026年的945.29亿美元,再到2027年的1465.21亿美元和2028年的2095.25亿美元。云业务在总收入中的占比预计从2025年的14.6%,升至2026年的19.5%,并在2028年达到30.6%。

    利润率同样在改善。Google Cloud 2025年经营利润率23.7%,2026年预计升至33.8%。这意味着云业务不再只是高增长板块,而是开始对Alphabet整体利润率形成支撑。I/O上,Gemini Code Assist、Google AI Studio中的”vibe coding”工具,以及TPU销售策略也值得关注。


  • YouTube把AI深伪检测工具开放给所有成年用户了

    YouTube把AI深伪检测工具开放给所有成年用户了

    YouTube这周把一个酝酿了挺久的功能正式推给了所有18岁以上的用户——”相似度检测”(likeness detection)。简单说就是,你给自己的人脸扫个描,YouTube就会帮你在平台上盯着,有没有人用AI换了你的脸做深伪内容。一旦匹配上了,平台会通知你,你可以选择要求删除那条内容。

    AI深伪检测示意图
    YouTube的AI深伪检测功能示意图 (图源:Cath Virginia / The Verge, Getty Images)

    这个功能之前已经分批推过几轮了——最早是给内容创作者用,后来扩展到政府官员、政客、记者,再后来是好莱坞的演艺人员。这次开放给所有成年人,意义不太一样:普通用户也能持续监控平台上有没有人冒用自己的脸了。

    YouTube过去说过,实际收到删除申请的数量”非常少”。但深伪技术的门槛越来越低,这条防线迟早得交给每个人自己手里。

    删除申请怎么审?

    YouTube按照自己的隐私政策来审核删除请求,主要看几个维度:内容是不是看起来很真实、有没有标注是AI生成的、能不能明确识别出某个人。当然也有例外——恶搞、讽刺类的内容不在删除范围内。目前这个工具只覆盖人脸相似度,声音这类其他特征还管不到。

    用户随时可以退出这个计划,YouTube会删除之前扫描留存的数据。


    为什么这事重要?

    深伪内容过去大多瞄准名人、政客这类公众人物,但普通人对数字分身技术的担忧也是真实存在的。有几个案例挺触目惊心:有青少年被同学用AI换了脸做成不当图片,还有三个青少年起诉xAI,说Grok给他们生成了儿童性虐待材料。

    YouTube在创作者论坛里低调宣布了这个消息,发言人Jack Malon说,只要年满18岁、有YouTube账号就能用,不要求你必须是”创作者”。不管是发了十年视频的老up主,还是刚注册的新用户,保护级别是一样的。

    这个功能能不能真正遏制深伪内容的蔓延,现在下判断还为时过早。但它至少给了普通用户一个工具,在AI生成内容越来越逼真的今天,这可能是平台能做的第一步。

  • OpenAI给ChatGPT加了个人理财功能,银行账号都能连

    OpenAI给ChatGPT加了个人理财功能,银行账号都能连

    OpenAI这周五在美国悄悄上线了一个新功能,让ChatGPT Pro订阅用户可以把自己的银行账户接进来,然后直接跟ChatGPT聊理财。这事说来也挺自然——毕竟现在每个月有超过2亿人在用ChatGPT问各种财务问题,OpenAI不过是顺水推舟,把这件事做得更专业一点。

    ChatGPT个人理财功能界面
    OpenAI官方发布的ChatGPT个人理财功能演示图

    背后的技术对接是跟Plaid合作的——这家公司专门做金融数据连接,支持超过12000家金融机构,包括Schwab、Fidelity、Chase、Robinhood、American Express、Capital One这些大家耳熟能详的名字。连上之后,ChatGPT会给你生成一个仪表盘,投资组合表现、花了多少钱、订阅了哪些服务、 upcoming要付的账单,一目了然。

    OpenAI一个月前刚收购了个人理财创业公司Hiro的团队,这家公司之前拿过Ribbit、General Catalyst这些顶级VC的钱。现在看来,这步棋下得挺准。

    怎么用?

    用法很简单。在侧边栏找到”Finances”点”Get started”,或者直接在对话里打字”@Finances, connect my accounts”,ChatGPT就会领着你走完Plaid的授权流程。OpenAI说接下来还会支持Intuit,到时候就能分析卖了一只股票对税务有什么影响、或者算算办某张信用卡批下来的概率有多大。

    想问什么问题都行,比如”我感觉最近花得有点多,是不是哪里变了?”或者”帮我做个计划,五年之内在我这个城市买上房”。GPT-5.5的推理能力比之前强了不少,处理这种需要结合上下文的财务问题比以前靠谱。


    隐私和数据怎么处理?

    OpenAI说断开某个账户的连接之后,同步过来的数据会在30天之内从ChatGPT里删掉。用户也可以随时去设置页面对话框里手动删除某段”财务记忆”。

    这件事其实反映了一个更大的趋势:通用的聊天机器人虽然什么都能聊,但一旦涉及到健康、财务、个人生活这些对数据敏感的话题,用户还是希望有个专门优化的产品。Anthropic之前也出了健康相关的工具,Perplexity这个月早些时候用自家的Computer agent做了一个金融研究产品。大家都看到了这个方向。

    目前这个功能只向美国的ChatGPT Pro用户开放,网页版和iOS都能用。OpenAI说会根据这批用户的反馈继续改进,之后再推给Plus用户。至于免费用户什么时候能用上,暂时还没有消息。

  • Cerebras上市首日暴涨108%:英伟达终于遇到对手了?

    一年前,恐怕没人相信Cerebras能走到IPO这一步。这家专门做AI芯片的创业公司,从设计巨型芯片开始就一直在跟英伟达硬碰硬,但因为阿布扎比公司Group 42的大额投资,被美国外国投资委员会(CFIUS)审查了个没完,上市计划一度搁浅。更别提当时它的财务状况——Group 42几乎贡献了全部营收,投资人看了都摇头。

    Cerebras Nasdaq opening bell
    Cerebras在纳斯达克敲钟 (图片来源: Nasdaq)

    财务数据大反转

    但剧情在2026年4月出现了大反转。Cerebras终于拿出了像样的财务数据:2025年营收5.1亿美元,同比增长76%,更厉害的是,净利润达到2.378亿美元——前一年还亏着近5亿美元呢。这一下,投资人的态度从”观望”变成了”抢着要”。

    Cerebras从亏损5亿美元到盈利2.378亿美元,只用了一年时间。这种反转在半导体行业堪称奇迹。

    IPO火爆程度超预期

    5月14日,Cerebras正式上市,IPO融资55亿美元。发行价定在185美元,远高于最初115-125美元的预测区间,后来还加码调到150-160美元,最后干脆185美元直接上。结果上市第一天,开盘价就飙到385美元,涨幅108%,收盘价也有311美元。

    • IPO融资额:55亿美元
    • 发行价:185美元/股
    • 开盘价:385美元/股(+108%)
    • 收盘价:311美元/股
    • 公司估值:660亿美元

    创始人身价暴涨

    创始人兼CEO安德鲁·费尔德曼手里的股份,按185美元/股算就值近19亿美元;联合创始人兼CTO肖恩·李也有大约10亿美元。要是按超过300美元的价格算,这俩人的身价还得再翻一番。

    Cerebras现在的主要客户包括OpenAI、G42、沙特阿卜杜拉国王科技大学,还有亚马逊的AWS。它做的是推理芯片(inference chips),这个市场现在确实挺热的,毕竟训练完模型总得有人跑起来嘛。

    不过,Cerebras能不能真的从英伟达嘴里抢到肉,还得再看几个季度的表现。毕竟英伟达不是吃素的,而且现在做AI芯片的公司也不止它一家。但至少从现在的市场反应来看,投资人觉得Cerebras有戏。

  • OpenAI换帅?布罗克曼重回产品一把手,ChatGPT和Codex要合并了

    OpenAI这几天又有人事大动作。据Wired报道,联合创始人兼前总裁格雷格·布罗克曼正式接掌公司的产品战略大权。这次调整其实早有苗头——自从负责AGI部署的CEO菲吉·西莫因医疗休假离岗后,布罗克曼就一直在临时接管产品工作,这次算是正式扶正了。

    Greg Brockman, OpenAI co-founder
    Greg Brockman,OpenAI联合创始人 (图片来源: Getty Images)

    ChatGPT和Codex要合并了

    布罗克曼在内部备忘录里说,他们要把ChatGPT和它的编程产品Codex合并成一个统一的体验。他的原话是:”我们正在整合产品努力,以最大的专注度执行迈向智能体未来,在消费者和企业市场都取得胜利。”听起来挺宏大的,但说白了就是要把聊天和写代码这两件事捏在一起做。

    智能体(agentic)未来是OpenAI现在押的最大赌注之一。合并ChatGPT和Codex,实际上是在构建一个既能对话又能执行代码的统一AI助手。

    奥尔特曼的”红色警报”之后

    这其实是去年底山姆·奥尔特曼拉响”红色警报”后一系列调整的延续。从那时候起,OpenAI就开始重新聚焦核心的ChatGPT体验,砍掉了一些”副业”——包括视频生成工具Sora和OpenAI for Science。与此同时,他们还在高调宣传要做一个AI”超级应用”。

    布罗克曼这次回归产品一线,意义不只是一次普通的人事变动。他可是OpenAI的元老级人物,这次重新执掌产品,很可能意味着公司要在”智能体”这个方向上押更大的注。毕竟,现在各家都在卷这个赛道,OpenAI也得拿出点真东西来。


    不过,OpenAI现在外面的麻烦也不少——官司、合作伙伴纠纷、竞争对手追赶,内忧外患都有。布罗克曼这次能不能把产品这条路走通,可能直接关系到OpenAI接下来几年的命运。

  • Runway 这家公司不服:凭什么 AI 的未来只能属于做语言的?

    如果你最近关注 AI 视频生成,应该听过 Runway 这个名字。这家公司做 AI 视频工具起家,现在估值 53 亿美元。但最近他们创始人出来讲了句话,大意是:现在所有主流 AI 实验室都在押注语言模型,我们觉得他们全押错了。

    这话挺狂的,但也有意思。

    Runway 的三位创始人,两个智利人、一个希腊人,在纽约大学 Tisch 艺术学院认识的,2018 年在纽约把公司搞了起来。这跟典型的硅谷创业故事完全不一样——没有斯坦福背景,没有前谷歌员工,种子轮也没有几千万美元让他们先烧着玩。

    他们认为语言不是 AI 的终点

    现在 AI 圈子基本建立在一个前提上:智能藏在语言里。你看 OpenAI 的 ChatGPT、Anthropic 的 Claude,全都是大型语言模型。但 Runway 不这么看。他们的联合创始人兼联席 CEO Anastasis Germanidis 说,语言模型是在整个互联网上训练的——留言板、社交媒体、教科书——说白了就是提炼现有的人类知识。

    “但要超越这一点,我们需要利用偏见更少的数据。”Germanidis 说。Runway 认为,下一代 AI 智能不会建立在文本之上,而是来自视频和世界模型——这些模型学习世界如何运作,而不只是人类如何描述世界。

    这个区别听起来很学术,但影响一点不小。如果 Runway 赌对了,那么 AI 的下一个大突破就不是更会聊天,而是更懂物理世界。

    Runway 创始团队
    Runway 创始团队(来源:TechCrunch)

    从帮人做电影到挑战 Google

    Runway 最早是干嘛的?让每个人都能成为电影制作人。他们在 2023 年 2 月发布了第一个视频生成模型——跟今天的产品比起来那时候的东西简直拿不出手——但这已经足够让他们在好莱坞站稳脚跟。他们的工具被用来做《瞬息全宇宙》这类电影,跟 Lionsgate 和 AMC Networks 都签了协议。

    现在 Runway 估值 53 亿美元,融资总额 8.6 亿美元(今年 2 月刚拿了 3.15 亿美元,AMD Ventures 和 Nvidia 都投了),2026 年第二季度新增了 4000 万美元的年度经常性收入,员工 155 人,办公室分布在纽约、伦敦、旧金山、西雅图、特拉维夫和东京。

    但他们不想只做视频生成。去年 12 月,Runway 发布了第一个世界模型,今年还打算再推一个。世界模型是能够足够好地模拟环境的 AI 系统,可以预测环境将如何行为。短期应用包括互动娱乐、游戏和机器人训练,长期的话——Germanidis 把世界模型视为”科学基础设施”。

    “如果我们能建造一个比人类科学家更好的科学家,我们就能加速我们理解宇宙和解决问题的方式。”这是 Germanidis 的终极目标——用世界模型来加速科学发现,甚至抗衰老研究。

    Google 是最大的威胁

    Runway 的赌注能不能成还远未确定,竞争对手也不会坐着等。Google 是 Runway 最大的威胁——Google 的 Veo 模型直接跟 Runway 的视频生成业务竞争,而 Genie 世界模型则瞄准了 Runway 正在争取的同一长期领域。

    还有其他资金雄厚的对手:Luma AI 融资 9 亿美元,由 AI”教母”李飞飞创立的 World Labs 融资 12.9 亿美元。OpenAI 融资约 1750 亿美元,母公司谷歌市值 4.86 万亿美元。光看钱,Runway 没有任何优势。


    但 Runway 的创始人认为,他们缺乏硅谷”标准配方”这件事反而给了他们优势。联合 CEO Cristóbal Valenzuela 说,他们没有那种湾区的关系网,必须更灵活;没有同龄人获得的那种战争资金,这使他们免于过早产生收入的压力。

    Valenzuela 说:”规则只是他们发明的规则。这就是我们在 Runway 做事的驱动力。他们说硅谷在这里,那就是创业公司该待的地方。为什么?这些只是编造的规则。把它们全部擦掉,重新开始。”

    这话听起来很理想主义,但也不是完全没有道理。AI 音频创业公司 ElevenLabs 就是一个例子——尽管缺乏 OpenAI 和谷歌的资源和人脉,但他们在自己的基准测试上表现优于两者。Runway 也许能走出一条类似的路。

    归根结底,这场赌局还在进行中。Runway 押的是:AI 的下一个大跃迁不会来自更好的语言表达,而是来自对物理世界更深的理解。如果他们对了,Google 和 OpenAI 可能都在朝着错误的方向狂奔。

  • OpenAI 让 ChatGPT 能连你银行账户了,这是要干啥?

    上周五 OpenAI 悄悄干了一件事:给美国的 ChatGPT Pro 用户推送了一套个人理财工具的预览版。简单说就是,你以后可以直接把银行账户接到 ChatGPT 里,让它帮你看看钱都花哪儿了,或者问问”我最近是不是开销变大了”。

    这事挺有意思的。OpenAI 找了 Plaid 合作——就是那个专门做金融账户连接的服务,你应该在某些 App 绑卡时见过它。通过 Plaid,ChatGPT 能连接超过 12,000 家金融机构,像 Schwab、Fidelity、Chase、Robinhood、Amex 这些大家熟知的都在里头。

    连上账户之后,你会看到一个仪表盘,投资组合表现、支出明细、订阅了哪些服务、有哪些账单要付——全都摆在面前。你可以直接问 ChatGPT:”帮我看看我最近花钱是不是有点猛,哪儿出问题了?”或者更具体的:”帮我规划一下,未来5年我想在这儿买套房,我现在该怎么做?”

    一个月前刚收购了一家理财创业公司

    这事不是拍脑袋想出来的。就在一个月前,OpenAI 把一家叫 Hiro 的个人理财创业公司团队给收了。Hiro 背后站着 Ribbit、General Catalyst 这些知名投资机构。OpenAI 说 Hiro 团队在金融领域的专业经验对推出这个产品很有帮助,但没细说是完全让他们来做的。

    OpenAI 透露,现在每个月有超过 2 亿人向 ChatGPT 问金融相关的问题。这个数字挺吓人的,说明大家已经开始把 AI 当理财顾问用了。

    新技术也让这事更靠谱了。OpenAI 说最新的 GPT-5.5 模型在上下文推理上强了不少,这对回答金融问题很关键。他们还跟金融专家一起搞了个基准测试,专门用来提升模型在个人理财问题上的表现。

    隐私怎么办?

    谈到钱的事,大家最担心的肯定是隐私。OpenAI 说你可以在”设置 > 应用 > finances”里断开某些账户的连接。一旦断开,同步的数据会在 30 天内从 ChatGPT 里删掉。你还可以在 finances 页面查看和删除金融记忆。

    ChatGPT个人理财功能界面
    ChatGPT 个人理财功能界面截图(来源:TechCrunch)

    目前这个功能只在网页端和 iOS 上向 Pro 用户开放。OpenAI 说会根据这些用户的反馈来改进产品,之后再向 Plus 用户开放。他们还计划很快支持 Intuit,到时候就能分析更多场景,比如卖出一只股票对税务有啥影响、申请某张信用卡通过的几率有多大。

    AI 公司都在做垂直专业产品

    这事背后有个更大的趋势。通用的聊天机器人什么都能聊,结果大家真就开始拿它问健康、金融、个人生活这些对数据特别敏感的话题。AI 公司也意识到了,开始针对这些领域做专业产品。

    OpenAI 和 Anthropic 都推出了健康相关的工具。就在本月早些时候,Perplexity 也基于它的 Computer agent 推出了自己的金融研究产品。大家都看出来了,通用模型是个入口,但真正能留住用户、产生价值的,是这些垂直场景的专业能力。


    把银行账户接进 ChatGPT,这件事听起来有点疯狂,但其实又挺自然的。你想想,大家已经在使用各种 App 连接银行账户来记账、做预算了,Mint、YNAB 这些工具早就这么干了。现在 ChatGPT 说”我也能干这个,而且我还能跟你对话,理解你的具体情况”,这对很多人来说可能比那些专业理财 App 更容易上手。

    当然,这事最大的挑战还是信任。你会把自己的金融账户交给一家 AI 公司吗?OpenAI 用 Plaid 来做连接,这是个聪明的选择——Plaid 在金融数据连接这块已经做了很多年了,用户对它也相对信任。但归根结底,这事能不能成,还得看 OpenAI 能不能真正保护好用户的数据,别再出什么数据泄露的岔子。