标签: AI

  • Google I/O 2026本周开幕,但真正值钱的不是Gemini 4.0

    模型版本只是开胃菜

    按约3到4个月一轮的节奏算,2月刚发布Gemini 3.1 Pro,这次I/O更可能看到Gemini 3.2或3.5。Gemini 4.0不是没可能,只是概率没那么高。对投资者来说,模型叫什么名字不重要,重要的是Gemini能不能进更多核心服务,比如Gmail、Maps,还有Genie 3、Gemma 4这些周边生态能不能跟上。

    Google还可能更新Gemini Health、Android XR智能眼镜,把旅行场景塞进Google Canvas。这些产品要是能拧成一个统一入口,Gemini就不再是聊天或者生成工具,而是变成操作层——这个定位比模型版本号值钱多了。

    过去两年,Google陆续推出Gemini 1.0 Pro、1.5 Pro、2.0 Flash、2.5 Pro、3 Pro和3.1 Pro。截至2026年一季度末,Google产品套件订阅用户达到3.5亿。

    AI搜索的算盘

    搜索依然是Google估值的核心。这次I/O最值得盯的是AI-O、AI-M和Gemini搜索体验怎么融合,还有Chrome在这个框架里站什么位置。Google管理层在一季度业绩会上提到,来自这些新入口的更长、更复杂查询,提供了更多基于意图的数据——这句话直接关系广告价值。

    传统上约20%的查询具备商业属性。如果AI搜索能让更多查询变成可识别、可匹配、可投放的商业意图,搜索广告的天花板就会往上走。对广告主来说,问题不在于AI功能是否先进,而在于同样CPA下能不能带来更多转化。

    一季度Google查询量创历史新高。2026年4月,Google全球搜索份额90.0%,环比增加10个基点。Chrome全球份额68.0%,环比增加130个基点。这些入口如果继续扩大,AI搜索的商业化基础会更稳。

    Gemini发布节奏相关配图
    Gemini模型迭代节奏(图源:网络)

    广告变现才是重头戏

    如果Google I/O回答”AI能力到哪里”,5月21日的Google Marketing Live就回答”AI怎么赚钱”。目前AI驱动的广告活动已经占搜索广告支出的30%以上,覆盖了AI Max、P-Max、Demand Generation等工具。

    AI Max将是GML上最关键的观察点。这个工具在2026年4月结束beta测试,计划在9月完全取代Dynamic Search Ads。早期结果显示,AI Max完整功能组合带来14%更多转化;通过更宽的搜索词匹配,在相近CPA下带来7%更多转化。

    • AI Max for Shopping、Search Campaigns for Travel等垂直优化工具正在推进
    • Ads Advisor提供代理式辅助,Smart Bidding Exploration在搜索活动中带来约27%更多转化
    • Campaign Total Budgets减少约66%的手动预算调整

    代理式购物瞄准交易闭环

    Google的购物业务正在从商品发现入口,向更深的交易链路延伸。UCP、Direct Offers、Agentic Checkout,以及Google Shopping和Chrome中的代理式购物体验,将是I/O和GML共同的观察点。这个变化不是简单增加购物按钮,而是减少从搜索、比较、选择到结账之间的摩擦。

    Google近期把合作伙伴扩展到若干大型电商公司,还有Meta、Microsoft、Stripe,之后又加入Klarna和Affirm。支付、分期、结账和广告投放如果被串联起来,Google Shopping的商业角色会更重。Chrome在全球68%的份额(美国50%)如果嵌入代理式购物和个性化推荐,Google将在搜索之外获得新的商业入口。

    云业务正在改写估值逻辑

    Alphabet过去的估值核心是搜索广告,但Google Cloud正在成为更重要的变量。一季度Google Cloud收入200.28亿美元,同比增长63.4%;backlog达到4623亿美元,环比接近翻倍,同比增长400.3%。同期token消耗环比增长60%。

    Google Cloud收入有望从2025年的587.05亿美元增至2026年的945.29亿美元,再到2027年的1465.21亿美元和2028年的2095.25亿美元。云业务在总收入中的占比预计从2025年的14.6%,升至2026年的19.5%,并在2028年达到30.6%。

    利润率同样在改善。Google Cloud 2025年经营利润率23.7%,2026年预计升至33.8%。这意味着云业务不再只是高增长板块,而是开始对Alphabet整体利润率形成支撑。I/O上,Gemini Code Assist、Google AI Studio中的”vibe coding”工具,以及TPU销售策略也值得关注。


  • YouTube把AI深伪检测工具开放给所有成年用户了

    YouTube把AI深伪检测工具开放给所有成年用户了

    YouTube这周把一个酝酿了挺久的功能正式推给了所有18岁以上的用户——”相似度检测”(likeness detection)。简单说就是,你给自己的人脸扫个描,YouTube就会帮你在平台上盯着,有没有人用AI换了你的脸做深伪内容。一旦匹配上了,平台会通知你,你可以选择要求删除那条内容。

    AI深伪检测示意图
    YouTube的AI深伪检测功能示意图 (图源:Cath Virginia / The Verge, Getty Images)

    这个功能之前已经分批推过几轮了——最早是给内容创作者用,后来扩展到政府官员、政客、记者,再后来是好莱坞的演艺人员。这次开放给所有成年人,意义不太一样:普通用户也能持续监控平台上有没有人冒用自己的脸了。

    YouTube过去说过,实际收到删除申请的数量”非常少”。但深伪技术的门槛越来越低,这条防线迟早得交给每个人自己手里。

    删除申请怎么审?

    YouTube按照自己的隐私政策来审核删除请求,主要看几个维度:内容是不是看起来很真实、有没有标注是AI生成的、能不能明确识别出某个人。当然也有例外——恶搞、讽刺类的内容不在删除范围内。目前这个工具只覆盖人脸相似度,声音这类其他特征还管不到。

    用户随时可以退出这个计划,YouTube会删除之前扫描留存的数据。


    为什么这事重要?

    深伪内容过去大多瞄准名人、政客这类公众人物,但普通人对数字分身技术的担忧也是真实存在的。有几个案例挺触目惊心:有青少年被同学用AI换了脸做成不当图片,还有三个青少年起诉xAI,说Grok给他们生成了儿童性虐待材料。

    YouTube在创作者论坛里低调宣布了这个消息,发言人Jack Malon说,只要年满18岁、有YouTube账号就能用,不要求你必须是”创作者”。不管是发了十年视频的老up主,还是刚注册的新用户,保护级别是一样的。

    这个功能能不能真正遏制深伪内容的蔓延,现在下判断还为时过早。但它至少给了普通用户一个工具,在AI生成内容越来越逼真的今天,这可能是平台能做的第一步。

  • OpenAI给ChatGPT加了个人理财功能,银行账号都能连

    OpenAI给ChatGPT加了个人理财功能,银行账号都能连

    OpenAI这周五在美国悄悄上线了一个新功能,让ChatGPT Pro订阅用户可以把自己的银行账户接进来,然后直接跟ChatGPT聊理财。这事说来也挺自然——毕竟现在每个月有超过2亿人在用ChatGPT问各种财务问题,OpenAI不过是顺水推舟,把这件事做得更专业一点。

    ChatGPT个人理财功能界面
    OpenAI官方发布的ChatGPT个人理财功能演示图

    背后的技术对接是跟Plaid合作的——这家公司专门做金融数据连接,支持超过12000家金融机构,包括Schwab、Fidelity、Chase、Robinhood、American Express、Capital One这些大家耳熟能详的名字。连上之后,ChatGPT会给你生成一个仪表盘,投资组合表现、花了多少钱、订阅了哪些服务、 upcoming要付的账单,一目了然。

    OpenAI一个月前刚收购了个人理财创业公司Hiro的团队,这家公司之前拿过Ribbit、General Catalyst这些顶级VC的钱。现在看来,这步棋下得挺准。

    怎么用?

    用法很简单。在侧边栏找到”Finances”点”Get started”,或者直接在对话里打字”@Finances, connect my accounts”,ChatGPT就会领着你走完Plaid的授权流程。OpenAI说接下来还会支持Intuit,到时候就能分析卖了一只股票对税务有什么影响、或者算算办某张信用卡批下来的概率有多大。

    想问什么问题都行,比如”我感觉最近花得有点多,是不是哪里变了?”或者”帮我做个计划,五年之内在我这个城市买上房”。GPT-5.5的推理能力比之前强了不少,处理这种需要结合上下文的财务问题比以前靠谱。


    隐私和数据怎么处理?

    OpenAI说断开某个账户的连接之后,同步过来的数据会在30天之内从ChatGPT里删掉。用户也可以随时去设置页面对话框里手动删除某段”财务记忆”。

    这件事其实反映了一个更大的趋势:通用的聊天机器人虽然什么都能聊,但一旦涉及到健康、财务、个人生活这些对数据敏感的话题,用户还是希望有个专门优化的产品。Anthropic之前也出了健康相关的工具,Perplexity这个月早些时候用自家的Computer agent做了一个金融研究产品。大家都看到了这个方向。

    目前这个功能只向美国的ChatGPT Pro用户开放,网页版和iOS都能用。OpenAI说会根据这批用户的反馈继续改进,之后再推给Plus用户。至于免费用户什么时候能用上,暂时还没有消息。

  • Cerebras上市首日暴涨108%:英伟达终于遇到对手了?

    一年前,恐怕没人相信Cerebras能走到IPO这一步。这家专门做AI芯片的创业公司,从设计巨型芯片开始就一直在跟英伟达硬碰硬,但因为阿布扎比公司Group 42的大额投资,被美国外国投资委员会(CFIUS)审查了个没完,上市计划一度搁浅。更别提当时它的财务状况——Group 42几乎贡献了全部营收,投资人看了都摇头。

    Cerebras Nasdaq opening bell
    Cerebras在纳斯达克敲钟 (图片来源: Nasdaq)

    财务数据大反转

    但剧情在2026年4月出现了大反转。Cerebras终于拿出了像样的财务数据:2025年营收5.1亿美元,同比增长76%,更厉害的是,净利润达到2.378亿美元——前一年还亏着近5亿美元呢。这一下,投资人的态度从”观望”变成了”抢着要”。

    Cerebras从亏损5亿美元到盈利2.378亿美元,只用了一年时间。这种反转在半导体行业堪称奇迹。

    IPO火爆程度超预期

    5月14日,Cerebras正式上市,IPO融资55亿美元。发行价定在185美元,远高于最初115-125美元的预测区间,后来还加码调到150-160美元,最后干脆185美元直接上。结果上市第一天,开盘价就飙到385美元,涨幅108%,收盘价也有311美元。

    • IPO融资额:55亿美元
    • 发行价:185美元/股
    • 开盘价:385美元/股(+108%)
    • 收盘价:311美元/股
    • 公司估值:660亿美元

    创始人身价暴涨

    创始人兼CEO安德鲁·费尔德曼手里的股份,按185美元/股算就值近19亿美元;联合创始人兼CTO肖恩·李也有大约10亿美元。要是按超过300美元的价格算,这俩人的身价还得再翻一番。

    Cerebras现在的主要客户包括OpenAI、G42、沙特阿卜杜拉国王科技大学,还有亚马逊的AWS。它做的是推理芯片(inference chips),这个市场现在确实挺热的,毕竟训练完模型总得有人跑起来嘛。

    不过,Cerebras能不能真的从英伟达嘴里抢到肉,还得再看几个季度的表现。毕竟英伟达不是吃素的,而且现在做AI芯片的公司也不止它一家。但至少从现在的市场反应来看,投资人觉得Cerebras有戏。

  • OpenAI换帅?布罗克曼重回产品一把手,ChatGPT和Codex要合并了

    OpenAI这几天又有人事大动作。据Wired报道,联合创始人兼前总裁格雷格·布罗克曼正式接掌公司的产品战略大权。这次调整其实早有苗头——自从负责AGI部署的CEO菲吉·西莫因医疗休假离岗后,布罗克曼就一直在临时接管产品工作,这次算是正式扶正了。

    Greg Brockman, OpenAI co-founder
    Greg Brockman,OpenAI联合创始人 (图片来源: Getty Images)

    ChatGPT和Codex要合并了

    布罗克曼在内部备忘录里说,他们要把ChatGPT和它的编程产品Codex合并成一个统一的体验。他的原话是:”我们正在整合产品努力,以最大的专注度执行迈向智能体未来,在消费者和企业市场都取得胜利。”听起来挺宏大的,但说白了就是要把聊天和写代码这两件事捏在一起做。

    智能体(agentic)未来是OpenAI现在押的最大赌注之一。合并ChatGPT和Codex,实际上是在构建一个既能对话又能执行代码的统一AI助手。

    奥尔特曼的”红色警报”之后

    这其实是去年底山姆·奥尔特曼拉响”红色警报”后一系列调整的延续。从那时候起,OpenAI就开始重新聚焦核心的ChatGPT体验,砍掉了一些”副业”——包括视频生成工具Sora和OpenAI for Science。与此同时,他们还在高调宣传要做一个AI”超级应用”。

    布罗克曼这次回归产品一线,意义不只是一次普通的人事变动。他可是OpenAI的元老级人物,这次重新执掌产品,很可能意味着公司要在”智能体”这个方向上押更大的注。毕竟,现在各家都在卷这个赛道,OpenAI也得拿出点真东西来。


    不过,OpenAI现在外面的麻烦也不少——官司、合作伙伴纠纷、竞争对手追赶,内忧外患都有。布罗克曼这次能不能把产品这条路走通,可能直接关系到OpenAI接下来几年的命运。

  • Runway 这家公司不服:凭什么 AI 的未来只能属于做语言的?

    如果你最近关注 AI 视频生成,应该听过 Runway 这个名字。这家公司做 AI 视频工具起家,现在估值 53 亿美元。但最近他们创始人出来讲了句话,大意是:现在所有主流 AI 实验室都在押注语言模型,我们觉得他们全押错了。

    这话挺狂的,但也有意思。

    Runway 的三位创始人,两个智利人、一个希腊人,在纽约大学 Tisch 艺术学院认识的,2018 年在纽约把公司搞了起来。这跟典型的硅谷创业故事完全不一样——没有斯坦福背景,没有前谷歌员工,种子轮也没有几千万美元让他们先烧着玩。

    他们认为语言不是 AI 的终点

    现在 AI 圈子基本建立在一个前提上:智能藏在语言里。你看 OpenAI 的 ChatGPT、Anthropic 的 Claude,全都是大型语言模型。但 Runway 不这么看。他们的联合创始人兼联席 CEO Anastasis Germanidis 说,语言模型是在整个互联网上训练的——留言板、社交媒体、教科书——说白了就是提炼现有的人类知识。

    “但要超越这一点,我们需要利用偏见更少的数据。”Germanidis 说。Runway 认为,下一代 AI 智能不会建立在文本之上,而是来自视频和世界模型——这些模型学习世界如何运作,而不只是人类如何描述世界。

    这个区别听起来很学术,但影响一点不小。如果 Runway 赌对了,那么 AI 的下一个大突破就不是更会聊天,而是更懂物理世界。

    Runway 创始团队
    Runway 创始团队(来源:TechCrunch)

    从帮人做电影到挑战 Google

    Runway 最早是干嘛的?让每个人都能成为电影制作人。他们在 2023 年 2 月发布了第一个视频生成模型——跟今天的产品比起来那时候的东西简直拿不出手——但这已经足够让他们在好莱坞站稳脚跟。他们的工具被用来做《瞬息全宇宙》这类电影,跟 Lionsgate 和 AMC Networks 都签了协议。

    现在 Runway 估值 53 亿美元,融资总额 8.6 亿美元(今年 2 月刚拿了 3.15 亿美元,AMD Ventures 和 Nvidia 都投了),2026 年第二季度新增了 4000 万美元的年度经常性收入,员工 155 人,办公室分布在纽约、伦敦、旧金山、西雅图、特拉维夫和东京。

    但他们不想只做视频生成。去年 12 月,Runway 发布了第一个世界模型,今年还打算再推一个。世界模型是能够足够好地模拟环境的 AI 系统,可以预测环境将如何行为。短期应用包括互动娱乐、游戏和机器人训练,长期的话——Germanidis 把世界模型视为”科学基础设施”。

    “如果我们能建造一个比人类科学家更好的科学家,我们就能加速我们理解宇宙和解决问题的方式。”这是 Germanidis 的终极目标——用世界模型来加速科学发现,甚至抗衰老研究。

    Google 是最大的威胁

    Runway 的赌注能不能成还远未确定,竞争对手也不会坐着等。Google 是 Runway 最大的威胁——Google 的 Veo 模型直接跟 Runway 的视频生成业务竞争,而 Genie 世界模型则瞄准了 Runway 正在争取的同一长期领域。

    还有其他资金雄厚的对手:Luma AI 融资 9 亿美元,由 AI”教母”李飞飞创立的 World Labs 融资 12.9 亿美元。OpenAI 融资约 1750 亿美元,母公司谷歌市值 4.86 万亿美元。光看钱,Runway 没有任何优势。


    但 Runway 的创始人认为,他们缺乏硅谷”标准配方”这件事反而给了他们优势。联合 CEO Cristóbal Valenzuela 说,他们没有那种湾区的关系网,必须更灵活;没有同龄人获得的那种战争资金,这使他们免于过早产生收入的压力。

    Valenzuela 说:”规则只是他们发明的规则。这就是我们在 Runway 做事的驱动力。他们说硅谷在这里,那就是创业公司该待的地方。为什么?这些只是编造的规则。把它们全部擦掉,重新开始。”

    这话听起来很理想主义,但也不是完全没有道理。AI 音频创业公司 ElevenLabs 就是一个例子——尽管缺乏 OpenAI 和谷歌的资源和人脉,但他们在自己的基准测试上表现优于两者。Runway 也许能走出一条类似的路。

    归根结底,这场赌局还在进行中。Runway 押的是:AI 的下一个大跃迁不会来自更好的语言表达,而是来自对物理世界更深的理解。如果他们对了,Google 和 OpenAI 可能都在朝着错误的方向狂奔。

  • OpenAI 让 ChatGPT 能连你银行账户了,这是要干啥?

    上周五 OpenAI 悄悄干了一件事:给美国的 ChatGPT Pro 用户推送了一套个人理财工具的预览版。简单说就是,你以后可以直接把银行账户接到 ChatGPT 里,让它帮你看看钱都花哪儿了,或者问问”我最近是不是开销变大了”。

    这事挺有意思的。OpenAI 找了 Plaid 合作——就是那个专门做金融账户连接的服务,你应该在某些 App 绑卡时见过它。通过 Plaid,ChatGPT 能连接超过 12,000 家金融机构,像 Schwab、Fidelity、Chase、Robinhood、Amex 这些大家熟知的都在里头。

    连上账户之后,你会看到一个仪表盘,投资组合表现、支出明细、订阅了哪些服务、有哪些账单要付——全都摆在面前。你可以直接问 ChatGPT:”帮我看看我最近花钱是不是有点猛,哪儿出问题了?”或者更具体的:”帮我规划一下,未来5年我想在这儿买套房,我现在该怎么做?”

    一个月前刚收购了一家理财创业公司

    这事不是拍脑袋想出来的。就在一个月前,OpenAI 把一家叫 Hiro 的个人理财创业公司团队给收了。Hiro 背后站着 Ribbit、General Catalyst 这些知名投资机构。OpenAI 说 Hiro 团队在金融领域的专业经验对推出这个产品很有帮助,但没细说是完全让他们来做的。

    OpenAI 透露,现在每个月有超过 2 亿人向 ChatGPT 问金融相关的问题。这个数字挺吓人的,说明大家已经开始把 AI 当理财顾问用了。

    新技术也让这事更靠谱了。OpenAI 说最新的 GPT-5.5 模型在上下文推理上强了不少,这对回答金融问题很关键。他们还跟金融专家一起搞了个基准测试,专门用来提升模型在个人理财问题上的表现。

    隐私怎么办?

    谈到钱的事,大家最担心的肯定是隐私。OpenAI 说你可以在”设置 > 应用 > finances”里断开某些账户的连接。一旦断开,同步的数据会在 30 天内从 ChatGPT 里删掉。你还可以在 finances 页面查看和删除金融记忆。

    ChatGPT个人理财功能界面
    ChatGPT 个人理财功能界面截图(来源:TechCrunch)

    目前这个功能只在网页端和 iOS 上向 Pro 用户开放。OpenAI 说会根据这些用户的反馈来改进产品,之后再向 Plus 用户开放。他们还计划很快支持 Intuit,到时候就能分析更多场景,比如卖出一只股票对税务有啥影响、申请某张信用卡通过的几率有多大。

    AI 公司都在做垂直专业产品

    这事背后有个更大的趋势。通用的聊天机器人什么都能聊,结果大家真就开始拿它问健康、金融、个人生活这些对数据特别敏感的话题。AI 公司也意识到了,开始针对这些领域做专业产品。

    OpenAI 和 Anthropic 都推出了健康相关的工具。就在本月早些时候,Perplexity 也基于它的 Computer agent 推出了自己的金融研究产品。大家都看出来了,通用模型是个入口,但真正能留住用户、产生价值的,是这些垂直场景的专业能力。


    把银行账户接进 ChatGPT,这件事听起来有点疯狂,但其实又挺自然的。你想想,大家已经在使用各种 App 连接银行账户来记账、做预算了,Mint、YNAB 这些工具早就这么干了。现在 ChatGPT 说”我也能干这个,而且我还能跟你对话,理解你的具体情况”,这对很多人来说可能比那些专业理财 App 更容易上手。

    当然,这事最大的挑战还是信任。你会把自己的金融账户交给一家 AI 公司吗?OpenAI 用 Plaid 来做连接,这是个聪明的选择——Plaid 在金融数据连接这块已经做了很多年了,用户对它也相对信任。但归根结底,这事能不能成,还得看 OpenAI 能不能真正保护好用户的数据,别再出什么数据泄露的岔子。

  • xAI密西西比数据中心运行46台无证燃气轮机,被环保组织告上法庭

    Elon Musk的xAI在密西西比数据中心跑了将近50台燃气轮机,而这些发电机组目前在该州处于监管真空——因为它们”坐在平板拖车上”,被密西西比州认定为”移动”设备,因此可以规避空气污染法规整整一年。NAACP代表当地居民提起了诉讼。

    xAI密西西比数据中心燃气轮机
    xAI密西西比数据中心现场的燃气轮机 | 图源:The Washington Post / Getty Images

    “移动”轮机的监管漏洞

    争议焦点正是这些轮机的”移动”性质。南方环境法律中心代表NAACP提起诉讼,认为联邦法律规定,即使安装在拖车上的发电机组也可能被视为固定污染源,须受空气污染法规监管。xAI的做法是利用了密西西比州对”移动”设备的豁免条款。

    NAACP表示,这些轮机无监管的排放正在恶化本就污染严重的区域的空气质量。本周NAACP向法院申请紧急禁制令,要求xAI停止违法排放。当地居民已经忍受了超过一年的未经许可的尾气排放。

    xAI目前已拿到其中15台轮机的许可,但实际运行的约有46台——且大多数没有任何空气许可。

    Colossus扩张的环保代价

    大孟菲斯商会此前发布的新闻稿称,2025年5月在运行的35台轮机中”大约一半”会留在现场。但xAI持续在安装更多。根据当地新闻Mississippi Today的报道,目前实际运行的是46台燃气轮机,且绝大多数没有空气许可。

    这件事的背景是xAI正在密西西比快速扩张其Colossus超算集群——这是训练Grok模型的核心基础设施。燃气轮机是临时电力方案,但通常一个大型数据中心的临时电力可能需要运行数年。环保组织担心这套”移动” loophole会被其他AI公司效仿。

    xAI没有回应置评请求。这场官司的结果,可能决定未来美国各地AI数据中心的扩展开路有多大。


  • Amazon Ring从40家供应商里挑中Vapi:这家AI语音初创公司如何估值冲上5亿美元

    Amazon Ring去年 holiday season 客服电话突然爆单,团队评估了超过40家AI语音供应商,最后选了一家叫Vapi的初创公司。结果今天,Ring的100% inbound来电都走Vapi平台。这笔部署直接帮Vapi拿下了Peak XV Partners领投的5000万美元B轮,投后估值约5亿美元。

    Vapi联合创始人Jordan Dearsley和Nikhil Gupta
    Vapi联合创始人Jordan Dearsley(左)和Nikhil Gupta(右)| 图源:TechCrunch

    从AI治疗师到估值5亿美元

    两个创始人Jordan Dearsley和Nikhil Gupta是滑铁卢大学的同学。最早他们其实做了一个AI治疗师——Dearsley想在每天散步时有个东西可以聊天。结果发现没多少人真的要这个产品,但不少初创公司对底层那个低延迟语音基础设施挺感兴趣。2023年他们干脆pivot,2024年Vapi平台正式公开发布。

    现在Vapi说已经处理了超过10亿通电话,目前每天跑100万到500万通,企业客户占大头。除了Amazon Ring,客户名单上还有Kavak、Instawork、New York Life、UnityAI、Cherry、Intuit。开发者平台也有超过100万开发者用过。

    “我们从小接受自助服务起家,在签下第一个大企业客户之前就已经在相当大的规模上被实战检验过了。”——Jordan Dearsley

    和Sierra、Decagon们有什么不同

    Dearsley说他们的差异化在于:不怎么搞预打包的应用,更多聚焦在语音Agent背后的基础设施和编排层。特别是那些希望对可靠性、合规性和模型行为有更大控制权的企业客户,Vapi给的粒度控制更细。

    这轮B轮除了Peak XV,还有微软的M12、Kleiner Perkins和Bessemer Venture Partners进场,Vapi总融资额现在到了7200万美元。目前年度经常性收入跑在”健康”的八位数,据投资者向TechCrunch透露。

    Vapi目前约100名员工,新资金主要用来扩工程、基础设施和市场团队。Dearsley有个有意思的比喻:”真正的难题是把模型这个不确定的野兽驯服,做到了就能给世界提供价值。”


  • ArXiv出手整治AI slop:论文里有幻觉参考文献?一年禁言套餐了解一下

    ArXiv上周悄悄更新了规则:如果你投的论文里有明显的AI生成痕迹,而且没经过认真核查,整个作者团队会被禁言一年。不是说论文不收,而是接下来12个月,你啥也投不了。

    什么是”AI slop”

    这个词最近在学术圈开始流行,指的是那些低质量、没经过验证的LLM生成内容。具体到ArXiv的新规里,有两类”铁证”会直接触发处罚:

    • 幻觉参考文献——引用根本不存在的论文,这是LLM的老毛病
    • 残留的LLM元评论——比如文章里出现了”这是200字摘要,需要我修改吗?”这种AI跟用户对话时才会说的话

    说白了,ArXiv的要求很简单:你可以用AI帮忙,但你必须对最终内容负责。如果连核对参考文献和删除AI废话都懒得做,那就别投了。

    ArXiv学术咨询委员会成员Thomas Dietterich在社交媒体上明确表态:如果存在”无可辩驳的证据”证明作者没有核查LLM输出,就会触发处罚。一年禁言期结束后,这些作者再投稿时,必须附上已被知名同行评审期刊录用的证明。

    为什么现在出手

    ArXiv是全球最大的预印本平台,每天接收几百篇论文。过去一年,随着ChatGPT、Claude这些工具越来越好用,大量未经人工核查的AI生成内容开始涌入。有些论文里的图表简直离谱——2024年有篇同行评审的论文,里面的老鼠解剖图睾丸大得不合常理,后来发现是AI生成的。

    更严重的是幻觉参考文献。有人用LLM生成相关工作总结,结果引了一堆不存在的论文,审稿人查不到,就稀里糊涂发表了。等真正去查那些参考文献的时候,才发现全是编的。

    ArXiv官网截图
    ArXiv更新投稿政策,严打AI生成低质内容(配图来源:Ars Technica)

    对学术圈意味着什么

    这个规定释放了一个信号:预印本平台开始认真对付AI垃圾内容了。过去大家默认ArXiv是个”先挂出来再说”的地方,同行评审靠后。但现在连ArXiv都受不了了,说明问题已经相当严重。

    对普通研究者来说,这个规定其实是好事。它划了一条底线:你可以偷懒用AI,但不能懒到连看都不看就投稿。那些真正认真做研究的人,本来就會核查参考文献、删除废弃的提示词残留,新规定对他们没影响。

    坏消息是,如果你真的被罚了,一年不能投稿ArXiv的代价不小。特别是对于赶毕业、赶 tenure 的研究者,这会直接影响学术生涯的节奏。


    AI写论文这件事,短期內肯定禁不掉。但ArXiv这份新规至少说清楚了一件事:你可以把AI当助手,但别把它当枪手。学术诚信的底线,还是得人来守。