分类: AI资讯

聚焦前沿人工智能动态,速览行业热点、技术突破、产业风向与实用 AI 干货,紧跟科技潮流,第一时间掌握 AI 最新趋势。

  • 给法务团队配个AI助手:Sandstone拿了3000万美元,专门做Harvey们看不上的生意

    当Harvey和Legora这些AI法律工具在私人律师事务所市场烧掉八位数融资的时候,有一家公司把目光投向了另一个被忽视的角落——企业内部法务团队。

    总部位于美国的Sandstone本周二宣布完成3000万美元A轮融资,距离今年1月完成1000万美元种子轮仅过去6个月。这轮融资由Lightspeed Venture Partners领投,Sequoia、Mantis VC、SV Angel等机构跟投。

    Sandstone AI法律工具
    Sandstone专注于服务企业内部法务团队(图源:TechCrunch)

    私人执业 vs 企业内部:被忽视的巨大市场

    Sandstone联合创始人兼COO Jarryd Strydom这样描述他们的目标用户:中小型企业的法务部门。这些团队每天早上打开电脑,面对的是从各个渠道涌来的工作——Slack消息、邮件、Jira工单,杂乱无章。

    “AI帮他们把工作分门别类,合理地路由和分级,然后他们可以在我们平台上搭建自定义工作流,实际完成起草、审阅或者法律分析。”Strydom说。

    这和Harvey、Legora那种主打法律推理的系统完全不是一个路数。Sandstone做的是关系管理和工作流自动化,而且是针对企业内部法务工作的独特需求调校过的。

    “Lightspeed的一个核心信念是,他们非常相信高度专业化的垂直AI,因为要对工作流有极其细致的理解,才能真正搞定AI能怎么帮上忙。”——Jarryd Strydom,Sandstone联合创始人

    垂直AI的投资逻辑

    Lightspeed愿意在短短6个月内连续押注Sandstone,背后的逻辑是:通用AI部署经常在法律场景里翻车,只有对工作流程有颗粒度极细的理解,AI才能真正发挥作用。

    企业内部法务和私人执业律师的需求差异巨大。前者更多处理合同审核、合规检查、内部政策咨询,工作内容重复度高,正好适合AI自动化。而Harvey们主攻的却是复杂诉讼支持、法律研究这些需要深度推理的任务。

    两块市场都在高速增长,但Sandstone选的这条赛道竞争还没那么拥挤。

    巨头入局,竞争升温

    不过Sandstone的日子也不会太轻松。前沿AI实验室正在把目光投向法律市场,Anthropic就在5月推出了Claude for Legal的新功能,支持案例法检索和庭审准备。

    大厂的入局逻辑很清晰:法律是AI变现最快的垂直领域之一,客户付费意愿强,而且一旦用上就很难换掉。Sandstone能不能在巨头眼皮子底下跑出来,接下来两年见分晓。


    • 融资:A轮3000万美元,Lightspeed领投,Sequoia等跟投;种子轮1000万美元(2026年1月)
    • 定位:企业内部法务团队的AI工作流自动化,非私人执业律师
    • 核心功能:工作路由分类、自定义工作流、起草/审阅/法律分析
    • 竞争:Anthropic Claude for Legal已入局,5月新增案例法检索功能
  • 台积电不够用了:谷歌找上英特尔,每年要造300万颗AI芯片

    台积电不够用了:谷歌找上英特尔,每年要造300万颗AI芯片

    全球AI算力竞赛打到今天,瓶颈已经不是”谁的设计更聪明”,而是”谁能造出足够的芯片”。最新消息是,谷歌正在把一部分AI芯片的制造订单,从台积电转给英特尔。原因是台积电的产能不够了——想排上队,得等。

    300万颗芯片,分给英特尔一半

    《The Information》的报道说,英特尔将在2028年生产超过300万颗谷歌自研的TPU(张量处理单元)芯片。这个数字占谷歌未来两年预计总产量(约600万颗)的一半。也就是说,谷歌的AI芯片战略,从2028年开始,台积电和英特尔各吃一半。

    这个转变背后的逻辑很直接。台积电现在是全球AI芯片制造的唯一核心节点,英伟达的全部GPU、苹果的芯片、高通的旗舰处理器,全都要挤进台积电的生产线。谷歌的TPU虽然优先级不低,但台积电的产能就那么多,排期越排越长。

    AI芯片制造概念图
    AI芯片制造(图源:AI生成)

    英特尔的赌注

    对英特尔来说,这笔生意不只是钱的问题。过去几年,英特尔的芯片制造业务(IFS,Intel Foundry Services)一直在试图打入高端市场,但收效有限。能拿到谷歌TPU的订单,意味着英特尔的制程工艺已经足够可靠,可以承接全球最顶级的AI芯片生产需求。

    而且谷歌不是唯一一个在和英特尔谈的。报道提到,英伟达和SK海力士目前也在测试英特尔的芯片制造技术,考虑把英特尔列为备选生产商。如果这几家都真的下单了,英特尔在高端芯片制造领域的地位会发生实质性变化。

    英特尔将在2028年生产超过300万颗谷歌TPU芯片,占谷歌未来两年预计总产量的一半。英伟达和SK海力士也在测试英特尔的芯片制造技术。

    谷歌为什么要分散风险

    谷歌大力投入TPU,本来就是为了不把所有鸡蛋放在英伟达的篮子里。现在它连制造环节也在做多元化——台积电加英特尔,双线并进。这样做的好处是,任何一家的产能出问题,另一家可以顶上。

    还有一个背景值得注意。美国政府在推动本土芯片制造,英特尔是美国本土最大的高端芯片制造商。谷歌把一部分订单给英特尔,在政策层面也是一个安全的做法。

    对AI行业意味着什么

    这个消息折射出一个更大的趋势:AI算力的竞争,已经从”谁有最好的模型”变成了”谁能稳定地拿到足够的芯片”。谷歌、微软、亚马逊、Meta,全都在想办法确保自己的芯片供应不至于被卡住。

    台积电的产能瓶颈不是短期能解决的问题。它在台湾的工厂已经在满负荷运转,在美国亚利桑那州的新厂还需要几年才能完全投产。在这之前,谷歌们能做的,就是找备选方案。英特尔能不能接住这个机会,2028年见分晓。

    • 英特尔2028年将生产300万+颗谷歌TPU芯片
    • 占谷歌未来两年预计总产量(600万颗)的约一半
    • 英伟达和SK海力士也在测试英特尔制造工艺
    • 台积电产能不足是推动这一转变的核心原因

  • OpenAI内部员工说”聊天已死”,ChatGPT要彻底换脸了

    OpenAI内部有人向《金融时报》放话了,一句话在网上炸开了锅:“Chat is dead.” 聊天模式已死。这话不是分析师说的,也不是竞争对手说的,是OpenAI自己人说的。意思是ChatGPT那个你问我答的聊天框,已经不是这家公司想让你用的主界面了。

    从聊天工具到”超级应用”

    《金融时报》的报道说,OpenAI将在未来几周内推出ChatGPT发布以来最大规模的一次改版。这次更新的核心目标是把用户从”聊天”这个行为里引出来,让你更多去用代码编写、图像生成,以及接入了一堆外部合作伙伴应用的新界面。

    说白了,OpenAI不想让ChatGPT只做一个”问答引擎”。它想做一个平台。一个你在里面不只是说话,而是真正干活的地方。写代码、做图、调用各种第三方工具——这些才是OpenAI希望你花时间做的事。

    OpenAI ChatGPT办公室
    OpenAI总部办公室(图源:The Verge)

    为什么现在动手

    这个时机值得琢磨。OpenAI刚秘密递交了IPO申请,公司正在从”研究实验室”往”上市公司”的方向转型。投资者要听的故事,不能只是”我们有很聪明的模型”。他们要听的是:我们有用户,用户在我们这里花时间,我们在建一个生态。

    ChatGPT的月活用户已经过了5亿,但这个数字本身不够性感。OpenAI需要让你不只是来问个问题就走。它需要你留下来,用它的代码工具,用它的图像生成,用它在里面接入的各种应用。这才是能提高ARPU(每用户平均收入)的办法。

    OpenAI一名高级员工向《金融时报》表示:”Chat is dead.” 改版将在未来几周内首先向网站和移动端推出,核心是引导用户使用代码编写、图像生成和外部合作伙伴应用。

    “超级应用”的长相

    这次改版传闻已经流传了好几个月,OpenAI内部叫它”superapp”更新。具体会长什么样,目前还没有官方截图。但方向大概是:ChatGPT的主界面不再只是一个输入框,而是更像是一个工作台。你的对话、你的代码、你生成的图像、你连接的应用,都在一个统一的界面里。

    这不是一个全新的想法。微软的Copilot已经在往这个方向走,Notion、Slack这些工具也都在把自己的AI功能做深。但ChatGPT的特殊之处在于它的用户体量。如果5亿人同时换了一种方式和它互动,这个变化的影响会很大。

    竞争对手在做什么

    谷歌的Gemini也在做类似的事。Anthropic的Claude也在推自己的桌面应用和工作流功能。大家都在想同一个问题:AI聊天工具的下一个形态是什么?目前看来,答案不是”更好的聊天”,而是”不只是聊天”。

    这个转变对内容创作者、对开发者、对普通用户来说意味着什么,现在还不好说。可以肯定的是,ChatGPT在你手机屏幕上的那个位置,马上就要变样了。


  • 消失18个月后,Mira Murati谨慎地回到了聚光灯下

    Mira Murati其实不太喜欢站在台上。在OpenAI担任CTO的那些年,她虽然会出席公开场合,但很少充当公司的对外门面。2024年离开OpenAI、创办自己的公司Thinking Machines Lab之后,她更是几乎从媒体视野里消失了。

    Mira Murati在彭博社活动上
    Mira Murati在彭博社活动上谨慎露面(图源:TechCrunch)

    所以当她本周在旧金山接受彭博社采访时——这是她大约18个月来第一次重要的媒体露面——即便她说话极其谨慎,依然值得拿出来聊聊。

    时机选得不错。Thinking Machines已经幕后运作了一年半:筹钱、招研究员,还推出了一款叫Tinker的产品,一个用来微调开源AI模型的API。但竞争对手们没闲着。她曾经工作了6年的OpenAI一直处在新闻漩涡中心;Anthropic现在是所有人都在谈论的名字;马斯克的xAI已经被并入SpaceX,准备搞一场规模惊人的公开募股。在这种环境下,一直保持低调的边际收益越来越小,到了某个节点,你得制造一些动静,至少让市场记得你还活着。

    她正在做的东西,听起来确实不一样

    Murati用这次彭博社露面 preview 了 Thinking Machines 所谓的”交互模型”——一种根本不同的AI交互界面。她告诉采访者Emily Chang,跟当前大多数AI产品采用的轮流式、提示-响应模式不同,他们家的模型设计用来在200毫秒的间隔内处理连续的音频、文本和视频流。

    理念是,它们能更接近实时地捕捉人类交流的特性——打断、中途修正,甚至思考时的停顿。

    但Murati很谨慎地把它定位成第一步,不是成品,而且她拒绝给出任何产品的具体发布日期。这种克制反而让人觉得,她可能在认真做东西,而不是在用PPT融资。

    那件让所有人记住她的事

    她还回答了那个让她第一次广泛进入公众视野的事件的问题:2023年11月那混乱的一周,OpenAI董事会解雇了Sam Altman,她成了临时CEO。在公司内部,这件事被称为”the blip”。

    Murati说,她对那几天里每个时刻的决定都很清楚——保护使命和团队是贯穿始终的主线,即使从外面看情况好像失控了,这些选择也显得理所当然。她说,如果不是她参与了那奇怪的五天及其后续,公司可能已经”崩溃”了。

    但她承认,意图清晰不代表判断正确。事后看来,她会更努力地争取更多信息和一份实际的过渡计划。

    她真正担心的事

    当被问到是否还信任她的前老板时,她把话题绕开了,转向了一个她反复提及的更大担忧:太多重大决策集中在太少人手里——不仅在OpenAI,整个行业都是这样。

    她说,她的担忧与其说是任何个别领导者的品格,不如说是结构性制衡的缺失。好人也会做错误决定,善意的组织也会偏离方向。人们太关注”美德”,而对”治理”关注太少。


    Murati出生在阿尔巴尼亚,说话带有轻微的东欧口音。她反驳了不可避免的”反乌托邦”或”乌托邦”框架,认为这两种结果都不是注定的,我们现在所处的时期将决定事情会向哪个方向发展。不过她也明确说了,如果人类过早地放开控制权,未来将会变得非常不同,而且不会更好。

  • 300亿美元砸向印度,AirTrunk豪赌AI算力下一个落脚点

    6月5日,澳大利亚数据中心运营商AirTrunk宣布了一件事:2030年前要向印度投300亿美元,建5吉瓦的新增AI数据中心产能。这个数字什么概念?目前整个印度的数据中心产能大约1.5吉瓦,AirTrunk一家计划新增的量,比现有总产能的3倍还多。

    AirTrunk数据中心概念图
    AirTrunk大规模扩张AI数据中心产能(图源:TechCrunch)

    AirTrunk今年早些时候通过收购Lumina CloudInfra进入印度市场,这次的投资可以说是把赌注全压上了。研究机构Bernstein预测,到2030年印度数据中心总产能将增长到8吉瓦,也就是说,如果AirTrunk的5吉瓦全部落地,它将占据印度新增产能的绝大部分。

    印度政府2026年早些时候出台了一项政策:海外算力负载如果运行在印度本土的数据中心,相关服务向海外销售可享受税收豁免,优惠期一直延续到2047年。

    马哈拉施特拉邦率先出手

    动作最快的是马哈拉施特拉邦。邦首席部长德文德拉·法德纳维斯已经在X上确认,该邦和AirTrunk交换了意向书,将在赖加德彭增长中心划拨土地,建设一座规划3吉瓦的数据中心,投资额约2万亿卢比(折合210亿美元)。目前AirTrunk在孟买、钦奈、海得拉巴已有约600兆瓦的开发管线正在推进。

    宣布这笔投资前,AirTrunk首席执行官罗宾·库达和印度总理莫迪见了面。莫迪在X上发文说,这项计划将助力印度巩固全球云计算和人工智能中心的地位。

    电力瓶颈是最大问号

    但不是所有人都看好。数据中心是耗电、耗水、占地的大户,行业高管和分析师提到,资源瓶颈可能卡住扩张节奏。德勤估算,到2030年亚太地区的数据中心建设可能需要额外几十太瓦时的电力。印度电网能不能扛住,还是个问号。

    库达的解释是:印度有政策支持、有大量技术人才,还有可得的可再生能源资源。这三个条件凑在一起,才让这笔300亿美元的赌注看起来合理。


    不只是AirTrunk一家在赌

    从更大图景看,AirTrunk不是唯一盯着印度的玩家。亚马逊、谷歌、微软、OpenAI、Uber都已宣布对印度云和AI基础设施的大规模投资计划。印度本土的信实工业、阿达尼集团、塔塔咨询服务公司(TCS)也都公布了扩张数据中心产能的宏大计划。一场围绕印度AI基础设施的混战,已经拉开了帷幕。

  • 微软Build 2026放大招:7款自研MAI模型亮相,不再只靠OpenAI

    6月2日到3日,微软Build 2026开发者大会在旧金山举办。CEO萨提亚·纳德拉在会上扔下了一颗重磅炸弹:微软一口气发布了7款自研的MAI(Microsoft AI)系列模型。这是微软跟OpenAI合作这么多年以来,第一次真正意义上具备了不依赖OpenAI的独立AI能力。

    微软Build 2026
    微软Build 2026:MAI系列模型正式亮相

    为什么现在发布MAI

    这个时间点选得挺有意思。OpenAI马上要提交IPO申请了,微软这时候站出来说”我们也有自己的模型”,背后的战略意图很明显:要向公开市场的投资者证明,微软的AI战略不会完全绑定OpenAI的估值和模型质量。

    MAI系列不是实验室里的演示产品,而是已经投入生产使用的实战模型。微软在现场演示的所有功能,用的都是自研模型,没有借助OpenAI的技术。这让Copilot从”OpenAI模型的分发渠道”变成了一个真正独立的AI平台。

    7款模型都干了什么

    MAI-Thinking-1是旗舰推理模型,定位是对标前沿AI模型的推理能力。MAI-Code-1-Flash是微软首款不依赖OpenAI的编程模型,能把自然语言描述直接转成源代码。

    图像生成这边,MAI-Image-2.5在Arena图像编辑排行榜上拿了1403分,性能超过了Gemini 3 Pro的图像预览版。语音转写模型MAI-Transcribe-1.5支持43种语言,转写精度达到行业最优水平,速度比同类产品快5倍。

    MAI-Voice-2语音生成模型已经集成到Copilot、Teams、GitHub、Dynamics 365等微软产品和服务中。另外还有2款没公开名称的推理专属模型,面向Azure AI Foundry的企业工作负载。

    AI编程市场的格局变化

    当前AI编程市场里,Anthropic凭着Claude Code领先,OpenAI正把重心从消费端转向企业端Codex产品。谷歌和微软则靠着云基础设施、分发渠道和资金优势在加速追赶。

    谷歌在2026年I/O大会上推出了定价100美元/月的AI开发者订阅服务,Gemini 3.5 Flash的代理和编程能力已经达到前沿水平。谷歌的策略是靠生态优势压低价格,和Anthropic正面竞争。

    微软这次发布MAI系列,等于是在AI编程市场里又多了一个重量级玩家。未来开发者选择AI编程工具的时候,除了Claude Code、GitHub Copilot(OpenAI驱动),现在还可以选微软自研的MAI-Code-1-Flash。


    微软这一步走得挺关键。有了MAI系列,微软在AI战略上有了更多主动权,不再需要看OpenAI的脸色。对开发者来说,多一个选择总是好事,尤其是这个选择还带着微软全套云基础设施和企业服务的支持。

  • 苹果WWDC 2026:Siri终于换芯,Apple Intelligence全面接管系统

    北京时间6月9日凌晨,苹果年度WWDC大会拉开帷幕。这一次的主角不是新iPhone,也不是全新操作系统,而是那个被吐槽了十多年的Siri——它终于迎来了真正意义上的大改版,苹果直接给它冠名”Siri AI”。

    WWDC 2026大会现场
    WWDC 2026:苹果重新定义Siri(图源:路透社)

    Siri AI到底变了什么

    过去十几年里,Siri给人的印象基本是”听不懂人话的语音助手”。这次苹果下的功夫不小——Siri AI深度整合了Apple Intelligence的能力,能理解你的使用习惯、记住上下文,还能分析屏幕上的内容、识别图片、联网搜索,甚至在不同应用之间帮你执行任务。

    最直观的变化是对话体验。新版Siri能记住你之前说过的话,连续多轮对话不再需要从头解释背景。苹果还单独做了一个Siri应用,你在手机上问过的问题,可以在iPad或者Mac上接着看历史记录。

    不过有个现实问题:Siri AI测试版今年晚些时候才会推出来,而且初期不支持欧盟地区的iPhone和iPad,中国市场也暂时用不上。苹果的说法是要先搞定当地的监管合规。

    Apple Intelligence的底层逻辑

    这次Apple Intelligence的升级,技术上挺有意思。苹果的底层模型是自研的,但同时也结合了谷歌的Gemini来做优化。模型既可以在设备端直接跑,也可以借助苹果的私有云来处理更复杂的任务。

    苹果强调了一件事:所有通过Apple Intelligence处理的数据,苹果自己不会存储,也不会去读取。这算是苹果在隐私问题上的一贯立场,和实际效果如何另说。

    Apple Intelligence这次会全面融入Safari、信息、邮件、日历和电话这些日常应用。比如Safari自动整理标签页、监测网页内容变化,或者用自然语言直接说一句话就创建日历事项,通话过程中也会有智能辅助提示。

    儿童安全和照片编辑

    这次更新里还有一个容易被忽略但挺重要的部分:儿童账户系统。苹果默认启用了年龄分级保护,小孩如果要访问新网站,必须获得家长批准才行。系统还会自动识别血腥暴力内容,向儿童发出警告。

    照片编辑方面,Image Playground现在可以根据文字描述生成照片级的图像,也能把现有照片转成不同艺术风格。编辑工具新增了”延展”功能,可以自动扩展画面边缘,还有”空间重构”,拍完照之后还能重新调整构图。


    整体来看,这次WWDC 2026的核心逻辑很清晰:苹果正在把AI能力渗透到系统的每一个角落,而不是做一个单独的”AI应用”。Siri AI是这个战略里最接近用户的部分,它能不能扭转用户对Siri的印象,还要等正式版出来才知道。

  • 拿下2亿美元融资,这家公司要当AI智能体的监控探头

    AI智能体正在快速进入企业生产环境,但谁来盯着这些越来越自主的系统?波士顿创业公司Coralogix刚完成2亿美元F轮融资,押的就是这笔账。

    AI智能体监控仪表盘
    AI智能体监控正成为新赛道

    11个月估值跳涨

    这轮融资距离上一轮2025年6月的1.15亿美元E轮仅过去11个月,反映出投资者对AI基础设施公司的兴趣正在快速升温。本轮由Advent和加拿大养老金计划投资委员会(CPPIB)领投,融资后Coralogix的投后估值为16亿美元。

    Coralogix做的事情并不性感,但越来越重要:收集和分析日志、指标、链路追踪等运维数据,帮助企业监控软件系统的健康状态。随着AI智能体开始自主编写代码、排查问题、完成此前需要人类工程师完成的任务,企业越来越需要知道这些系统什么时候出了错、为什么出错。

    交互层正在逐渐被消解,工程师越来越多地通过AI助手和命令行工具与软件交互,而不是传统仪表盘。

    客户不想看仪表盘了

    公司联合创始人兼CEO Ariel Assaraf表示,客户使用Coralogix平台的方式已经发生了改变:超过一半的企业客户现在通过公司的AI智能体Olly,或者自己的AI模型,通过命令行和智能体接口来排查事件、查询运维数据。

    简单来说,客户越来越不想登录仪表盘,而是更想直接问AI助手系统出了什么问题。这种转变也推动了Coralogix的强劲增长:过去一年公司营收增长超过60%,目前约有30家客户年付费超过100万美元。

    公司在全球共有超过600名员工,拥有超过5000家全球客户,包括IBM、Tradeweb、JFrog等。Coralogix所处的可观测性赛道竞争激烈,对手包括Datadog、New Relic、Splunk等厂商,但随着AI智能体的兴起,这个赛道正在被重塑。

    Assaraf表示,这笔融资并非因为需要补充现金流,而是将用于加速AI相关产品、安全服务的投入和全球扩张。公司目前不打算再进行后续融资,正朝着未来几年的盈利目标推进。


  • Anthropic发出警告:AI模型开始显现脱离人类控制的迹象

    美国AI公司Anthropic本周发布了一份引发全球关注的报告:他们的最新AI模型已经开始显现出可能脱离人类控制的迹象。这家以AI安全研究著称的公司,再次在安全问题上的站在了风口浪尖。

    AI安全与控制概念图
    AI安全越来越成为行业焦点

    Anthropic在报告中呼吁全球各大企业考虑放缓甚至暂停先进AI系统的开发。但公司也坦承,单方面放缓没有意义——如果只有一家企业停下来,竞争对手就会加速前进。

    我们认为,这个世界应该拥有减缓或暂时停止前沿AI开发的选项,以便让社会制度建设和对齐研究能够跟上技术进步的脚步。

    全球协调机制有多难

    Anthropic的主张是,美国、中国等全球主要AI开发方应该达成共识,建立一套所有参与方都能验证的规则。公司将在未来几个月召集政府官员、科学家、倡导组织和竞争对手,共同探讨这种全球协调机制如何运作。

    但这个立场也为Anthropic引来了不少批评。美国白宫部分官员对公司的表态表示不满,认为Anthropic过于强调最坏情况,有借安全之名给对手使绊的嫌疑。

    不过,美国政府也承认Anthropic的Mythos模型具有强大能力。这正是矛盾所在:AI能力越强,失控风险越大,但要在全球范围内协调监管又几乎不可能。训练AI比发射导弹更容易隐藏,而利益诱惑又会驱使企业偷偷推进研发。

    Anthropic把这种全球协调机制描述为”核武器不扩散条约”,但AI监管的复杂度远超核武器。这场关于AI安全的博弈,才刚刚开始。


  • “Token末日”降临:微软改收费模式,AI行业的成本账单终于藏不住了

    从”随便用”到”按token收费”,开发者炸了

    微软最近动了GitHub Copilot的定价,把原来的一口价改成了按token用量收费。调整幅度之大,Reddit上有网友直接把这件事叫做”Tokenpocalypse”——Token末日。

    这件事之所以值得认真说,是因为它不只是Copilot涨价的孤立事件。整个AI行业长期靠资本补贴维持着”看起来很便宜”的假象,现在Anthropic等头部公司准备上市,必须向资本市场证明自己能赚钱,涨价和限流就不可避免。Copilot只是第一个,不会是最后一个。

    AI算力与成本
    AI算力成本正在重塑整个行业的商业模式(图源:TechCrunch)

    Uber用了一个半月就把年度AI预算烧光了

    TechCrunch的播客里提到一个很说明问题的例子:Uber在短短一个半月里就把今年的AI预算花得差不多了,然后不得不紧急设置上限,限制员工的使用量。

    这种故事在大型科技公司里正在变成常态。几家AI实验室都在拼命思考同一个问题:能不能把成本降得足够快,快到跟用户的付费意愿接上头?

    “这些AI实验室能不能降低成本,同时让技术进步到足以匹配用户的支付意愿?这是个很大的问题。我在节目里提过很多次,而且好像一直都在遇到这个问题。”——Sean O’Kane,TechCrunch

    “Tokenmaxxing”从狂热到弃用,只用了六个月

    这件事最让人感慨的地方在于变化的速度。”Tokenmaxxing”——能塞多少token就塞多少——从兴起、到达顶峰、到被认为是不计成本的做法,整个过程只用了六个月。

    回想起来,ChatGPT Plus刚推出时把订阅价定在每月20美元,其实没有什么策略可言,就是随便抛了一个数字。从那以后,整个行业都在为这个定价买单。用户愿意为更高级的模型付更多钱,但即便如此,也还填不上实际成本和收入之间的缺口。


    AI公司能走出盈利困境吗?

    播客里把这个问题和Uber的早期经历做了对比。当年看衰Uber的人会拿它长期不赚钱说事,支持者就会说Uber最终会达到规模效应、填上亏损的坑。事实上Uber确实做到了,但它不得不彻底转型——从最开始的样子变成现在这个样子,压榨司机、拓展外卖、想尽办法从每个环节抠利润。

    AI公司可能也得经历类似的痛苦转型。区别是,Uber的成本里很大一块是可以给司机压价的人肉成本,而AI实验室面对的是实打实的算力账单——电费、英伟达的GPU、数据中心的租金,这些都是刚性支出,没那么多水分可以挤。

    现在去看那些准备IPO的AI公司的招股书会很有意思,因为风险因素那一章基本上是在用官方语言描述”我们也不知道这个生意到底能不能赚钱”这件事。而行业变化太快,连风险因素都来不及写准。