作者: hiyoho

  • 苹果慢了三年,这次想把Siri重新发明一遍

    苹果慢了三年,这次想把Siri重新发明一遍

    苹果在AI这件事上已经落后好几年了。但有意思的是,这种”从后面追”的姿势,说不定反而是件好事。

    下周一(6月9日),苹果全球开发者大会WWDC 2026就要开幕。所有迹象都指向一件事:苹果准备重新把我们介绍给”新Siri”。之所以说”重新”,是因为我们其实在2024年就已经”见过”新Siri了——那时候苹果”发布”了Apple Intelligence,Siri换了个发光的边框,多了几个声音选项,还能把搞不定的问题甩给ChatGPT。至于当时承诺的那些真正的”智能”功能?没影的事。以至于苹果因为误导性宣传,正在和解一场集体诉讼,要给那些因为宣传买了iPhone的用户赔钱。

    有趣的是,苹果把球踢得这么烂,反而可能意外跌进了一个有利位置。

    Gemini已经赢了,但赢的方式让人发毛

    先把话说清楚:如果AI助手真的有场比赛,苹果正在惨败。Gemini现在能帮你叫Uber、点外卖、盯着你的日历提醒你什么时候该出发去机场。它把该做的都做了,而且做得挺好。Gemini赢了,赢得没毛病。

    但另一件事也在发生:人们对AI的不信任感正在上升,年轻人尤其明显。Gemini越强大,它就越让人觉得诡异。要让一个AI助手真正有用,它就得足够了解你——得看你的照片、读你的邮件、知道你儿子叫什么名字。我可以自愿把这些信息授权给Gemini,但每次它大声说出我儿子的名字,我还是会觉得后背发凉。

    我是测这些东西的,新功能出来我得试,算工作的一部分。但等到这些功能真的渗透到普通用户那里,大家的反应会非常有意思。

    苹果的新玩法:躲在Gemini后面

    据彭博社的报道,新版Siri将以某种方式和Gemini深度整合。苹果毫无疑问要为这个”特权”付一大笔钱。但这种”隔了一层”的架构,反而可能变成一种优势。

    你想想,现在哪家AI公司的名字是跟一个不受欢迎的超大规模数据中心项目绑在一起的?不是苹果。谷歌现在正忙着在全美各地匆忙开建巨大的数据中心,邻居们并不买账。苹果呢?它不用建这些设施——付钱给谷歌就好了,而那些钱预计会流去支撑谷歌的数据中心大扩张。苹果的双手,干干净净。

    WWDC 2024会场
    WWDC 2024:苹果”发布”Apple Intelligence的地方,两年后仍在兑现承诺的路上(图源:The Verge)

    Copilot的教训:别到处塞AI按钮

    还有Copilot这个前车之鉴。微软现在恨不得在每个文档里都塞一个”要我帮你总结一下吗?”的Copilot按钮,烦都烦死了。谷歌也没好到哪去——现在你打开任何一个谷歌家的App,都能迎面撞上Gemini的闪光图标,而且它出现的频率高到让人觉得,这玩意儿很快就会从”新鲜”变成”厌烦”。苹果这边呢,Siri现在的尝试性总结消息功能,顶多算”有趣”,更多时候是”烦人”——但至少它还没到处处都是的地步。

    这不是说苹果就一定做对了。我相当确定苹果真的很想让Siri帮用户写邮件、把照片做成”回忆”视频、还有关照一下院子里快枯死的植物。问题是Siri现在还做不到这些。所以这次WWDC上我们要见到的这个”Gemini增强版Siri”,它会出现在哪里、会以多激进的方式露面,将是整场发布会最值得看的地方。

    隐私牌,苹果最后的杀手锏

    我猜苹果会大打特打它最爱的那张牌:隐私。可以肯定我们会听到更多关于”私有云算力”(Private Cloud Compute)的说法,据说这东西能让你的数据像从未离开设备一样安全。新版Siri可能还会支持一段时间后自动删除聊天记录,而不是默认把所有对话都存下来。

    承诺一个更私密、更安全的AI体验,对那些一想到要把更多个人信息交给谷歌就犯怵的人,可能会有吸引力。但对于那些纯粹是受够了AI无处不在、无孔不入的人来说,这张牌也没多大用。


    优势这种东西,尤其是你莫名其妙跌进去的那种,来得快,去得也快。

    苹果完全可以把自己的AI慢节奏包装成”更负责任的推进方式”。谷歌的高管们以前也总把”大胆且负责任”挂在嘴边,但最近他们太忙着往外发新Gemini功能、在奇点山脚下晒太阳了,没空琢磨这个。把延迟发布说成”花时间把事情做对”,不是个坏赌注。但虚假启动的次数,已经用完了。Siri这次得真的做出来才行。像这样的第二次机会,不会再有第三次了。

    📎 原文来源:The Verge – Here comes new Siri again(作者:Allison Johnson,2026-06-06)
  • 阿里发了款新模型,价格只有Claude的一半,性能却差不多

    阿里发了款新模型,价格只有Claude的一半,性能却差不多

    5月20日的杭州阿里云峰会上,高级副总裁刘伟光说了一句挺有意思的话:”我们正在打造中国AI工厂。”台下的人可能还没意识到,这句话背后的分量——阿里不再满足于做开源模型的社区宠儿,它要直接和Anthropic、OpenAI在企业级市场正面刚。

    “我们在各基准测试中排名靠前,超过中国所有其他AI模型。”
    ——阿里云首席AI架构师 周静仁

    当天正式发布的Qwen3.7 Max,是阿里第一款闭源旗舰模型。这个转向值得玩味:过去两年,阿里靠开源的Qwen 3.5、3.6系列占据了大量开发者生态,现在它想把这套生态转化成真金白银的企业收入。


    数字摆出来,确实有点东西

    先说硬指标。Qwen3.7 Max的上下文窗口达到100万tokens,比上一代Qwen 3.6的25.6万tokens提升了近40倍。这意味着什么?你可以把一整本技术手册、一个中等规模代码库,一次性塞进模型的”工作记忆”里,不用再做切片和向量检索。

    人工分析智能指数(AA Intelligence Index v4.0)给Qwen3.7 Max打了56.6分,综合排名第5,是发布时排名最高的中国模型。排它前面的是GPT-5.5(60.2分)、Claude Opus 4.7(57.3分),分差在误差范围内。

    换成大白话:阿里这套模型,智能水平和Claude Opus 4.7差不多,但定价只有后者的一半。

    评测维度 Qwen3.7 Max Claude Opus 4.7 GPT-5.5
    AA智能指数 56.6(第5) 57.3(第4) 60.2(第1)
    Terminal-Bench 2.0 69.7 65.4(4.6基线) 未披露
    SWE-Bench Pro 60.6 57.3(4.6基线) 未披露
    输入定价(美元/百万tokens) 2.5 5.0 5.0
    输出定价(美元/百万tokens) 7.5 25.0 30.0

    定价是亮点,但实际成本有点猫腻

    标题说”价格只有Claude的一半”,指的是官方标价。但用起来是不是真的只要一半,这里有个坑。

    Digital Applied的评测发现,Qwen3.7 Max的输出冗余度极高。在AA智能指数评测中,它一共生成了9700万输出tokens,而对比组的中位数仅为2400万tokens——是中位数的4倍。换句话说,同样回答一个问题,Qwen3.7 Max可能会输出4倍长度的”废话”。

    按7.5美元/百万输出tokens计算,同等任务下Qwen3.7 Max的实际输出成本是中等冗余度模型的2.5倍。所以标价和Claude Opus 4.7的实际差距,远没有一半那么大。

    不过,阿里给了一个挺实在的折扣:缓存输入0.25美元/百万tokens(90%折扣)。对于智能体任务(重复调用相同系统提示词),这个折扣能把成本压得很低。


    智能体编程是真本事

    Qwen3.7 Max的核心卖点是”智能体(Agent)能力”。阿里在发布会上演示了一个35小时自主运行的编程任务:模型连续运行35小时,完成1158次工具调用、432次内核评估、5次架构重设计,最终把Triton内核的几何平均速度提升了10倍。

    这个演示还没被独立复现,但基准测试成绩是实打实的。Terminal-Bench 2.0(测试多步骤智能体工作流)得分69.7,SWE-Bench Pro(真实软件工程任务)得分60.6,MCP-Atlas(模型上下文协议适配)得分76.4,均领先对比组。

    更重要的是兼容性。Qwen3.7 Max支持OpenAI兼容和Anthropic兼容两种API规范,可以适配Claude Code、OpenClaw、Qwen Code、Hermes Agent等多款智能体框架。已经用上Claude Code的团队,无需重写框架就能切换调用。


    两个地方要注意

    第一个是幻觉率。Qwen3.7 Max的AA-Omniscience幻觉率为22.9%,是同期前沿模型中最低的,较上一代Qwen 3.6的44.2%大幅下降。但这个提升部分来自”弃答策略”:模型答题尝试率从67.3%下降至48.0%,超过一半的问题它会选择”不知道”而非给出答案。

    这意味着什么?如果你做的是智能体编程,答错比弃答危害更大,Qwen3.7 Max反而有优势。但如果你做的是RAG管道、法律或医疗问答这些需要高召回率的场景,它的弃答率会让你头疼,这类场景建议用DeepSeek V4 Pro或Claude Opus 4.7。

    第二个是开源权重。阿里已公布计划推出开源的Qwen 3.7 Plus轻量版,但截至5月25日,HuggingFace的Qwen组织下仅公布了Qwen 3.6及更早版本权重,暂未放出Qwen 3.7系列权重。需要自部署的团队,目前还得用Qwen 3.6系列或者DeepSeek V4 Pro。


    战略意图比模型本身更值得琢磨

    把Qwen3.7 Max放在更大的格局里看,这事的意义不止是一款新模型发布。

    过去两年,中美AI模型之间的差距,外界普遍认为是”一个迭代周期”——大概6到9个月。Qwen3.7 Max的AA智能指数和Claude Opus 4.7只差0.7分,基本在误差范围内。这意味着,中国前沿AI已经不再落后西方实验室一个迭代周期,差距正在收窄到同一代内的不同批次。

    阿里的全栈布局也在同步推进。模型(Qwen3.7 Max)+ 自研芯片(Zhenwu M890 AI加速器)+ 智能体框架,这套组合在地缘政治压力下有特殊的战略价值——即便买不到英伟达最新芯片,阿里也有一套自己可控的技术栈。

    对于企业用户来说,Qwen3.7 Max目前是通过阿里云模型工作室、OpenRouter、Together AI、Qubrid AI四个渠道访问。建议针对自身任务子集做基准测试,结合实际冗余度调整后的成本做路由决策,而不是只看官方定价。

  • 亚利桑那州要给数据中心涨价45%,这事在全美炸锅了

    亚利桑那州要给数据中心涨价45%,这事在全美炸锅了

    在索诺兰沙漠的郊区,一种新型建筑正在大量出现:没有窗户、全天候嗡嗡作响,耗电量相当于一座中型城市。随着微软等科技巨头不断扩张,亚利桑那州已成为全美最大的数据中心市场之一,而亚利桑那州公共服务公司(APS)也给出了AI时代最核心问题的答案——到底谁该为这些电力付费。

    “我们在这次电价申请中最重要的提议之一,就是将数据中心的电价提高45%,以确保它们会继续承担公平的份额。”
    ——APS监管合规经理 安妮·卡尔顿

    该公司向亚利桑那州公司委员会提交的文件给出的答案非常直白:对数据中心等”超大型能源用户”上调电价45%以上,同时普通居民用户电价上调约14.5%。2026年5月开始的听证会现场人满为患,民众反应强烈,有评论者称居民电价涨幅”对我们很多最脆弱的公民来说就是死刑判决”。


    AI如何打破了旧有的成本逻辑

    过去二十年,美国的电力需求基本处于平稳状态,能效提升抵消了需求增长。但AI彻底打破了这种平衡。Bloom Energy 2026年1月的报告预测,2025年至2028年,美国数据中心能源需求将接近翻倍,从80吉瓦跃升至150吉瓦——相当于仅用三年时间就新增了一个电力需求相当于西班牙的国家。

    联邦层面的数据同样惊人。劳伦斯伯克利国家实验室发现,2023年数据中心消耗了美国4.4%的电力,预计到2028年这一比例将升至6.7%至12%,用电量从176太瓦时增至325-580太瓦时的区间。高盛估计,仅为了跟上需求增速,到2030年可能需要约7200亿美元的电网支出。

    凤凰城正处于这场风暴的中心。和北弗吉尼亚、俄亥俄州中部、亚特兰大、爱荷华州一样,凤凰城是超大规模数据中心的聚集区,当地需求已经超过现有供电容量——这迫使全美所有公用事业委员会都要面对同一个问题:谁该为新建电厂和输电线路买单?


    其他州如何回应同一个问题

    亚利桑那州的案例只是全美120多起公用事业成本分摊争议之一。各州在隔离数据中心成本的力度上差异显著:

    • 俄勒冈州(PGE):大型负荷用户电价上调29%,居民用户电价下降1.3%
    • 宾夕法尼亚州(PPL):新增大型负荷电价类别,要求10年合同,居民用户电价上调4.9%(每月多付约184美元)
    • 弗吉尼亚州(Dominion):GS5类别用户电价上调约15.8%,居民用户电价下降3.4%(每月少付约5.52美元)

    最吸引眼球的数字是45%的涨幅,但更重大的变化是结构性的。公式电价和长期合同要求(宾夕法尼亚州PPL要求大型负荷签署至少10年的协议)正成为长期有效的政策工具。至少18个州已经出台法案,为大型能源用户设置专门的电价类别——真正的故事是,数据中心正在被制度化地划分为独立的用户类别。


    成本转嫁争议目前尚无定论

    当下的政治争议默认数据中心是由居民用户补贴的,但相关证据比舆论表述的更复杂。咨询公司E3 2026年的一份白皮书回顾了多项量化研究,发现没有证据表明,在全球最大的数据中心市场弗吉尼亚州,历史上存在数据中心向居民用户转嫁成本的情况;白皮书还指出,在合适的条件下,大型负荷实际上可以降低其他所有用户的电价。

    但这并不意味着居民用户的电费上涨是错觉。美国能源信息署(EIA)的数据显示,2025年居民电价上涨了11.5%,超过了通胀涨幅,部分预测显示到2030年涨幅可能高达40%。背后的驱动因素非常复杂:超期服役40年以上的老旧燃煤电厂、变压器成本上涨60-90%、极端天气下的电网加固工程,当然也包括大型负荷需求激增。

    因此,这场政策争议部分是关于未来的成本分摊,而非过去的补贴问题。APS提议的公式电价等工具——允许公用事业公司每年重新评估,将上涨的成本分配给导致成本上升的主体——目的是防止未来的电网建设成本落到居民电费单上,即便当前的成本还没有转嫁。


    为什么这个案例的影响超出了亚利桑那州

    亚利桑那州公司委员会的最终决定预计将在2026年底公布,其影响将远超凤凰城。这个五人委员会的决定将在中期选举年做出,其中两名委员面临连任,该州总检察长公开反对居民电价涨幅,称其为”明目张胆的”利润掠夺。

    这一事件的影响是全美性的,因为背后的张力存在于所有AI基础设施落地的地区。2026年初,科技巨头签署了一份不具约束力的白宫”用户保护承诺”,但消费者倡导者已经指控其他地区的公用事业公司试图悄悄将长期数据中心成本转嫁回居民用户,规避新法律。无论亚利桑那州批准还是否决哪种电价制定公式,都将成其他委员会可以引用的模板。

    对于AI行业来说,信号已经非常明确:廉价、无需质疑的电力时代已经结束。计算成本现在包含了电网本身的支出项,而且监管机构越来越倾向于把这笔支出放在数据中心的电费单上。

  • ChatGPT Retrieval Plugin:20k+ Stars!RAG鼻祖项目,让ChatGPT拥有外部知识

    ChatGPT Retrieval Plugin:20k+ Stars!RAG鼻祖项目,让ChatGPT拥有外部知识

    📦 项目简介

    chatgpt-retrieval-plugin 是 OpenAI 官方开源的 ChatGPT 检索插件模板,它是 RAG(检索增强生成) 领域的鼻祖级项目,让 ChatGPT 能够访问自定义数据源。

    这个项目展示了如何让大模型动态访问外部知识库,而不是仅仅依赖训练数据。它是现在所有 RAG 应用的”祖师爷”。

    ⚙️ 安装要求和过程

    环境要求

    • Python:3.8+(推荐 3.10+)
    • 向量数据库:Pinecone / Weaviate / Qdrant(任选其一)
    • OpenAI API Key:必需(用于 Embedding 和 ChatGPT)
    • 内存:建议 8GB+(本地测试可降级)

    快速安装步骤

    # 1. 克隆项目
    git clone https://github.com/openai/chatgpt-retrieval-plugin.git
    cd chatgpt-retrieval-plugin
    
    # 2. 安装依赖
    pip install -r requirements.txt
    
    # 3. 配置环境变量
    cp .env.example .env
    # 编辑 .env,填入你的 OpenAI API Key 和向量数据库配置
    
    # 4. 构建向量索引
    python scripts/process_docs.py
    
    # 5. 启动服务
    uvicorn server.main:app --reload --port 8000
    

    安装完成后,在 ChatGPT Plugins 模式中添加本地插件,指向 http://localhost:8000 即可。

    🔥 核心功能

    1. 向量检索(核心能力)

    将文档切片后转化为向量,存储到 Pinecone 等向量数据库。用户提问时,系统自动检索最相关的文档片段,注入到 ChatGPT 的上下文中。

    2. 递归爬取(数据接入)

    内置 scripts/process_docs.py 支持递归爬取网站内容(基于 BeautifulSoup),自动处理 HTML、PDF、Markdown 等多种格式。

    3. 元数据过滤(精准召回)

    支持为文档添加元数据标签(来源、日期、作者等),检索时可根据元数据进行过滤,大幅提升召回精准度。

    4. 插件标准接口(OpenAI 官方规范)

    严格遵循 OpenAI Plugin 规范(/.well-known/ai-plugin.json/openapi.yaml),可作为开发自定义 ChatGPT 插件的参考模板。

    💡 典型使用场景

    场景一:企业知识库问答

    将公司内部文档(产品手册、API 文档、HR 政策)向量化后接入 ChatGPT,员工可以直接用自然语言查询,比如”我们公司的报销流程是什么?”,ChatGPT 会从知识库中精准召回答案。

    价值:替代传统关键词搜索,问答准确率提升 60%+。

    场景二:技术文档助手

    开源项目维护者可以将项目文档(README、Wiki、Issue 解答)接入插件,用户在使用 ChatGPT 时可以直接获得项目相关的准确回答,而不用担心模型产生幻觉。

    价值:降低开源项目的使用门槛,减少重复解答。

    🌟 推荐理由

    这个项目最大的价值不在于代码本身(实际上代码量并不大),而在于它 定义了 RAG 的标准范式

    1. 文档切片 → Embedding → 向量存储 → 检索召回 → 注入上下文 → 生成回答,这条链路现在是业界标配。
    2. 如果你想做知识库问答、企业 AI 助手、文档 Copilot,这个项目是最好的起点。
    3. 虽然 OpenAI 后来推出了 Assistants APIGPTs,底层逻辑依然和这个插件一脉相承。

    值得一提的是,现在很多热门项目(RAGFlow、AnythingLLM、Dify 的知识库功能)都能看到这个项目的影子。可以说,它是 RAG 应用的”黄埔军校”。

    📥 下载地址

    如果你正在做知识库问答或者企业 AI 助手,这个项目值得深入研究。它不仅是 RAG 的鼻祖,更是理解大模型如何”连接外部知识”的最佳教材。

  • 美国国会拿出269页AI监管草案,科技公司和工会打起来了

    美国国会本周拿出了一份269页的AI监管讨论草案,名字叫《伟大美国AI法案》。这是目前为止国会提出的最全面的联邦AI监管框架,而且它是两党合作的产物——共和党和民主党的议员一起写的。

    但这份草案从出炉那一刻起,就陷入了争议。科技行业团体表态支持,工会组织强烈反对,而各州已经在实施的AI法规,则面临着被”冻结”3年的前景。

    一份269页的”大家伙”

    这份草案由加州共和党众议员杰伊·奥伯诺尔特和马萨诸塞州民主党众议员洛里·特拉汉联合发布。光看页数就知道,这东西不简单——269页,比很多专著都厚。

    奥伯诺尔特说:”人工智能发展速度极快,国会必须采取审慎、两党合作的方式监管这项关键技术。这份讨论草案是建立清晰联邦框架的重要一步。”

    特拉汉的补充同样值得注意:”人工智能对国家安全、公共安全和劳动力市场的威胁已经出现,且每天都在加剧。这项两党框架旨在应对这项快速发展的技术带来的挑战,同时不会扼杀美国的创新活力。”


    最核心的争议:州法律被”冻结”3年

    这份草案最引人注目的一条,是它提议冻结州级前沿AI模型相关法规3年。具体来说,专门监管AI模型开发的州法律,在未来3年内将被联邦规则优先覆盖——也就是说,州级法规暂时不能执行。

    这个设计直接冲击了已经在运行的州级AI立法。加州的AB 2013法案(要求模型开发者公开训练数据摘要)、加州的SB 942法案(涉及内容水印)、纽约州刚刚通过的数据中心建设禁令,都可能被纳入”冻结”范围。

    支持这一条款的人认为,50个州各搞一套AI监管,最终会让美国公司在竞争中输给中国。反对者则说,这相当于把州级AI保护的底线变成了联邦的上限,实际上是在拉低全美的AI安全标准。


    大公司要被管起来了

    草案对”大型前沿AI开发者”提出了明确的监管要求。门槛是:上一日历年总收入超过5亿美元。

    被纳入这个范围的公司,需要建立一个公开的前沿AI框架,内容必须包括:模型是否存在”灾难性风险”(定义为可预见且实质性的、导致50人以上死亡或受伤、或造成10亿美元以上财产损失的风险)、判定风险的阈值、模型非公开权重的网络安全保护措施、重大安全事件的应对方案。

    不配合审计或者给监管机构提供虚假陈述的企业,违规期间每天最高可被罚100万美元。这个数字听起来很大,但比起这些公司的营收,其实也就是个零头。


    一个新机构要诞生了

    草案提议以法律形式正式设立”AI标准与创新中心”(CAISI),作为美国国家标准与技术研究院(NIST)下属机构。这个中心的职责包括制定AI系统安全提升的指南、最佳实践、自愿标准,评估美国及外国AI系统的安全漏洞。

    国会打算给这个中心每年拨1亿美元,连续拨3年。这笔钱说多不多,说少不少——考虑到AI行业的体量,1亿美元大概也就是几家大厂一个下午的算力账单。

    还有一个条款值得注意:草案要求对借助AI冒充政府官员的行为追究刑事责任。这条在当下深度伪造技术越来越成熟的环境里,看起来是很有现实意义的。


    各方反应:支持的和反对的都很坚决

    科技行业组织NetChoice总体上支持这份草案,认为它提供了统一的联邦框架,避免各州各自为政。但他们也对草案里的审计要求有顾虑,担心会泄露企业商业秘密。

    工会方面的反应则完全是另一个方向。负责任创新美国人组织(ARI)主席布拉德·卡森直接称冻结州AI法律是”代际错误”,认为这会阻止州议员在技术快速发展的时代应对新兴的AI危害。

    安全AI联盟(Alliance for Secure AI)CEO布伦丹·斯坦豪泽认可草案的两党属性和对灾难性风险的关注,但同样反对优先适用条款。他的论点是:国家AI标准的保护力度不应低于被优先适用的州标准,而目前多州已经出台的涉及儿童安全、消费者保护的法律,比这份草案的保护力度强得多。


    这只是个讨论草案

    需要明确的是,目前这份文件还只是”讨论草案”,不是正式的法律。奥伯诺尔特和特拉汉发布它的目的,是在正式提交法案之前征求利益相关方、专家和公众的意见。

    也就是说,草案的内容还可能发生相当程度的修改。但两份草案的亮相本身,已经向市场释放了一个清晰的信号:美国联邦层面的AI监管,正在从”要不要做”进入”怎么做”的阶段。

    距离这份草案真正成为法律,还有很长的路要走。但它的出现,已经让科技公司和监管机构同时进入了”备战”状态。

  • AI烧钱速度超出所有人想象,Uber们开始慌了

    AI这场仗打到现在,终于有人开始算账了。而且一算账,所有人都愣住了。

    Uber今年前四个月就把全年的AI编程预算给烧光了。不是接近烧光,是真的烧光了。这件事听起来像个笑话,但它是真实发生的——一家市值几百亿美元的科技公司,在AI工具上花钱的速度,比他们做预算时最疯狂的假设还要快得多。

    从”能用吗”到”多少钱”

    Rebecca Bellan在TechCrunch写了一篇很扎实的报道,讲的是整个行业突然意识到AI不是免费午餐这件事。她的观察很准确:六个月前,企业和AI公司坐下来谈,话题全是”这个模型能做什么?效果够不够好?”现在再坐下来,问的问题变成了”我们到底花了多少钱?你们能提供什么可见性?有什么审计能力?”

    AI企业业务负责人Alexander Embiricos说得很直白:”现在大家问的都是’我们花了这么多钱,你们能提供什么可见性?有什么审计能力?有什么token管控措施?你们的模型效率怎么样?’”

    这个转变来得很快。快到很多企业根本没来得及建立任何成本管控机制。

    几家欢乐几家愁

    Priceline的一名员工告诉TechCrunch,他们常规Cursor合同的续约价格涨了4到5倍。微软在开放开发者Claude Code许可仅仅几个月之后,就撤销了相关授权。这些动作背后的逻辑很简单:AI工具的采购成本正在失控,而大多数公司对此几乎没有任何实时监控能力。

    有一家企业因为忘记给员工设置使用限额,最终收到了一张5亿美元的Claude账单。这听起来像都市传说,但它是真实发生在2025年到2026年初某个时间点的事情。具体是哪家公司,报道里没有点名,但这反而让这个故事更有威慑力——因为任何一家在AI上”无上限”投入的公司,都有可能成为下一个主角。


    token到底有多贵

    单看每个token的价格,其实是在下降的。但问题是,AI智能体普及之后,token的消耗量是呈指数级增长的。Jellyfish的研究负责人Nicholas Arcolano提供了一组数据:使用token最多的工程师,生产力大约是使用AI较少的工程师的2倍,但他们消耗的token是后者的10倍。

    换句话说,你花5倍的钱,换来了2倍的生产力。这笔账划不划算,取决于你用AI做出来的东西到底能卖多少钱。而大多数企业目前还无法衡量这一点。

    Faros AI的CEO Vitaly Gordon说得更直白。他最近和一位CTO聊天,对方告诉他:”我有一个工程师上个月花了4万美元的token费用,我真的不知道是该阻止他,还是应该告诉其他人都向他学习。”


    有人在想办法

    市场永远不会让一个真实的需求空缺太久。Linux基金会在本周宣布了Tokenomics Foundation(代币经济学基金会)的成立计划。这个新的标准机构,目标是为AI token建立类似FinOps(云成本优化)为云支出建立的那种成本管控规范。

    FinOps基金会的执行董事J.R. Stormet说,他从今年4月开始就不断听到企业说类似的话:”天呐,我们2026年的全年token预算才到4月就已经超了3倍。”他说他听到了很多”关乎企业生存的危机”,整个对话的重心从”tokenmaxing(最大化token使用量)”和”快速推进”,转向了”我们需要护栏,怎么控制成本?”

    追踪token成本的难度,远比追踪云成本要高得多。Stormet说:”追踪云成本是一个每月需要处理数亿行数据的问题,而追踪token成本是一个每月需要处理数万亿行数据的问题。你不可能把它塞进任何电子表格甚至基础工具里。”


    新玩家入局

    针对这个需求的市场正在快速形成。有像Pay-i这样的纯业务公司,负责追踪、衡量和优化生成式AI投资的成本和性能;还有Paid,它让开发者可以追踪成本、衡量使用情况,并且根据实际价值而不是订阅费向用户收费。

    此外还有Jellyfish、Waydev、Faros AI这类公司,它们都提供AI智能体监控服务,以证明开发工具的投资回报率。Stormet表示,FinOps基金会旗下的180家供应商中,大多数都在向这个领域倾斜。

    已经有客户基础的成熟公司也在增加新功能,以抢占这个新市场。Ramp最近进入了AI支出管理领域;Datadog和New Relic增加了云成本管理、token级可观测性、GPU监控等服务。


    标准缺失,乱象丛生

    但所有这些工具都是在缺乏通用语言和共享定义的情况下开发的。没有统一的标准说明一个token的成本是多少、它能产生什么、以及如何跨供应商比较支出。这正是Tokenomics基金会希望发挥作用的地方。

    该基金会正在为”代币经济学”建立权威的定义和框架;制定AI token使用和计费的开放标准、规范和指标;以及新的AI经济指标,比如每智能成本、每瓦特token数。它还计划定义token工厂效率和消耗效率相关的指标。

    该组织计划在7月正式推出,下周将在FinOps X大会上宣布更多成员。但问题是,高盛预测到2030年全球token使用量将增长24倍。那些已经超支的企业现在就需要解决方案,而该基金会的第一个交付成果还要几个月才能推出。


    也许我们还没准备好

    Gordon说了一句很值得玩味的话:”也许我们创造了蒸汽机,但我们还没有搞清楚装配线。”

    这句话精准地描述了2026年中全球AI行业的现状。我们有了强大的模型,有了愿意为它们付钱的企业,有了快速增长的用户基数。但我们还没有搞清楚如何让这场狂欢可持续——不只是技术上可持续,而是商业上可持续。

    Uber花光全年AI预算的故事,不会是最后一个这样的故事。在token账单大到让CEO们无法忽视之前,类似的”翻车”还会继续发生。而等到那时候,Tokenomics Foundation的标准也许才刚刚准备好。

  • 纽约州通过法案,叫停新建数据中心一年

    美国第一个全州范围的数据中心禁令,离生效只差一个签名

    纽约州议会刚通过一项为期一年的大型数据中心建设暂停令。只要民主党州长凯西·霍楚尔签字,这就会成为美国第一个全州范围的数据中心禁令。

    暂停期只有一年,比之前提案里写的三年要短。但即便只有一年,数据中心行业已经跳起来了。长岛协会的代理总裁对媒体说,一刀切的暂停令会害了州经济——有些数据中心其实是能带来就业的好项目,不该被一竿子打死。

    纽约独立系统运营商正在审查24个数据中心提案,总容量超过9000兆瓦。光是奥尔巴尼附近一个180兆瓦的项目,就已经让当地居民睡不着觉了。

    住民不怕数据中心,怕的是措手不及

    盖洛普的民调说,70%以上的美国人反对在自己社区建数据中心。这不是党派问题——共和党选民和民主党选民一样不喜欢自家后院突然冒出一个几栋楼高、耗电量相当于一个小城市的设施。

    缅因州今年早些时候也走过这条路。州议会通过了类似法案,本打算暂停到2027年底,结果被民主党州长珍妮特·米尔斯否决了——理由是法案没有对已经规划好的项目做出豁免安排,太粗糙。

    纽约这次学乖了,暂停期只设一年。这一年的任务是让州环境机构出一份正经的影响报告——数据中心到底耗多少电、用多少水、占多少土地、排放多少污染,得有个数字出来再谈批准还是拒绝。

    听证会要企业自己出钱

    法案里有个细节值得注意:计划建设峰值需求至少20兆瓦的数据中心企业,必须在项目获批前至少三个月,自己出钱办一场公开听证会。不是走形式那种,是让社区居民真的能到场提问、表达反对意见。

    这对AI公司来说是个新麻烦。过去两年,它们习惯了的流程是:找个电价便宜、土地多、监管松的地方,跟当地政府签个税收减免协议,然后开工。现在纽约说——慢着,先让你的邻居们听听这是什么项目、耗多少电、用多少水,再决定批不批。

    霍楚尔还没有表态。她的发言人只说”州长将审查该法案”。按照程序,她有到12月的时间来决定签还是不签。但从她过去在AI政策上的表态来看,她对数据中心监管的态度偏积极——去年她就提过要保护儿童上网安全、要加强对AI公司的监管。


  • 纽约州通过法案,不准AI聊天机器人当儿童的”伴侣”

    一场官司打出来的法案

    加州的SB 243法案去年10月就已经签了,那是全美第一部专门管AI伴侣聊天机器人的法律。纽约这次跟上来,动作更快,直接把”禁止向未成年人提供AI伴侣服务”写进了州级法案。

    背后的推手很简单——人命。过去两年里,Character.AI、Google这些公司被好几起父母告上法庭,说自家的孩子跟AI聊天机器人聊到最后,出现了自杀或自残倾向。有些案子已经和解了,Google和Character.AI在今年1月同意向受害家庭赔偿,但更多的官司还在打着。

    Character.AI在2025年10月宣布,将对18岁以下用户限制聊天机器人使用,包括识别未成年人身份,并设置每日两小时的聊天上限。

    纽约这个法案的核心逻辑是:AI公司不能让聊天机器人假装自己是人类,尤其不能对未成年人这么干。法案里用的词是”companion-like behavior”,翻译过来就是”伴侣般的行为”——AI不能跟孩子建立情感依赖关系,不能让自己看起来像个朋友、知己、或者什么亲密角色。

    霍楚尔手握最后一票

    法案已经过了州议会,现在摆在州长凯西·霍楚尔桌上。她有到12月的时间来决定签还是不签。目前她还没有表态,发言人只说”州长将审查该法案”。

    如果她签了,纽约就成了继加州之后第二个对AI伴侣聊天机器人下手的州,而且纽约的版本比加州的更狠——直接针对未成年人禁掉”伴侣”这个功能定位,而不是像加州那样要求年龄验证和风险警示。

    这件事的讽刺之处在于:AI公司花了几年时间把聊天机器人包装成”陪伴者”,现在监管直接从”陪伴”这个定位开刀。Character.AI的整个产品逻辑就是让用户跟AI角色建立情感连接,现在这个逻辑在纽约可能直接违法。

    更大的 question 是定义

    法案真正难执行的地方在于:什么叫”暗示自己是人类”?AI说”我理解你的感受”,这算不算?AI记得你上周跟它说过什么,然后问你”后来怎么样了”,这算不算在建立情感连接?

    目前法案的具体实施细则还没有,霍楚尔签署之后,估计还要花不少时间把这个定义磨清楚。但方向已经很明确了:AI聊天机器人可以向未成年人提供信息、帮助完成任务,但不能充当”伴侣”。


  • 纽约州给数据中心按下暂停键,这一刀砍得整个行业都懵了

    纽约州给数据中心按下暂停键,这一刀砍得整个行业都懵了

    AI这列火车跑得太快,终于有人跳出来喊”先等一下”了。纽约州议会刚通过了一项为期一年的大型数据中心建设暂停令,只要州长凯西·霍楚尔签字,这就会成为美国第一个全州范围的数据中心禁令。

    数据中心建设
    数据中心建设正在成为各地社区的争议焦点(图源:The Verge / Getty Images)

    支持这个法案的人说得很直白:给政策制定者留出一年时间,好好研究一下大型数据中心到底对环境和能源价格有什么影响。具体要求是让纽约州的环境机构出一份影响报告,把数据中心消耗的电力、水资源、土地规模,还有造成的污染情况,通通算清楚。

    法案还加了一道”公开听证会”的门槛:凡是计划建设峰值需求20兆瓦以上的大型数据中心,必须在项目获批前至少3个月,自己出钱办一场公开听证会,让社区居民有机会当面提问和反对。

    这个法案能推出来,背后其实是民意撑腰的。民调显示,大多数美国老百姓并不乐意在自己社区里建数据中心。全国各地那些吵得不可开交的公开听证会,已经说明这不是一个能轻易被政党立场左右的问题——不管你是支持民主党还是共和党,都不一定愿意自家后院多出一座每天吞掉一个小镇用电量的巨型机房。

    今年早些时候,缅因州议会其实也通过过类似的法案,打算暂停新数据中心建设到2027年底,但民主党州长珍妮特·米尔斯把它否决了——《纽约时报》说,原因是法案没有给已经规划好的项目设立豁免条款,一刀切太狠了。

    纽约这次学乖了,禁令只设一年,比之前提案里说的三年要短得多。但即使是这一年,也足够让行业团体跳脚了。长岛协会的代理总裁斯泰西·赛克斯对《政客》杂志说,暂停令”总体上会对州经济造成损害”,因为一刀切地暂停,而不是逐个项目评估,会让一些其实对经济有益的数据中心项目也跟着黄掉。


    数字说话最直观。负责维护纽约州电网可靠性的无党派机构”纽约独立系统运营商”透露,他们目前正在审核24个数据中心建设提案,总规模超过9000兆瓦。这是什么概念?9000兆瓦大约相当于五六个大型核电站的装机容量,或者足够供几百万人用的电量。奥尔巴尼还有一个拟建的180兆瓦项目,已经让当地居民忧心忡忡了。

    霍楚尔现在还没有表态会不会签这个法案。按照《彭博政府》的报道,她有直到今年12月的时间来做决定——签,还是否决。她的发言人对外说的是:”州长将审议该法案。”这句话翻译一下就是:还没想好,再看看。

    把视野拉大一点,这场关于数据中心的争议,本质上是AI狂飙带来的副作用开始反噬了。AI公司要训练更大的模型、跑更多的推理任务,就需要更多的算力;更多的算力就意味着更多、更大的数据中心;更多、更大的数据中心就意味着更多的用电、用水、用地,以及对当地电网和环境的冲击。

    之前我写过Erin Brockovich(就是电影《永不妥协》原型那个人)盯上数据中心行业保密问题的文章,她上线了一份全美数据中心分布地图,首月就收到近4000份居民爆料,”透明度”是最普遍的投诉。现在纽约州把这个问题正式搬上了立法议程,接下来其他州会不会跟进,值得盯着看。

    AI不会自己停下来等监管跟上。但监管现在真的开始追了。

  • 谷歌每月要给SpaceX交9.2亿美元,就为了租GPU

    Google每个月要给SpaceX交9.2亿美元,就为了租GPU

    这周AI圈最大的瓜,不是哪家公司又发布了新模型,而是Google默默和SpaceX签了一份让所有人都倒吸一口凉气的算力租赁合同。根据SpaceX周五提交给监管机构的文件,从2026年10月到2029年6月,Google每个月要向SpaceX支付9.2亿美元,换来的是”大约11万块英伟达GPU、CPU、内存和其他相关组件”的使用权。

    什么概念?一年就是110亿美元,三年合同下来总共要付330亿美元。这笔钱够买下好几个上市公司的市值了。

    SpaceX这一手玩得相当精明。就在IPO前夜,它接连拿下了Anthropic(每月12.5亿美元)和Google(每月9.2亿美元)两份长期算力大单,等于还没上市就已经锁定了未来三年的巨额现金流。

    回头看,Anthropic那份合同更夸张一些——每月12.5亿美元,用的是SpaceX在孟菲斯附近建的Colossus 1数据中心里”所有可用的算力”。Google这一份大概是Anthropic的一半左右,但SpaceX没说具体会用到哪个数据中心。马斯克之前暗示过,Colossus 2数据中心会留给xAI自己用。

    这里有一个挺有意思的对比。Anthropic在跟SpaceX签合同之前,算力是被卡得很死的,合同宣布当天才把使用限额放开。但Google完全不是同一个处境——有估算说Google是全球最大的AI算力持有者,它缺的不是算力,而是应对突发需求弹性的余地。

    Google自己在声明里也说了,这次合作是因为刚推出的AI产品需求太猛,尤其是企业版的Gemini平台,用户增长速度”比我们预期的还要高”。用大白话讲就是:我们的算力规划没跟上用户增长,先找SpaceX临时救个急,撑到自己的数据中心建好。

    这份合同里还有一个挺关键的”逃生门”条款:2026年12月31日之后,双方都可以提前90天通知对方终止协议。而且在2026年9月之前,Google是以”折扣价”逐步增加算力的。说白了,这就是一份短期过渡协议,Google并不打算长期依赖SpaceX的算力。

    站在这个时间点上回望,SpaceX选择在IPO前一周公布这两份算力大单,算盘打得很清楚。它要向市场证明的不只是”我们能造火箭”,而是”我们手里握着AI时代最稀缺的资源——算力,而且Google和Anthropic都愿意掏真金白银来租”。监管文件显示,SpaceX这次IPO目标是募资750亿美元左右,估值大约1.75万亿美元,届时将成为有史以来规模最大的IPO。

    还有一层关系值得注意:Google其实是SpaceX的老股东了,IPO之后它持有的SpaceX股份预计价值会超过1000亿美元。所以这笔交易从某种意义上说,也是Google在帮自己的投资标的把故事讲得更漂亮,好让IPO定价更有说服力。

    有报道说两家公司还在谈合作建轨道数据中心——这可是SpaceX IPO之后未来规划里的重要一块。如果真的把数据中心发射到近地轨道,那算力、能源、散热这些地面数据中心最头疼的问题,可能真的会有一个完全不同的解法。当然,那是后话了。


    眼下最直接的问题是:Google自己的算力扩建进度能不能跟上需求。它的母公司Alphabet今年已经承诺了超过1800亿美元的资本支出,而且还说2027年还会”大幅提高”。为了支撑这个支出计划,Alphabet最近还宣布了800亿美元的配股融资。大把烧钱的日子,看来还得持续好一阵子。