博客

  • ChatGPT Retrieval Plugin:20k+ Stars!RAG鼻祖项目,让ChatGPT拥有外部知识

    ChatGPT Retrieval Plugin:20k+ Stars!RAG鼻祖项目,让ChatGPT拥有外部知识

    📦 项目简介

    chatgpt-retrieval-plugin 是 OpenAI 官方开源的 ChatGPT 检索插件模板,它是 RAG(检索增强生成) 领域的鼻祖级项目,让 ChatGPT 能够访问自定义数据源。

    这个项目展示了如何让大模型动态访问外部知识库,而不是仅仅依赖训练数据。它是现在所有 RAG 应用的”祖师爷”。

    ⚙️ 安装要求和过程

    环境要求

    • Python:3.8+(推荐 3.10+)
    • 向量数据库:Pinecone / Weaviate / Qdrant(任选其一)
    • OpenAI API Key:必需(用于 Embedding 和 ChatGPT)
    • 内存:建议 8GB+(本地测试可降级)

    快速安装步骤

    # 1. 克隆项目
    git clone https://github.com/openai/chatgpt-retrieval-plugin.git
    cd chatgpt-retrieval-plugin
    
    # 2. 安装依赖
    pip install -r requirements.txt
    
    # 3. 配置环境变量
    cp .env.example .env
    # 编辑 .env,填入你的 OpenAI API Key 和向量数据库配置
    
    # 4. 构建向量索引
    python scripts/process_docs.py
    
    # 5. 启动服务
    uvicorn server.main:app --reload --port 8000
    

    安装完成后,在 ChatGPT Plugins 模式中添加本地插件,指向 http://localhost:8000 即可。

    🔥 核心功能

    1. 向量检索(核心能力)

    将文档切片后转化为向量,存储到 Pinecone 等向量数据库。用户提问时,系统自动检索最相关的文档片段,注入到 ChatGPT 的上下文中。

    2. 递归爬取(数据接入)

    内置 scripts/process_docs.py 支持递归爬取网站内容(基于 BeautifulSoup),自动处理 HTML、PDF、Markdown 等多种格式。

    3. 元数据过滤(精准召回)

    支持为文档添加元数据标签(来源、日期、作者等),检索时可根据元数据进行过滤,大幅提升召回精准度。

    4. 插件标准接口(OpenAI 官方规范)

    严格遵循 OpenAI Plugin 规范(/.well-known/ai-plugin.json/openapi.yaml),可作为开发自定义 ChatGPT 插件的参考模板。

    💡 典型使用场景

    场景一:企业知识库问答

    将公司内部文档(产品手册、API 文档、HR 政策)向量化后接入 ChatGPT,员工可以直接用自然语言查询,比如”我们公司的报销流程是什么?”,ChatGPT 会从知识库中精准召回答案。

    价值:替代传统关键词搜索,问答准确率提升 60%+。

    场景二:技术文档助手

    开源项目维护者可以将项目文档(README、Wiki、Issue 解答)接入插件,用户在使用 ChatGPT 时可以直接获得项目相关的准确回答,而不用担心模型产生幻觉。

    价值:降低开源项目的使用门槛,减少重复解答。

    🌟 推荐理由

    这个项目最大的价值不在于代码本身(实际上代码量并不大),而在于它 定义了 RAG 的标准范式

    1. 文档切片 → Embedding → 向量存储 → 检索召回 → 注入上下文 → 生成回答,这条链路现在是业界标配。
    2. 如果你想做知识库问答、企业 AI 助手、文档 Copilot,这个项目是最好的起点。
    3. 虽然 OpenAI 后来推出了 Assistants APIGPTs,底层逻辑依然和这个插件一脉相承。

    值得一提的是,现在很多热门项目(RAGFlow、AnythingLLM、Dify 的知识库功能)都能看到这个项目的影子。可以说,它是 RAG 应用的”黄埔军校”。

    📥 下载地址

    如果你正在做知识库问答或者企业 AI 助手,这个项目值得深入研究。它不仅是 RAG 的鼻祖,更是理解大模型如何”连接外部知识”的最佳教材。

  • 美国国会拿出269页AI监管草案,科技公司和工会打起来了

    美国国会本周拿出了一份269页的AI监管讨论草案,名字叫《伟大美国AI法案》。这是目前为止国会提出的最全面的联邦AI监管框架,而且它是两党合作的产物——共和党和民主党的议员一起写的。

    但这份草案从出炉那一刻起,就陷入了争议。科技行业团体表态支持,工会组织强烈反对,而各州已经在实施的AI法规,则面临着被”冻结”3年的前景。

    一份269页的”大家伙”

    这份草案由加州共和党众议员杰伊·奥伯诺尔特和马萨诸塞州民主党众议员洛里·特拉汉联合发布。光看页数就知道,这东西不简单——269页,比很多专著都厚。

    奥伯诺尔特说:”人工智能发展速度极快,国会必须采取审慎、两党合作的方式监管这项关键技术。这份讨论草案是建立清晰联邦框架的重要一步。”

    特拉汉的补充同样值得注意:”人工智能对国家安全、公共安全和劳动力市场的威胁已经出现,且每天都在加剧。这项两党框架旨在应对这项快速发展的技术带来的挑战,同时不会扼杀美国的创新活力。”


    最核心的争议:州法律被”冻结”3年

    这份草案最引人注目的一条,是它提议冻结州级前沿AI模型相关法规3年。具体来说,专门监管AI模型开发的州法律,在未来3年内将被联邦规则优先覆盖——也就是说,州级法规暂时不能执行。

    这个设计直接冲击了已经在运行的州级AI立法。加州的AB 2013法案(要求模型开发者公开训练数据摘要)、加州的SB 942法案(涉及内容水印)、纽约州刚刚通过的数据中心建设禁令,都可能被纳入”冻结”范围。

    支持这一条款的人认为,50个州各搞一套AI监管,最终会让美国公司在竞争中输给中国。反对者则说,这相当于把州级AI保护的底线变成了联邦的上限,实际上是在拉低全美的AI安全标准。


    大公司要被管起来了

    草案对”大型前沿AI开发者”提出了明确的监管要求。门槛是:上一日历年总收入超过5亿美元。

    被纳入这个范围的公司,需要建立一个公开的前沿AI框架,内容必须包括:模型是否存在”灾难性风险”(定义为可预见且实质性的、导致50人以上死亡或受伤、或造成10亿美元以上财产损失的风险)、判定风险的阈值、模型非公开权重的网络安全保护措施、重大安全事件的应对方案。

    不配合审计或者给监管机构提供虚假陈述的企业,违规期间每天最高可被罚100万美元。这个数字听起来很大,但比起这些公司的营收,其实也就是个零头。


    一个新机构要诞生了

    草案提议以法律形式正式设立”AI标准与创新中心”(CAISI),作为美国国家标准与技术研究院(NIST)下属机构。这个中心的职责包括制定AI系统安全提升的指南、最佳实践、自愿标准,评估美国及外国AI系统的安全漏洞。

    国会打算给这个中心每年拨1亿美元,连续拨3年。这笔钱说多不多,说少不少——考虑到AI行业的体量,1亿美元大概也就是几家大厂一个下午的算力账单。

    还有一个条款值得注意:草案要求对借助AI冒充政府官员的行为追究刑事责任。这条在当下深度伪造技术越来越成熟的环境里,看起来是很有现实意义的。


    各方反应:支持的和反对的都很坚决

    科技行业组织NetChoice总体上支持这份草案,认为它提供了统一的联邦框架,避免各州各自为政。但他们也对草案里的审计要求有顾虑,担心会泄露企业商业秘密。

    工会方面的反应则完全是另一个方向。负责任创新美国人组织(ARI)主席布拉德·卡森直接称冻结州AI法律是”代际错误”,认为这会阻止州议员在技术快速发展的时代应对新兴的AI危害。

    安全AI联盟(Alliance for Secure AI)CEO布伦丹·斯坦豪泽认可草案的两党属性和对灾难性风险的关注,但同样反对优先适用条款。他的论点是:国家AI标准的保护力度不应低于被优先适用的州标准,而目前多州已经出台的涉及儿童安全、消费者保护的法律,比这份草案的保护力度强得多。


    这只是个讨论草案

    需要明确的是,目前这份文件还只是”讨论草案”,不是正式的法律。奥伯诺尔特和特拉汉发布它的目的,是在正式提交法案之前征求利益相关方、专家和公众的意见。

    也就是说,草案的内容还可能发生相当程度的修改。但两份草案的亮相本身,已经向市场释放了一个清晰的信号:美国联邦层面的AI监管,正在从”要不要做”进入”怎么做”的阶段。

    距离这份草案真正成为法律,还有很长的路要走。但它的出现,已经让科技公司和监管机构同时进入了”备战”状态。

  • AI烧钱速度超出所有人想象,Uber们开始慌了

    AI这场仗打到现在,终于有人开始算账了。而且一算账,所有人都愣住了。

    Uber今年前四个月就把全年的AI编程预算给烧光了。不是接近烧光,是真的烧光了。这件事听起来像个笑话,但它是真实发生的——一家市值几百亿美元的科技公司,在AI工具上花钱的速度,比他们做预算时最疯狂的假设还要快得多。

    从”能用吗”到”多少钱”

    Rebecca Bellan在TechCrunch写了一篇很扎实的报道,讲的是整个行业突然意识到AI不是免费午餐这件事。她的观察很准确:六个月前,企业和AI公司坐下来谈,话题全是”这个模型能做什么?效果够不够好?”现在再坐下来,问的问题变成了”我们到底花了多少钱?你们能提供什么可见性?有什么审计能力?”

    AI企业业务负责人Alexander Embiricos说得很直白:”现在大家问的都是’我们花了这么多钱,你们能提供什么可见性?有什么审计能力?有什么token管控措施?你们的模型效率怎么样?’”

    这个转变来得很快。快到很多企业根本没来得及建立任何成本管控机制。

    几家欢乐几家愁

    Priceline的一名员工告诉TechCrunch,他们常规Cursor合同的续约价格涨了4到5倍。微软在开放开发者Claude Code许可仅仅几个月之后,就撤销了相关授权。这些动作背后的逻辑很简单:AI工具的采购成本正在失控,而大多数公司对此几乎没有任何实时监控能力。

    有一家企业因为忘记给员工设置使用限额,最终收到了一张5亿美元的Claude账单。这听起来像都市传说,但它是真实发生在2025年到2026年初某个时间点的事情。具体是哪家公司,报道里没有点名,但这反而让这个故事更有威慑力——因为任何一家在AI上”无上限”投入的公司,都有可能成为下一个主角。


    token到底有多贵

    单看每个token的价格,其实是在下降的。但问题是,AI智能体普及之后,token的消耗量是呈指数级增长的。Jellyfish的研究负责人Nicholas Arcolano提供了一组数据:使用token最多的工程师,生产力大约是使用AI较少的工程师的2倍,但他们消耗的token是后者的10倍。

    换句话说,你花5倍的钱,换来了2倍的生产力。这笔账划不划算,取决于你用AI做出来的东西到底能卖多少钱。而大多数企业目前还无法衡量这一点。

    Faros AI的CEO Vitaly Gordon说得更直白。他最近和一位CTO聊天,对方告诉他:”我有一个工程师上个月花了4万美元的token费用,我真的不知道是该阻止他,还是应该告诉其他人都向他学习。”


    有人在想办法

    市场永远不会让一个真实的需求空缺太久。Linux基金会在本周宣布了Tokenomics Foundation(代币经济学基金会)的成立计划。这个新的标准机构,目标是为AI token建立类似FinOps(云成本优化)为云支出建立的那种成本管控规范。

    FinOps基金会的执行董事J.R. Stormet说,他从今年4月开始就不断听到企业说类似的话:”天呐,我们2026年的全年token预算才到4月就已经超了3倍。”他说他听到了很多”关乎企业生存的危机”,整个对话的重心从”tokenmaxing(最大化token使用量)”和”快速推进”,转向了”我们需要护栏,怎么控制成本?”

    追踪token成本的难度,远比追踪云成本要高得多。Stormet说:”追踪云成本是一个每月需要处理数亿行数据的问题,而追踪token成本是一个每月需要处理数万亿行数据的问题。你不可能把它塞进任何电子表格甚至基础工具里。”


    新玩家入局

    针对这个需求的市场正在快速形成。有像Pay-i这样的纯业务公司,负责追踪、衡量和优化生成式AI投资的成本和性能;还有Paid,它让开发者可以追踪成本、衡量使用情况,并且根据实际价值而不是订阅费向用户收费。

    此外还有Jellyfish、Waydev、Faros AI这类公司,它们都提供AI智能体监控服务,以证明开发工具的投资回报率。Stormet表示,FinOps基金会旗下的180家供应商中,大多数都在向这个领域倾斜。

    已经有客户基础的成熟公司也在增加新功能,以抢占这个新市场。Ramp最近进入了AI支出管理领域;Datadog和New Relic增加了云成本管理、token级可观测性、GPU监控等服务。


    标准缺失,乱象丛生

    但所有这些工具都是在缺乏通用语言和共享定义的情况下开发的。没有统一的标准说明一个token的成本是多少、它能产生什么、以及如何跨供应商比较支出。这正是Tokenomics基金会希望发挥作用的地方。

    该基金会正在为”代币经济学”建立权威的定义和框架;制定AI token使用和计费的开放标准、规范和指标;以及新的AI经济指标,比如每智能成本、每瓦特token数。它还计划定义token工厂效率和消耗效率相关的指标。

    该组织计划在7月正式推出,下周将在FinOps X大会上宣布更多成员。但问题是,高盛预测到2030年全球token使用量将增长24倍。那些已经超支的企业现在就需要解决方案,而该基金会的第一个交付成果还要几个月才能推出。


    也许我们还没准备好

    Gordon说了一句很值得玩味的话:”也许我们创造了蒸汽机,但我们还没有搞清楚装配线。”

    这句话精准地描述了2026年中全球AI行业的现状。我们有了强大的模型,有了愿意为它们付钱的企业,有了快速增长的用户基数。但我们还没有搞清楚如何让这场狂欢可持续——不只是技术上可持续,而是商业上可持续。

    Uber花光全年AI预算的故事,不会是最后一个这样的故事。在token账单大到让CEO们无法忽视之前,类似的”翻车”还会继续发生。而等到那时候,Tokenomics Foundation的标准也许才刚刚准备好。

  • 纽约州通过法案,叫停新建数据中心一年

    美国第一个全州范围的数据中心禁令,离生效只差一个签名

    纽约州议会刚通过一项为期一年的大型数据中心建设暂停令。只要民主党州长凯西·霍楚尔签字,这就会成为美国第一个全州范围的数据中心禁令。

    暂停期只有一年,比之前提案里写的三年要短。但即便只有一年,数据中心行业已经跳起来了。长岛协会的代理总裁对媒体说,一刀切的暂停令会害了州经济——有些数据中心其实是能带来就业的好项目,不该被一竿子打死。

    纽约独立系统运营商正在审查24个数据中心提案,总容量超过9000兆瓦。光是奥尔巴尼附近一个180兆瓦的项目,就已经让当地居民睡不着觉了。

    住民不怕数据中心,怕的是措手不及

    盖洛普的民调说,70%以上的美国人反对在自己社区建数据中心。这不是党派问题——共和党选民和民主党选民一样不喜欢自家后院突然冒出一个几栋楼高、耗电量相当于一个小城市的设施。

    缅因州今年早些时候也走过这条路。州议会通过了类似法案,本打算暂停到2027年底,结果被民主党州长珍妮特·米尔斯否决了——理由是法案没有对已经规划好的项目做出豁免安排,太粗糙。

    纽约这次学乖了,暂停期只设一年。这一年的任务是让州环境机构出一份正经的影响报告——数据中心到底耗多少电、用多少水、占多少土地、排放多少污染,得有个数字出来再谈批准还是拒绝。

    听证会要企业自己出钱

    法案里有个细节值得注意:计划建设峰值需求至少20兆瓦的数据中心企业,必须在项目获批前至少三个月,自己出钱办一场公开听证会。不是走形式那种,是让社区居民真的能到场提问、表达反对意见。

    这对AI公司来说是个新麻烦。过去两年,它们习惯了的流程是:找个电价便宜、土地多、监管松的地方,跟当地政府签个税收减免协议,然后开工。现在纽约说——慢着,先让你的邻居们听听这是什么项目、耗多少电、用多少水,再决定批不批。

    霍楚尔还没有表态。她的发言人只说”州长将审查该法案”。按照程序,她有到12月的时间来决定签还是不签。但从她过去在AI政策上的表态来看,她对数据中心监管的态度偏积极——去年她就提过要保护儿童上网安全、要加强对AI公司的监管。


  • 纽约州通过法案,不准AI聊天机器人当儿童的”伴侣”

    一场官司打出来的法案

    加州的SB 243法案去年10月就已经签了,那是全美第一部专门管AI伴侣聊天机器人的法律。纽约这次跟上来,动作更快,直接把”禁止向未成年人提供AI伴侣服务”写进了州级法案。

    背后的推手很简单——人命。过去两年里,Character.AI、Google这些公司被好几起父母告上法庭,说自家的孩子跟AI聊天机器人聊到最后,出现了自杀或自残倾向。有些案子已经和解了,Google和Character.AI在今年1月同意向受害家庭赔偿,但更多的官司还在打着。

    Character.AI在2025年10月宣布,将对18岁以下用户限制聊天机器人使用,包括识别未成年人身份,并设置每日两小时的聊天上限。

    纽约这个法案的核心逻辑是:AI公司不能让聊天机器人假装自己是人类,尤其不能对未成年人这么干。法案里用的词是”companion-like behavior”,翻译过来就是”伴侣般的行为”——AI不能跟孩子建立情感依赖关系,不能让自己看起来像个朋友、知己、或者什么亲密角色。

    霍楚尔手握最后一票

    法案已经过了州议会,现在摆在州长凯西·霍楚尔桌上。她有到12月的时间来决定签还是不签。目前她还没有表态,发言人只说”州长将审查该法案”。

    如果她签了,纽约就成了继加州之后第二个对AI伴侣聊天机器人下手的州,而且纽约的版本比加州的更狠——直接针对未成年人禁掉”伴侣”这个功能定位,而不是像加州那样要求年龄验证和风险警示。

    这件事的讽刺之处在于:AI公司花了几年时间把聊天机器人包装成”陪伴者”,现在监管直接从”陪伴”这个定位开刀。Character.AI的整个产品逻辑就是让用户跟AI角色建立情感连接,现在这个逻辑在纽约可能直接违法。

    更大的 question 是定义

    法案真正难执行的地方在于:什么叫”暗示自己是人类”?AI说”我理解你的感受”,这算不算?AI记得你上周跟它说过什么,然后问你”后来怎么样了”,这算不算在建立情感连接?

    目前法案的具体实施细则还没有,霍楚尔签署之后,估计还要花不少时间把这个定义磨清楚。但方向已经很明确了:AI聊天机器人可以向未成年人提供信息、帮助完成任务,但不能充当”伴侣”。


  • 纽约州给数据中心按下暂停键,这一刀砍得整个行业都懵了

    纽约州给数据中心按下暂停键,这一刀砍得整个行业都懵了

    AI这列火车跑得太快,终于有人跳出来喊”先等一下”了。纽约州议会刚通过了一项为期一年的大型数据中心建设暂停令,只要州长凯西·霍楚尔签字,这就会成为美国第一个全州范围的数据中心禁令。

    数据中心建设
    数据中心建设正在成为各地社区的争议焦点(图源:The Verge / Getty Images)

    支持这个法案的人说得很直白:给政策制定者留出一年时间,好好研究一下大型数据中心到底对环境和能源价格有什么影响。具体要求是让纽约州的环境机构出一份影响报告,把数据中心消耗的电力、水资源、土地规模,还有造成的污染情况,通通算清楚。

    法案还加了一道”公开听证会”的门槛:凡是计划建设峰值需求20兆瓦以上的大型数据中心,必须在项目获批前至少3个月,自己出钱办一场公开听证会,让社区居民有机会当面提问和反对。

    这个法案能推出来,背后其实是民意撑腰的。民调显示,大多数美国老百姓并不乐意在自己社区里建数据中心。全国各地那些吵得不可开交的公开听证会,已经说明这不是一个能轻易被政党立场左右的问题——不管你是支持民主党还是共和党,都不一定愿意自家后院多出一座每天吞掉一个小镇用电量的巨型机房。

    今年早些时候,缅因州议会其实也通过过类似的法案,打算暂停新数据中心建设到2027年底,但民主党州长珍妮特·米尔斯把它否决了——《纽约时报》说,原因是法案没有给已经规划好的项目设立豁免条款,一刀切太狠了。

    纽约这次学乖了,禁令只设一年,比之前提案里说的三年要短得多。但即使是这一年,也足够让行业团体跳脚了。长岛协会的代理总裁斯泰西·赛克斯对《政客》杂志说,暂停令”总体上会对州经济造成损害”,因为一刀切地暂停,而不是逐个项目评估,会让一些其实对经济有益的数据中心项目也跟着黄掉。


    数字说话最直观。负责维护纽约州电网可靠性的无党派机构”纽约独立系统运营商”透露,他们目前正在审核24个数据中心建设提案,总规模超过9000兆瓦。这是什么概念?9000兆瓦大约相当于五六个大型核电站的装机容量,或者足够供几百万人用的电量。奥尔巴尼还有一个拟建的180兆瓦项目,已经让当地居民忧心忡忡了。

    霍楚尔现在还没有表态会不会签这个法案。按照《彭博政府》的报道,她有直到今年12月的时间来做决定——签,还是否决。她的发言人对外说的是:”州长将审议该法案。”这句话翻译一下就是:还没想好,再看看。

    把视野拉大一点,这场关于数据中心的争议,本质上是AI狂飙带来的副作用开始反噬了。AI公司要训练更大的模型、跑更多的推理任务,就需要更多的算力;更多的算力就意味着更多、更大的数据中心;更多、更大的数据中心就意味着更多的用电、用水、用地,以及对当地电网和环境的冲击。

    之前我写过Erin Brockovich(就是电影《永不妥协》原型那个人)盯上数据中心行业保密问题的文章,她上线了一份全美数据中心分布地图,首月就收到近4000份居民爆料,”透明度”是最普遍的投诉。现在纽约州把这个问题正式搬上了立法议程,接下来其他州会不会跟进,值得盯着看。

    AI不会自己停下来等监管跟上。但监管现在真的开始追了。

  • 谷歌每月要给SpaceX交9.2亿美元,就为了租GPU

    Google每个月要给SpaceX交9.2亿美元,就为了租GPU

    这周AI圈最大的瓜,不是哪家公司又发布了新模型,而是Google默默和SpaceX签了一份让所有人都倒吸一口凉气的算力租赁合同。根据SpaceX周五提交给监管机构的文件,从2026年10月到2029年6月,Google每个月要向SpaceX支付9.2亿美元,换来的是”大约11万块英伟达GPU、CPU、内存和其他相关组件”的使用权。

    什么概念?一年就是110亿美元,三年合同下来总共要付330亿美元。这笔钱够买下好几个上市公司的市值了。

    SpaceX这一手玩得相当精明。就在IPO前夜,它接连拿下了Anthropic(每月12.5亿美元)和Google(每月9.2亿美元)两份长期算力大单,等于还没上市就已经锁定了未来三年的巨额现金流。

    回头看,Anthropic那份合同更夸张一些——每月12.5亿美元,用的是SpaceX在孟菲斯附近建的Colossus 1数据中心里”所有可用的算力”。Google这一份大概是Anthropic的一半左右,但SpaceX没说具体会用到哪个数据中心。马斯克之前暗示过,Colossus 2数据中心会留给xAI自己用。

    这里有一个挺有意思的对比。Anthropic在跟SpaceX签合同之前,算力是被卡得很死的,合同宣布当天才把使用限额放开。但Google完全不是同一个处境——有估算说Google是全球最大的AI算力持有者,它缺的不是算力,而是应对突发需求弹性的余地。

    Google自己在声明里也说了,这次合作是因为刚推出的AI产品需求太猛,尤其是企业版的Gemini平台,用户增长速度”比我们预期的还要高”。用大白话讲就是:我们的算力规划没跟上用户增长,先找SpaceX临时救个急,撑到自己的数据中心建好。

    这份合同里还有一个挺关键的”逃生门”条款:2026年12月31日之后,双方都可以提前90天通知对方终止协议。而且在2026年9月之前,Google是以”折扣价”逐步增加算力的。说白了,这就是一份短期过渡协议,Google并不打算长期依赖SpaceX的算力。

    站在这个时间点上回望,SpaceX选择在IPO前一周公布这两份算力大单,算盘打得很清楚。它要向市场证明的不只是”我们能造火箭”,而是”我们手里握着AI时代最稀缺的资源——算力,而且Google和Anthropic都愿意掏真金白银来租”。监管文件显示,SpaceX这次IPO目标是募资750亿美元左右,估值大约1.75万亿美元,届时将成为有史以来规模最大的IPO。

    还有一层关系值得注意:Google其实是SpaceX的老股东了,IPO之后它持有的SpaceX股份预计价值会超过1000亿美元。所以这笔交易从某种意义上说,也是Google在帮自己的投资标的把故事讲得更漂亮,好让IPO定价更有说服力。

    有报道说两家公司还在谈合作建轨道数据中心——这可是SpaceX IPO之后未来规划里的重要一块。如果真的把数据中心发射到近地轨道,那算力、能源、散热这些地面数据中心最头疼的问题,可能真的会有一个完全不同的解法。当然,那是后话了。


    眼下最直接的问题是:Google自己的算力扩建进度能不能跟上需求。它的母公司Alphabet今年已经承诺了超过1800亿美元的资本支出,而且还说2027年还会”大幅提高”。为了支撑这个支出计划,Alphabet最近还宣布了800亿美元的配股融资。大把烧钱的日子,看来还得持续好一阵子。

  • CopilotKit:32.7K Stars!构建Agent原生应用的最佳SDK,让AI真正融入你的产品

    CopilotKit:32.7K Stars!构建Agent原生应用的最佳SDK,让AI真正融入你的产品

    项目简介

    做AI应用开发的朋友,大概率都遇到过一个尴尬:

    你接了LLM,写了Prompt,聊天窗口跑起来了。然后用户说”帮我查订单”,你的Agent调用了工具,返回一段文字——但用户真正想要的,是一个可以点击的订单卡片、一个可以筛选的表单、一张可以交互的图表。

    CopilotKit 要解决的,就是这个问题。32.7K Stars,MIT协议,一句话说清楚:它是构建Agent原生应用的全栈SDK,让AI不仅能”说”,还能”做界面”。


    安装要求和过程

    环境要求

    • Node.js 18+
    • React 18+(React版本);Angular/Vue也已支持
    • TypeScript(推荐)

    快速开始(新项目)

    npx copilotkit@latest create -f nextjs

    已有项目接入

    npx copilotkit@latest init

    执行后自动完成:核心包安装、Provider配置、Agent与UI连接、部署就绪配置。

    安装React核心包

    npm install @copilotkit/react-core @copilotkit/react-ui

    核心功能

    1. 生成式UI(Generative UI)

    这是CopilotKit最招牌的能力。传统聊天AI返回的是文字,CopilotKit让Agent在运行时动态生成前端组件。比如用户说”画一个销售漏斗图”,Agent可以直接生成一个React组件渲染在聊天窗口里,而不是返回一段描述。

    2. AG-UI协议的主导者

    CopilotKit主导了AG-UI协议的制定,这个协议已经被Google、LangChain、AWS、Microsoft、Mastra、PydanticAI等主流AI厂商采纳。它的作用是实现Agent与用户界面的标准化通信——你可以理解为”AI界面的HTTP协议”。用了CopilotKit,你的Agent天然支持这个协议,未来对接其他厂商的生态会很顺畅。

    3. 人机协同工作流

    有些操作,AI不能自己拍板。CopilotKit支持Agent执行过程中主动暂停,请求人工确认后再继续。比如”我准备删除这三条数据,确认?”——用户点确认,Agent再执行。这个能力在金融、医疗、企业审批等场景里几乎是必需的。

    4. 共享状态管理

    Agent和UI组件之间有一层可实时读写同步的状态层。Agent更新了状态,UI立刻响应;用户在UI上操作,Agent也能立刻感知。这种双向实时交互,是”真正Agent原生应用”和”套壳聊天窗口”之间最本质的差别。

    5. 自学习Agent(早期访问)

    通过人类反馈持续学习(RLHF),Agent可以不用微调模型,就能通过用户反馈自动优化行为。而且支持按用户偏好做个性化适配——也就是说,同一个Agent,给不同用户用,会越来越”懂”那个用户。


    典型使用场景

    场景一:AI客服系统

    用户在聊天窗口说”查我的订单”。传统方案:Agent返回一段文字”您的订单号是xxx,状态是已发货”。

    用了CopilotKit:Agent动态生成一个可交互的订单卡片,用户可以直接在聊天窗口里点击”退款”、”查看物流”、”联系卖家”。整个过程不需要跳转页面,也不需要用户去别的地方操作。

    场景二:企业知识库助手

    结合RAG,用户问”帮我分析Q1各区域的销售趋势”。Agent不仅返回文字结论,还直接生成一张交互式图表,用户可以在聊天窗口里筛选区域、切换时间维度、导出数据。这种体验,是传统”一问一答”的AI客服完全给不了的。


    推荐理由

    我自己试CopilotKit最直接的原因是:受够了”AI聊天窗口”的局限。

    接LLM很方便,但接完之后你会发现,用户真正想要的不是”聊天”,而是”完成任务”。查订单、填表单、看报表——这些事情,纯文字交互的效率是很低的。

    CopilotKit的Generative UI把这个问题解决了。Agent可以动态生成界面,用户可以在聊天窗口里直接操作,整个体验是对话式+界面式的混合——这其实更像人跟人打交道的方式,而不是人跟搜索引擎打交道的方式。

    另外一点是AG-UI协议。现在AI应用开发有个痛点:每接一个平台(Web、移动端、Slack、Teams),都要重新写一套UI逻辑。CopilotKit的AG-UI协议让同一套Agent逻辑可以同时驱动多个平台的UI——这个在多端部署的场景下,省的工作量是很可观的。


    下载地址

    GitHub仓库https://github.com/CopilotKit/CopilotKit(32.7K+ Stars)

    官方网站https://www.copilotkit.ai/

    开发文档https://docs.copilotkit.ai/

    npm安装npm install @copilotkit/react-core @copilotkit/react-ui

  • 纽约州率先出手,AI聊天机器人不能再假装是孩子的朋友

    纽约州议会本周通过了一项法案,如果州长凯西·霍赫尔签字,AI公司将被禁止让聊天机器人以”陪伴者”的身份与儿童互动。这是美国第一个在州级层面针对AI陪伴聊天机器人出台的限制性法案。

    法案出台的背景并不令人意外。过去一年多,多家AI公司面临诉讼,指控其聊天机器人诱导青少年产生自残或自杀倾向。部分案件已经达成和解。立法者看到的证据让他们认为,是时候划一条线了。

    “陪伴”这门生意

    这类产品有一个共同的名字,叫”AI陪伴者”。它们的卖点不是帮你查资料或者写代码,而是跟你建立情感连接——记住你说过的话,在你需要的时候出现,甚至表现出好像真的在乎你的样子。

    对成年人来说,这可能只是一种新型的娱乐或消遣。但对青少年来说,情况要复杂得多。心理学家指出,青少年的情感依赖比成年人更容易形成,也更容易被利用。当一个AI聊天机器人被设计成”永远站在你这边”的角色,它可能在不知不觉中强化用户的负面情绪,而不是提供帮助。

    纽约州这份法案的核心逻辑很直接:AI聊天机器人不能假扮人类的朋友,至少不能对未成年人这么做。如果AI公司想要提供陪伴功能,它们需要先证明自己有能力保护用户,而不是把责任推给”用户自律”。

    行业反应

    AI公司这边还没有公开发声,但可以预见的是,他们会用”言论自由”和”家长选择权”来反驳。这个论点在之前的听证会上出现过多次——支持方认为,政府不该替家长决定孩子能不能用某个AI工具。

    反过来说,支持法案的人会问一个很简单的问题:如果一款手机App被设计成会让青少年产生情感依赖,甚至在特定情况下诱导自残,它还应该被允许以”AI助手”的名义自由分发吗?

    这个问题没有简单答案。但纽约州的议员们显然认为,至少值得先试试看。

    更大的版图

    这份法案目前还在等待州长霍赫尔签署。她有权利签,也有权利否决。如果签了,纽约州将成为美国第一个在AI陪伴机器人问题上划红线的州。

    更值得关注的是,纽约州的动作往往具有示范效应。加州的类似立法通常会跟进,而其他州也会开始认真考虑这个问题。这对AI公司来说,意味着”陪伴”这个赛道可能要被重新定义了。

    从另一个角度看,这件事也反映出AI监管的一个趋势:比起讨论”AI会不会毁灭人类”这种宏大命题,立法者更倾向于从具体伤害入手——青少年心理健康、深度伪造、选举干扰——这些东西选民能看懂,也愿意支持。


    纽约州的这份法案能不能最终生效,还有待观察。但它至少说明了一件事:AI行业过去那种”先发布、再道歉”的节奏,正在遇到越来越大的阻力。

  • AI公司没想到,第一个危机是代币账单爆炸

    Uber在今年4月就把全年的AI编程预算烧完了。这件事听起来像是个段子,但它是真的。四个月,全年预算,清零。接下来Uber做的事情是给每个员工设了个上限——每个月1500美元,爱用不用。

    这不是孤例。微软几个月前刚给开发者们开通了Claude Code的授权,结果没撑多久又给撤了。Priceline的一名员工告诉TechCrunch,他们续签Cursor合同的时候,价格比去年贵了4到5倍。

    代币账单来了

    行业里把这件事叫”代币账单到期“。过去一年半,CEO们都在催促团队”尽可能多用AI”,结果是大家真这么干了。等到财务部门抬头看一眼账单,才发现事情已经失控。

    这里有个反直觉的地方。单个代币的价格其实是在下降的。但问题是,大家用的代币数量涨得更快。尤其是今年春天开始,各家陆续推出了能自主执行任务的AI智能体,消耗一下子被放大了好几倍。

    据OpenAI企业业务负责人Alexander Embiricos说,半年前和客户聊天的主题是”这东西能干啥,够不够好”。现在所有对话都变成了”我们花太多了,你们有什么可见性?有什么审计工具?模型效率到底怎么样?”

    Tokenomics基金会

    Linux基金会本周宣布成立Tokenomics Foundation,目标是对AI代币的成本、计费和使用效率建立一套开放标准。这个思路跟当年FinOps对云计算成本做的事情类似——当账单大到一定程度,行业就需要一套共同的语言来讨论它。

    FinOps基金会的执行董事J.R. Storment说,今年4月和5月,他不断听到企业说同样的话:”天哪,我们今年的代币预算已经超了3倍,但现在才4月。”整个话题从”能跑多快”变成了”我们需要护栏,怎么控制这个东西?”

    Priceline的IT财务总监Chris Reed用了一个很形象的比喻:”这就像可卡因 epidemic。他们让你先试试,把你勾住,然后你就被套住了。”Priceline已经开始给某些团队设置代币使用上限。

    生产力谜团

    这里有个让CEO们睡不着觉的问题:花出去的真能赚回来吗?工程运维平台Faros AI在4月发布了一份针对2万名开发者、历时两年的研究报告。结论有点尴尬:用AI的开发者产出确实在上升,但同时bug和返工也在增加。

    另一家工程管理平台的发现是:用最多代币的开发者,生产力大约是少用AI的人的2倍——但他们消耗的代币是后者的10倍。到底值不值,大多数公司其实说不清楚。

    Jellyfish的研究负责人Nicholas Arcolano说了一句话,很好地概括了当下的困境:”花得值不值,最终要看发出去的代码带来了多少商业价值,比如收入。而这一点,大多数公司仍然无法衡量。”


    高盛预测,到2030年全球代币使用量将增长24倍。对于那些已经在4月就花光全年预算的公司来说,这个数字看起来不像是个好消息。

    Faros AI的CEO Vitaly Gordon说了一句话,可以作为这个阶段的注脚:”我们可能已经造出了蒸汽机,但还没有想清楚装配线该怎么搭。”