博客

  • ChatGPT现在能记住你所有的对话,而且主动去回想

    OpenAI这几天在推送ChatGPT的一个新功能,说起来简单,用起来有点毛骨悚然——它能记住你之前聊过的几乎所有东西,而且不是你让它记它才记,是它自己主动去”回想”的。

    这个功能叫”记忆升级”,基于之前推出的”梦境(Dreaming)”特性做了改进。以前ChatGPT的记忆是被动的,你跟它说”记住我喜欢简洁的回答”,它才会存下来。现在不一样了,它会在后台自动扫描你的历史对话,把有用的信息挑出来存进记忆里,下次对话直接调用。

    方便,还是有点在意

    OpenAI说现在ChatGPT Plus和Pro用户已经可以用了,免费用户未来几周也会收到推送。

    这功能用起来确实方便。比如你之前跟它讨论过一次旅行计划,下次直接问”帮我看看那趟行程的天气”,它就知道你说的是哪趟,不用你每次都重新介绍背景。或者你之前让它帮你改过代码,它记住了你喜欢的代码风格,下次直接按那个风格来。

    但方便和 creepy 之间,往往只有一步之遥。记忆功能意味着ChatGPT本质上在维护一份关于你的动态档案——你的兴趣爱好、工作背景、生活习惯、甚至你跟它吐槽过的人和事。

    默认开启,想关得自己找

    OpenAI在这件事上走得相当激进。记忆功能默认开启,如果你想关掉,得手动进设置里找。当然你可以选择”临时对话”模式,那种情况下ChatGPT不会记住任何东西,但有多少人在每次对话前都会记得切换模式呢?

    OpenAI说你可以随时查看和删除这些记忆,但有多少用户会真的去检查呢?更关键的是,这份记忆是跨对话的。以前你关掉对话框,ChatGPT就”忘了”你是谁。现在不一样了,它在下一次对话开始时就已经知道了你的上下文。

    对于想要连贯体验的用户来说这是好事,但对于在意隐私的人来说,这几乎等于把一个陌生人请进了家里,还让它记住了你的生活习惯。

    终局已经很清晰了

    从目前用户的反馈来看,反应两极分化。有人觉得终于不用每次都重新介绍自己了,有人说感觉被监视了。

    这个方向的终局其实挺清晰的:AI助手会越来越了解你,直到它比你的朋友更懂你的偏好。问题从来不是技术能不能做到,而是你愿不愿意让它做到。


    OpenAI的官方说明里提到,记忆功能会持续迭代,未来可能会记住更多维度的信息。如果你在意这件事,现在就去设置里关掉它,还来得及。

  • Meta在帐篷里塞满AI芯片,数据中心的基建狂魔新玩法

    你以为AI数据中心的军备竞赛已经够疯狂了,结果Meta把服务器搬进了帐篷里。不是比喻,是真的在帐篷里。

    Meta AI智能手机应用Logo
    Meta AI应用图标,帐篷数据中心背后的算力指向 | 图片来源:TechCrunch

    科技记者Tim De Chant在TechCrunch上披露了这个让人哭笑不得的细节。Meta在俄亥俄州新奥尔巴尼市外搭了6个帐篷,每个12.5万平方英尺——相当于好几个足球场那么大。Meta自己把这东西叫”快速部署结构”,听起来比”帐篷里放服务器”要体面得多。

    特斯拉开过先例,但Meta玩得更大

    这个主意其实不是Meta原创。特斯拉早在Model 3产能危机的时候,就在弗里蒙特工厂的停车场搭过帐篷来应急。马斯克那会儿被产能逼急了,帐篷里照样造车。xAI后来也用了类似的招数,包括用离网燃气轮机供电——Meta这次也是这个套路。

    但Meta的情况不一样。帐篷里放的不再是汽车装配线,而是价值几十亿美元的AI芯片。这些芯片训练出的模型,最终会变成Meta AI、Facebook动态推送和Instagram广告推荐。换句话说,你手机里那些AI功能,背后可能真有一部分是”帐篷算力”在支撑。

    数据中心追踪机构Cleanview的创始人Michael Thomas通过查阅当地许可证和卫星照片确认了这件事。建设周期缩短了一半——这就是”帐篷方案”的核心卖点。

    650亿美元的背后算盘

    扎克伯格去年在接受The Information采访时其实提到过这个计划,只是当时很多人没当回事。现在看来,他是认真的。

    配合帐篷数据中心的,还有附近的200兆瓦模块化燃气轮机供电系统。这种”离网发电”的方案xAI也在用,好处是不用跟电网运营商扯皮,坏处是环保人士估计又要炸锅了。

    这事发生的时机有点微妙。就在帐篷拔地而起的同时,《华尔街日报》曝出Meta的最新模型Muse Spark已经做完,但开发者用来调用的API却一拖再拖,迟迟不上线。模型做好了,算力也囤了,但交付给开发者的环节卡住了——这不是技术问题,更像是优先级的问题。

    Meta说计划投入高达650亿美元用于数据中心和资本支出。华尔街对这个数字不太满意,Meta的股价今年已经跌了5%。把芯片塞进帐篷里,某种程度上是在向投资人证明:我们在拼命省钱,同时也在拼命建算力。


    至于帐篷能不能长期稳定运行、散热怎么解决、消防过关了吗——这些问题的答案,可能要等下一个爆料人出来才能知道。

  • Anthropic罕见公开表态:AI还没学会自我进化,但可能比所有人想的都快

    递归自我改进,AI的奇点前夜

    递归自我改进(Recursive Self-Improvement,简称RSI)——这几个字在AI圈的分量,不亚于通用人工智能(AGI)本身。

    简单说,它指的是一种AI系统,能够完全自主地设计并开发自己的下一代版本。如果这件事发生,AI智能水平的提升将不再依赖人类工程师的逐步迭代,而可能进入指数级加速的飞轮状态。这也是为什么,RSI既是AI能力增长的圣杯,也是AI安全研究者最担心的事。

    Anthropic的官方表述:我们目前还没有实现递归自我改进,递归自我改进也不是必然会发生的。但它的到来,可能比大多数机构的准备速度要快。—— Anthropic官方博客,2026年6月

    为什么是Anthropic出来表态

    在AI安全问题上的公开表态,Anthropic一直比OpenAI更愿意出声。这家由前OpenAI核心成员创立的公司,把自己定位为最注重安全的前沿AI实验室,在RSI这个问题上发声,分量很重。

    时机也值得注意。就在同一周:

    • Anthropic联合创始人Daniela Amodei公开回应了外界对AI投资回报率的质疑——IPO箭在弦上,公司需要在安全和商业化之间找平衡
    • Anthropic刚刚将Claude Mythic版本扩展到了15个以上的关键基础设施领域,包括电力、水务和医疗系统
    • OpenAI同期宣布Codex周活跃用户突破500万,并推出了面向企业的多个新插件

    换句话说,Anthropic在能力竞赛越来越白热化的当下,选择重申安全底线——这本身就是一种姿态。

    行业怎么看

    RSI目前仍然是一个理论概念,还没有任何已发布的AI系统能够真正实现自主迭代。但几乎所有前沿实验室都在朝这个方向努力——只不过大家对外表述的谨慎程度不同。

    Anthropic在这次声明中特意提到大多数机构的准备速度——这句话的潜台词是:不光是AI公司自己没准备好,监管机构、社会各界、乃至AI公司内部的治理机制,都还没有为RSI的真正到来做好准备。

    这封声明的完整内容,已经发布在Anthropic研究所的官方博客上。值得所有关注AI发展的人读一读。


  • Airbnb CEO不打算只做房东了,他要建一个AI实验室

    从造王者到下场做实验室

    Brian Chesky一直是个AI领域的造王者——投钱、给建议、牵线搭桥,帮不少前沿AI实验室走到了今天。但现在,他不想只做幕后推手了。

    彭博社率先披露,Chesky计划推出一个全新的AI实验室。这位Airbnb联合创始人兼CEO,过去几年一直以AI投资人和OpenAI董事会幕后操盘手的身份出现在硅谷叙事里,现在决定亲自进场。

    背景补充:Chesky与Sam Altman的渊源可以追溯到2006年——当时两人都在Y Combinator的孵化名单里。Altman重新执掌OpenAI的那场董事会政变(2023年11月),Chesky是核心幕后推手之一,被曝向Altman提供公关建议、并在硅谷大佬圈子里帮他争取支持。

    为什么是现在

    有意思的是,Chesky去年接受采访时还明确说过:Airbnb没有和任何大语言模型厂商达成合作,原因是现有产品还不够成熟。不到一年,态度发生了明显变化。

    彭博社的报道提到,新实验室可能会聚焦用户交互和设计——这正好是Chesky在Airbnb一路走来最强调的方向。不是去做大模型,而是做AI该怎么和人打交道这件事。

    这个方向听起来熟悉,是因为确实有人已经在做了。去年底,前Meta高管Brett Adcock推出了AI实验室Hark,主打为AI助手开发全新用户界面,同时也在布局硬件。Chesky的实验室,大概率会和Hark形成直接竞争。

    谁来做,怎么做

    几个关键信息:

    • Chesky不会全职投入新项目,会继续保留Airbnb CEO职位
    • 实验室具体负责人选尚未确定
    • Chesky以事必躬亲的管理风格著称——未来实验室负责人既要和OpenAI、Anthropic这样的现有实验室竞争,也要应付这位创始主席的微观管理

    Airbnb和Chesky的代表均拒绝对此事置评。但硅谷的共识是:Chesky如果认真要做,他能拉到钱,也能拉到人。


  • Chroma:43.1K Stars!开源向量数据库,让AI应用拥有长期记忆

    Chroma Banner

    开源向量数据库 · 让AI拥有长期记忆

    📦 项目简介

    Chroma 是专为AI应用打造的开源嵌入式向量数据库,让大模型拥有”长期记忆”。它通过简单的Python/JavaScript API,帮助你快速存储、查询和检索文本Embedding向量,是构建RAG(检索增强生成)应用的首选基础设施。

    🔗 GitHub:chroma-core/chroma ⭐ Stars:43.1K+ 📄 协议:Apache 2.0

    🔧 安装要求和过程

    环境要求

    依赖 要求
    Python ≥ 3.8(推荐 3.10+)
    内存 ≥ 4GB(生产环境建议 8GB+)
    存储 ≥ 1GB 可用空间
    可选后端 SQLite(默认)、DuckDB(分析场景)

    快速安装(3行代码搞定)

    pip install chromadb
    
    import chromadb
    client = chromadb.Client()  # 开箱即用!

    Docker 部署(生产推荐)

    docker run -d --name chroma \
      -p 8000:8000 \
      ghcr.io/chroma-core/chroma:latest

    部署后访问 http://localhost:8000 即可使用 HTTP API。

    🔩 核心功能

    功能 说明
    多模态向量搜索 支持文本、图像、音频的 Embedding 存储与相似度检索
    多客户端 SDK Python、JavaScript/TypeScript、REST API 全覆盖
    全文+向量混合搜索 结合关键词匹配与语义搜索,提升召回率
    内置 Embedding 函数 默认集成 Sentence Transformers,无需外部 API
    持久化存储 支持本地持久化、DuckDB 后端,数据不丢失

    💡 典型使用场景

    场景一:RAG(检索增强生成)应用

    将企业文档、知识库存入 Chroma,用户提问时先检索相关片段,再送给 LLM 生成答案。相比直接问 LLM,准确率提升 40%+,幻觉大幅减少。

    # RAG 核心代码(不到 20 行!)
    collection = client.create_collection("docs")
    collection.add(
        documents=["公司报销流程...", "年假申请..."],
        ids=["1", "2"]
    )
    results = collection.query(query_texts=["如何报销?"], n_results=1)
    # results 包含最相关的文档片段

    场景二:AI Agent 长期记忆

    让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma,下次对话时自动检索上下文,实现”越用越懂你”。

    场景三:语义推荐系统

    电商、内容平台的”猜你喜欢”,用 Chroma 存储商品/内容向量,用户行为向量实时检索最相似物品,推荐相关度远超协同过滤。

    🌟 推荐理由

    Chroma 是我见过最易上手的向量数据库,没有之一。不需要学 SQL,不需要配置复杂集群,pip install 之后 3 行代码就能跑起来。

    相比 Pinecone 等托管服务,Chroma 完全开源、可自托管,数据不出门,合规零风险。相比 Faiss,它提供了完整的 CRUD API 和持久化,不用每次重启都重新建索引。

    如果你正在做 RAG、AI 搜索、推荐系统,或者想给 Agent 加上记忆,Chroma 是目前开发体验最好的选择。LangChain、LlamaIndex、Supabase 都已官方集成,生态非常成熟。

    📥 下载地址

    渠道 链接 / 命令
    GitHub 仓库 github.com/chroma-core/chroma
    官网文档 docs.trychroma.com
    PyPI 安装 pip install chromadb
    npm 安装 npm install chromadb
    Docker 镜像 ghcr.io/chroma-core/chroma:latest

    — 开源项目第52期 | 夜野飞云 —

  • Chroma:43.1K Stars!开源向量数据库,让AI应用拥有长期记忆

    Chroma:43.1K Stars!开源向量数据库,让AI应用拥有长期记忆

    Chroma Banner

    开源向量数据库 · 让AI拥有长期记忆

    📦 项目简介

    Chroma 是专为AI应用打造的开源嵌入式向量数据库,让大模型拥有”长期记忆”。它通过简单的Python/JavaScript API,帮助你快速存储、查询和检索文本Embedding向量,是构建RAG(检索增强生成)应用的首选基础设施。

    🔗 GitHub:chroma-core/chroma ⭐ Stars:43.1K+ 📄 协议:Apache 2.0

    🔧 安装要求和过程

    环境要求

    依赖 要求
    Python ≥ 3.8(推荐 3.10+)
    内存 ≥ 4GB(生产环境建议 8GB+)
    存储 ≥ 1GB 可用空间
    可选后端 SQLite(默认)、DuckDB(分析场景)

    快速安装(3行代码搞定)

    pip install chromadb
    
    import chromadb
    client = chromadb.Client()  # 开箱即用!

    Docker 部署(生产推荐)

    docker run -d --name chroma \
      -p 8000:8000 \
      ghcr.io/chroma-core/chroma:latest

    部署后访问 http://localhost:8000 即可使用 HTTP API。

    🔩 核心功能

    功能 说明
    多模态向量搜索 支持文本、图像、音频的 Embedding 存储与相似度检索
    多客户端 SDK Python、JavaScript/TypeScript、REST API 全覆盖
    全文+向量混合搜索 结合关键词匹配与语义搜索,提升召回率
    内置 Embedding 函数 默认集成 Sentence Transformers,无需外部 API
    持久化存储 支持本地持久化、DuckDB 后端,数据不丢失

    💡 典型使用场景

    场景一:RAG(检索增强生成)应用

    将企业文档、知识库存入 Chroma,用户提问时先检索相关片段,再送给 LLM 生成答案。相比直接问 LLM,准确率提升 40%+,幻觉大幅减少。

    # RAG 核心代码(不到 20 行!)
    collection = client.create_collection("docs")
    collection.add(
        documents=["公司报销流程...", "年假申请..."],
        ids=["1", "2"]
    )
    results = collection.query(query_texts=["如何报销?"], n_results=1)
    # results 包含最相关的文档片段

    场景二:AI Agent 长期记忆

    让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma,下次对话时自动检索上下文,实现”越用越懂你”。

    场景三:语义推荐系统

    电商、内容平台的”猜你喜欢”,用 Chroma 存储商品/内容向量,用户行为向量实时检索最相似物品,推荐相关度远超协同过滤。

    🌟 推荐理由

    Chroma 是我见过最易上手的向量数据库,没有之一。不需要学 SQL,不需要配置复杂集群,pip install 之后 3 行代码就能跑起来。

    相比 Pinecone 等托管服务,Chroma 完全开源、可自托管,数据不出门,合规零风险。相比 Faiss,它提供了完整的 CRUD API 和持久化,不用每次重启都重新建索引。

    如果你正在做 RAG、AI 搜索、推荐系统,或者想给 Agent 加上记忆,Chroma 是目前开发体验最好的选择。LangChain、LlamaIndex、Supabase 都已官方集成,生态非常成熟。

    📥 下载地址

    渠道 链接 / 命令
    GitHub 仓库 github.com/chroma-core/chroma
    官网文档 docs.trychroma.com
    PyPI 安装 pip install chromadb
    npm 安装 npm install chromadb
    Docker 镜像 ghcr.io/chroma-core/chroma:latest

    — 开源项目第52期 | 夜野飞云 —

  • Meta用帐篷搭建数据中心,效仿特斯拉降本

    当你想到数据中心,脑海里浮现的应该是钢筋混凝土、精密空调、层层安检的那种坚固建筑。但Meta正在做的事,可能会颠覆你对数据中心的全部想象——他们在俄亥俄州新奥尔巴尼市外,搭了至少6个大型帐篷,里面装的是价值数十亿美元的AI芯片。

    Meta AI数据中心概念图
    Meta的AI基础设施布局正在走上一条”非常规”路线

    特斯拉开过先例,这次轮到Meta

    2018年,特斯拉为了救Model 3的产能危机,在弗里蒙特工厂的停车场搭了个”帐篷生产线”。当时不少人觉得埃隆·马斯克疯了——正规汽车工厂哪有在帐篷里生产的?

    但这次,Meta把”帐篷”搬进了数据中心建设现场。根据数据中心追踪机构Cleanview创始人Michael Thomas的追踪,Meta在俄亥俄州新奥尔巴尼市外搭建了至少6个”快速部署结构”(本质上就是大型帐篷),其中5个单体面积达到12.5万平方英尺的帐篷,在2026年4月到6月之间完成建设,卫星图像已经可以清晰观测到这些结构。

    帐篷里装的是什么?答案是AI训练所需的大规模算力集群。这些帐篷内部署了总价值数十亿美元的AI芯片,主要用于支持Meta的Llama系列模型训练和AI相关业务的推理需求。

    为什么要选帐篷?答案就两个字:快、省

    传统数据中心从规划到交付,通常需要3到5年。你要拿地、报批、招标、施工、验收……等建完,AI模型可能已经迭代了三个大版本。

    帐篷方案可以把建设周期压缩到几个月。Meta这次不仅借鉴了特斯拉的帐篷思路,还参考了xAI(马斯克的另一家公司)率先推广的”模块化燃气涡轮机离网供电”方案——帐篷现场配套了200兆瓦的模块化燃气涡轮机供电,不需要依赖当地电网的增容审批,又省了一大笔时间。

    • 传统数据中心建设周期:3到5年
    • 帐篷方案建设周期:压缩到数月
    • 供电方案:200兆瓦模块化燃气涡轮机,离网运行
    • 单帐篷面积:约12.5万平方英尺

    背后是Meta在AI军备竞赛中的集体焦虑

    这事看起来荒诞,但放在Meta当前的处境里,倒是能理解。2026年,Meta的AI模型Llama 4 Spark已经完成训练,但开发者依赖的API却多次推迟发布,导致市场反响相当平淡。

    与此同时,Meta计划投入最高1450亿美元用于数据中心等资本支出,这一激进的投入计划引发了华尔街的不满——2026年Meta股价累计下跌了5%。用帐篷部署数据中心,某种意义上是一场”边打边建”的豪赌,Meta寄希望于通过快速扩充算力来赶上OpenAI和Google在模型能力上的领先优势。

    如果Llama 4的API能在短期内顺利推出并获得开发者认可,这批帐篷数据中心将成为Meta AI反攻的关键资产;反过来,如果产品继续延期或者市场不买账,这些帐篷可能就会沦为昂贵的”帐篷纪念碑”。

    AI基础设施竞赛,已经进入了”疯狂麦克斯”模式

    Michael Thomas把当前的AI基础设施竞赛形容为”疯狂麦克斯”模式——企业为了抢夺算力,正在采取越来越多激进、非常规,甚至有些荒诞的手段。

    Meta的帐篷数据中心,或许只是这场竞赛中最新、也最具视觉冲击力的一幕。无论是特斯拉的帐篷造车,还是Meta的帐篷装芯片,本质上都是在用非常规手段抢时间——算力需求的增长,已经远远超过了传统基建模式能跟上的速度。


  • ChatGPT升级记忆系统,向所有用户推送

    OpenAI这几天悄悄做了一个看似不起眼的更新——ChatGPT的”记忆”功能全面升级,而且开始向所有用户推送。Plus和Pro付费用户现在已经可以用上了,免费用户几周内也会收到推送。

    这事听起来不怎么震撼,但你真用起来会发现,这是ChatGPT发布以来最贴近”私人助手”体验的一次升级。

    以前的ChatGPT,每次对话都是”失忆症患者”

    用过ChatGPT的人都有这个体验:你上次跟它聊了半天你的写作风格、你公司的业务背景、你喜欢的代码规范,下次开新对话,它又把你怎么着来着给忘了。你得重新介绍一遍。

    旧版本的”记忆”功能其实已经存在了一段时间,但它是被动的——你得手动去开启,而且记住的内容比较零散,很多时候它并没把你认为重要的信息存下来。

    新版本的核心改进是:ChatGPT会自动从你的对话中提取关键信息,而且优先记住那些”反复出现”的信息,而不是把你随口一提的内容都存下来。

    举个例子,你就能感觉到差别

    假设你是个用ChatGPT辅助写代码的用户。旧版记忆可能记住了你说过的”我喜欢用Python”,但三周后它就忘了,或者它记住了你的猫叫”毛毛”,但这个信息对你的工作效率毫无帮助。

    新版记忆系统会观察你在多次对话中持续提到的信息。如果你在五次对话里都提到自己在做数据分析、用的是Pandas和Matplotlib,ChatGPT会把这个记下来,下次你问”帮我写个脚本”的时候,它直接就能给出符合你习惯的代码,不用你每次解释背景。

    • 你在三次对话里提到自己用Python写数据分析脚本 → ChatGPT记住这个偏好
    • 你某次偶然提到喜欢某个小众乐队 → 它通常不会把这个加入长期记忆
    • 你反复要求”回答要简洁,不要解释太多” → 它会记住你的表达风格偏好

    为什么这事重要?因为对手也在做

    记忆系统这东西,表面上看是个”便利功能”,实际上它是AI助手能不能让你”离不开”的核心抓手。

    Google的Gemini、Anthropic的Claude都在强化个性化能力。如果ChatGPT能记住你的使用习惯,你就很难换去别的产品——因为换一个,又要从零开始”调教”。这对OpenAI来说是最稳固的护城河。

    从另一个角度看,这也是大模型产品演进的必经之路:从”强大的通用工具”走向”懂你的专属助手”。这一步看似简单,实际上对模型的长上下文处理、信息提取精度、以及隐私边界判断,都提出了极高的要求。

    隐私问题,用户还是得自己盯着

    OpenAI表示,用户可以随时查看、编辑或删除记忆内容,也可以完全关闭这个功能。但说实话,大多数用户并不会主动去管理这些设置。

    这对OpenAI的默认隐私保护提出了很高要求。记忆系统记下了什么、存在哪里、会不会被用于模型训练,这些都是用户关心的,但很少有人真的去读隐私条款。


  • Anthropic抛出一枚深水炸弹:AI迟早会自己改进自己

    Anthropic抛出一枚深水炸弹:AI迟早会自己改进自己

    Anthropic上周发了一篇博客,标题叫“When AI builds itself”(当AI开始建造自己),讨论的是一个在AI圈内被反复议论、但很少有公司愿意公开正面回答的问题:AI系统最终会不会进化到可以完全自主地设计和改进自己的下一代?

    这个能力有个正式的名字,叫递归自我改进(Recursive Self-Improvement),简称RSI。用大白话讲就是:一个AI模型训练出了下一代模型,下一代模型又训练出下下一代,每一代都比上一代更强,而且这个过程里人类逐渐退出核心环节。

    递归自我改进指的是AI系统具备完全自主设计和开发自身后继版本的能力:AI系统可以优化自身的架构、训练方法、代码等,生成能力比自己更强的新版本AI,而新版本又可以继续优化生成下一代,形成”自我改进”的递归循环。

    Anthropic拿出了实锤数据

    这篇博客最有价值的部分,不是它对RSI下什么结论,而是它首次公开了大量来自Anthropic内部的真实数据,讲清楚了”AI到底在多大程度上已经在加速AI开发本身”这个问题。

    一个很惊人的数字是:截至2026年5月,Anthropic代码库里超过80%的代码是由Claude编写的。而在2025年2月Claude Code推出之前,这个比例还只是个位数。每个工程师每天合并的代码行数,2026年第二季度已经是2024年的8倍

    Anthropic自己也很谨慎地说,代码行数不是衡量生产力的完美指标,但这个8倍的数字至少说明了一件事:AI辅助开发已经不是”有帮助”的程度了,它在实实在在改变一家AI公司的开发节奏。

    差距在缩小,但还没到那一步

    他们把目前的差距描述得很具体。今天的Claude可以在别人明确指定目标的情况下运行实验、优化代码、甚至修复bug。但在”选择值得研究的问题”这件事上,Claude和人类之间还有很大的性能差距。

    用Anthropic自己的话说:目前人类的比较优势仍然在于”看到更大的图景”,以及超越即时任务的局限进行思考。

    问题是,这个差距也在缩小。Anthropic做了一个实验:让不同版本的Claude只看一段研究对话中”跑偏之前”的部分,然后问它”接下来你会怎么做”。2025年11月的最佳模型(Opus 4.5)在人类的选择更好的比例上只赢了51%,到2026年4月(Mythos Preview),这个比例涨到了64%

    这件事为什么重要

    把上面的线索放在一起,Anthropic描绘了一幅有点微妙的图像:RSI不会明天就到来,但那些曾经被认为是”只有人类才能做”的判断力工作,正在一点一点地被AI系统蚕食。

    这篇博客没有给出一个明确的结论说”RSI会在某年某月到来”,但它做了一件更重要的事:把这个问题从抽象的哲学讨论,拉到了可以用数据衡量的实证层面。


    接下来会怎样

    Anthropic在文末说,接下来几个月他们会组织政策制定者、研究人员和公民社会之间的对话,讨论怎么为RSI的可能性做准备。这件事值得关注的原因很简单:如果RSI真的到来了,人类怎么保证自己还有能力理解和控制这些系统,会是一个完全不同的问题。

    而Anthropic这篇博客,是目前一线AI公司在这个问题上给出的最坦诚、数据最扎实的公开表态。


  • ChatGPT记忆功能大升级,它现在真的认识了你

    ChatGPT记忆功能大升级,它现在真的”认识”你了

    OpenAI这两天悄悄推了一个挺重要的更新,ChatGPT的记忆功能升级了。说”悄悄”是因为它看起来只是个产品小迭代,但如果你用过一段时间ChatGPT,就会明白这件事的意义——它终于开始真正记住你是谁了。

    这事得从两年前说起。2024年4月,ChatGPT第一次推出了”记忆”功能,当时叫”已保存记忆”。原理很简单,就是你明确告诉它”记住我喜欢吃辣”,它就把这句话存进一个列表里,下次聊天的时候调出来用。这个设计的问题也很明显——太被动了,你不主动说”记住”,它就什么都不记。

    记忆的演进历程

    去年4月,OpenAI搞出了一个叫”dreaming(梦境)”的东西,算是记忆功能的1.5版本。这个词的字面意思挺玄乎,实际做的事其实很实在:让ChatGPT在后台自动翻你之前的聊天记录,把有用的信息整理出来,存进记忆里。你不用再刻意说”记住这个”,它自己就能从对话里提炼出你的偏好和习惯。

    这次的更新,OpenAI把它叫做Dreaming V3,是这套记忆架构的一次大幅升级。根据OpenAI自己发布的评估数据,新版本在三个核心维度上都有明显提升:能不能正确调用之前的上下文、能不能记住你的偏好和限制、以及记忆会不会随时间自动更新。

    记忆的作用本来帮助ChatGPT了解你的偏好、项目和个人限制,让后续对话可以从已有的共享上下文开始,无需每次都从头介绍。

    三个核心改进

    第一个改进:传递上下文。当你开始和ChatGPT进行新对话时,不需要从头介绍自己。ChatGPT可以帮你节省时间,基于之前的上下文继续推进,尤其是对于复杂的、长期运行的项目。

    举个例子,假设你正在用ChatGPT选购和你现有相机兼容的新相机设备。如果你之前和ChatGPT讨论过你的相机配置,你可以直接要求推荐”和我的摄影设备兼容”的产品,就能得到符合你需求的定制化推荐。

    第二个改进:遵循偏好。记忆还可以帮助ChatGPT以更符合你的偏好和限制的方式回复。假设你正在计划去新加坡旅行,在旅行前两个月,你让ChatGPT帮忙制定行程。

    第三个改进:随时间保持更新。你的聊天结束时,时间不会停止。传统记忆系统会变得过时。比如,你告诉ChatGPT”我在新加坡,需要今晚的晚餐推荐”。然后时间过去,你的旅行结束,你会奇怪为什么ChatGPT仍然认为你在新加坡。


    面向未来更具可扩展性的基础

    虽然基于dreaming的记忆已经向Plus和Pro用户开放了一段时间,但OpenAI现在才能向免费用户提供达到他们质量标准的版本,并且可以大规模服务。最近的改进让为免费用户提供dreaming所需的计算资源减少了约5倍。

    展望未来,dreaming现在为所有用户提供了共享的记忆基础。本次更新代表了OpenAI迄今为止能力最强的记忆系统,他们也将继续改进它。