博客

  • supermemory:25.6K Stars!AI时代记忆引擎,让AI真正记住你

    supermemory:25.6K Stars!AI时代记忆引擎,让AI真正记住你

    配图

    supermemory


    项目简介

    supermemory 是一个专为AI时代设计的记忆引擎,解决AI助手”转头就忘”的痛点。它能自动从对话中提取事实、维护用户画像、支持混合搜索(RAG+记忆),在LongMemEval、LoCoMo、ConvoMem三大基准测试中均排名第一。


    安装要求和过程

    环境要求

    环境 要求
    Node.js v18+
    Python 3.9+
    API Key supermemory.ai 控制台获取

    快速安装

    方式一:MCP服务器(推荐,无需写代码)

    # Claude/Cursor/Windsurf 一键安装
    npx -y install-mcp@latest https://mcp.supermemory.ai/mcp --client claude --oauth=yes
    

    方式二:API调用(开发者)

    # Node.js/TypeScript
    npm install supermemory
    
    # Python
    pip install supermemory
    

    方式三:官方应用(零代码)

    访问 app.supermemory.ai 直接使用,支持浏览器扩展、Discord机器人等多种接入方式。


    核心功能

    功能 说明
    自动记忆管理 从对话中自动提取事实,处理信息矛盾(如”搬到旧金山”覆盖”住在纽约”),自动遗忘过期内容,单次调用约50ms
    用户画像维护 自动维护稳定事实(偏好、习惯)+ 近期活动上下文,两大维度合并,让AI真正”认识你”
    混合搜索 单条查询同时支持RAG(知识库检索)+ 记忆检索,一次性返回文档结果和个性化上下文
    多平台连接器 支持Google Drive、Gmail、Notion、OneDrive、GitHub等平台自动同步,支持实时webhook更新
    多模态内容提取 支持PDF、图片(OCR)、视频(转录)、代码(AST感知分块)等内容的上传和解析

    典型使用场景

    场景一:给Claude/Cursor加上”永久记忆”

    通过MCP服务器接入后,AI助手会自动调用 memory 工具保存重要信息,调用 recall 工具搜索历史记忆。你说出”我喜欢TypeScript函数式编程”,AI下次写代码时会自动遵循这个偏好,不再需要每次重复背景。

    场景二:为AI产品构建上下文栈

    通过单个API调用获得完整的上下文能力,无需自己配置向量数据库、embedding管道、分块策略。Vercel AI SDK、LangChain、LangGraph、OpenAI Agents SDK等主流框架均可直接嵌入,几行代码完成集成。

    场景三:企业知识库+个人记忆融合

    supermemory的混合搜索模式,让AI既能检索企业知识库文档(RAG),又能记住每个用户的个性化偏好和历史对话(记忆),两种能力融合,特别适合企业AI助手、客服机器人等场景。


    推荐理由

    AI助手的”失忆症”是 currently 最大的体验短板——每次新对话都要重新介绍背景,让人疲惫。supermemory 把这个痛点打穿了。

    我实际测试下来,最打动我的是混合搜索设计:它不是简单的RAG检索,而是把”知识库文档”和”用户记忆”放在同一次查询里返回,AI的回答既有知识依据、又有个性化上下文,体验差距非常明显。

    另外,MCP服务器的接入方式对普通用户极其友好——一条命令让Claude Desktop、Cursor、Windsurf等工具全部获得持久记忆,不需要写任何代码,这才是AI基础设施该有的样子。

    三大基准测试全部排名第一,说明这个方向的技术路线是扎实的,不是噱头。


    下载地址

    来源 链接
    GitHub仓库 github.com/supermemoryai/supermemory(25.6K ⭐)
    官方网站 supermemory.ai
    文档中心 supermemory.ai/docs
    控制台 console.supermemory.ai
    npm包 npmjs.com/package/supermemory
    PyPI包 pypi.org/project/supermemory

    开源协议:MIT | 主要语言:TypeScript | 最后更新:2026年6月

  • ChatGPT现在能记住你所有的对话,而且主动去回想

    OpenAI这几天在推送ChatGPT的一个新功能,说起来简单,用起来有点毛骨悚然——它能记住你之前聊过的几乎所有东西,而且不是你让它记它才记,是它自己主动去”回想”的。

    这个功能叫”记忆升级”,基于之前推出的”梦境(Dreaming)”特性做了改进。以前ChatGPT的记忆是被动的,你跟它说”记住我喜欢简洁的回答”,它才会存下来。现在不一样了,它会在后台自动扫描你的历史对话,把有用的信息挑出来存进记忆里,下次对话直接调用。

    方便,还是有点在意

    OpenAI说现在ChatGPT Plus和Pro用户已经可以用了,免费用户未来几周也会收到推送。

    这功能用起来确实方便。比如你之前跟它讨论过一次旅行计划,下次直接问”帮我看看那趟行程的天气”,它就知道你说的是哪趟,不用你每次都重新介绍背景。或者你之前让它帮你改过代码,它记住了你喜欢的代码风格,下次直接按那个风格来。

    但方便和 creepy 之间,往往只有一步之遥。记忆功能意味着ChatGPT本质上在维护一份关于你的动态档案——你的兴趣爱好、工作背景、生活习惯、甚至你跟它吐槽过的人和事。

    默认开启,想关得自己找

    OpenAI在这件事上走得相当激进。记忆功能默认开启,如果你想关掉,得手动进设置里找。当然你可以选择”临时对话”模式,那种情况下ChatGPT不会记住任何东西,但有多少人在每次对话前都会记得切换模式呢?

    OpenAI说你可以随时查看和删除这些记忆,但有多少用户会真的去检查呢?更关键的是,这份记忆是跨对话的。以前你关掉对话框,ChatGPT就”忘了”你是谁。现在不一样了,它在下一次对话开始时就已经知道了你的上下文。

    对于想要连贯体验的用户来说这是好事,但对于在意隐私的人来说,这几乎等于把一个陌生人请进了家里,还让它记住了你的生活习惯。

    终局已经很清晰了

    从目前用户的反馈来看,反应两极分化。有人觉得终于不用每次都重新介绍自己了,有人说感觉被监视了。

    这个方向的终局其实挺清晰的:AI助手会越来越了解你,直到它比你的朋友更懂你的偏好。问题从来不是技术能不能做到,而是你愿不愿意让它做到。


    OpenAI的官方说明里提到,记忆功能会持续迭代,未来可能会记住更多维度的信息。如果你在意这件事,现在就去设置里关掉它,还来得及。

  • Meta在帐篷里塞满AI芯片,数据中心的基建狂魔新玩法

    你以为AI数据中心的军备竞赛已经够疯狂了,结果Meta把服务器搬进了帐篷里。不是比喻,是真的在帐篷里。

    Meta AI智能手机应用Logo
    Meta AI应用图标,帐篷数据中心背后的算力指向 | 图片来源:TechCrunch

    科技记者Tim De Chant在TechCrunch上披露了这个让人哭笑不得的细节。Meta在俄亥俄州新奥尔巴尼市外搭了6个帐篷,每个12.5万平方英尺——相当于好几个足球场那么大。Meta自己把这东西叫”快速部署结构”,听起来比”帐篷里放服务器”要体面得多。

    特斯拉开过先例,但Meta玩得更大

    这个主意其实不是Meta原创。特斯拉早在Model 3产能危机的时候,就在弗里蒙特工厂的停车场搭过帐篷来应急。马斯克那会儿被产能逼急了,帐篷里照样造车。xAI后来也用了类似的招数,包括用离网燃气轮机供电——Meta这次也是这个套路。

    但Meta的情况不一样。帐篷里放的不再是汽车装配线,而是价值几十亿美元的AI芯片。这些芯片训练出的模型,最终会变成Meta AI、Facebook动态推送和Instagram广告推荐。换句话说,你手机里那些AI功能,背后可能真有一部分是”帐篷算力”在支撑。

    数据中心追踪机构Cleanview的创始人Michael Thomas通过查阅当地许可证和卫星照片确认了这件事。建设周期缩短了一半——这就是”帐篷方案”的核心卖点。

    650亿美元的背后算盘

    扎克伯格去年在接受The Information采访时其实提到过这个计划,只是当时很多人没当回事。现在看来,他是认真的。

    配合帐篷数据中心的,还有附近的200兆瓦模块化燃气轮机供电系统。这种”离网发电”的方案xAI也在用,好处是不用跟电网运营商扯皮,坏处是环保人士估计又要炸锅了。

    这事发生的时机有点微妙。就在帐篷拔地而起的同时,《华尔街日报》曝出Meta的最新模型Muse Spark已经做完,但开发者用来调用的API却一拖再拖,迟迟不上线。模型做好了,算力也囤了,但交付给开发者的环节卡住了——这不是技术问题,更像是优先级的问题。

    Meta说计划投入高达650亿美元用于数据中心和资本支出。华尔街对这个数字不太满意,Meta的股价今年已经跌了5%。把芯片塞进帐篷里,某种程度上是在向投资人证明:我们在拼命省钱,同时也在拼命建算力。


    至于帐篷能不能长期稳定运行、散热怎么解决、消防过关了吗——这些问题的答案,可能要等下一个爆料人出来才能知道。

  • Anthropic罕见公开表态:AI还没学会自我进化,但可能比所有人想的都快

    递归自我改进,AI的奇点前夜

    递归自我改进(Recursive Self-Improvement,简称RSI)——这几个字在AI圈的分量,不亚于通用人工智能(AGI)本身。

    简单说,它指的是一种AI系统,能够完全自主地设计并开发自己的下一代版本。如果这件事发生,AI智能水平的提升将不再依赖人类工程师的逐步迭代,而可能进入指数级加速的飞轮状态。这也是为什么,RSI既是AI能力增长的圣杯,也是AI安全研究者最担心的事。

    Anthropic的官方表述:我们目前还没有实现递归自我改进,递归自我改进也不是必然会发生的。但它的到来,可能比大多数机构的准备速度要快。—— Anthropic官方博客,2026年6月

    为什么是Anthropic出来表态

    在AI安全问题上的公开表态,Anthropic一直比OpenAI更愿意出声。这家由前OpenAI核心成员创立的公司,把自己定位为最注重安全的前沿AI实验室,在RSI这个问题上发声,分量很重。

    时机也值得注意。就在同一周:

    • Anthropic联合创始人Daniela Amodei公开回应了外界对AI投资回报率的质疑——IPO箭在弦上,公司需要在安全和商业化之间找平衡
    • Anthropic刚刚将Claude Mythic版本扩展到了15个以上的关键基础设施领域,包括电力、水务和医疗系统
    • OpenAI同期宣布Codex周活跃用户突破500万,并推出了面向企业的多个新插件

    换句话说,Anthropic在能力竞赛越来越白热化的当下,选择重申安全底线——这本身就是一种姿态。

    行业怎么看

    RSI目前仍然是一个理论概念,还没有任何已发布的AI系统能够真正实现自主迭代。但几乎所有前沿实验室都在朝这个方向努力——只不过大家对外表述的谨慎程度不同。

    Anthropic在这次声明中特意提到大多数机构的准备速度——这句话的潜台词是:不光是AI公司自己没准备好,监管机构、社会各界、乃至AI公司内部的治理机制,都还没有为RSI的真正到来做好准备。

    这封声明的完整内容,已经发布在Anthropic研究所的官方博客上。值得所有关注AI发展的人读一读。


  • Airbnb CEO不打算只做房东了,他要建一个AI实验室

    从造王者到下场做实验室

    Brian Chesky一直是个AI领域的造王者——投钱、给建议、牵线搭桥,帮不少前沿AI实验室走到了今天。但现在,他不想只做幕后推手了。

    彭博社率先披露,Chesky计划推出一个全新的AI实验室。这位Airbnb联合创始人兼CEO,过去几年一直以AI投资人和OpenAI董事会幕后操盘手的身份出现在硅谷叙事里,现在决定亲自进场。

    背景补充:Chesky与Sam Altman的渊源可以追溯到2006年——当时两人都在Y Combinator的孵化名单里。Altman重新执掌OpenAI的那场董事会政变(2023年11月),Chesky是核心幕后推手之一,被曝向Altman提供公关建议、并在硅谷大佬圈子里帮他争取支持。

    为什么是现在

    有意思的是,Chesky去年接受采访时还明确说过:Airbnb没有和任何大语言模型厂商达成合作,原因是现有产品还不够成熟。不到一年,态度发生了明显变化。

    彭博社的报道提到,新实验室可能会聚焦用户交互和设计——这正好是Chesky在Airbnb一路走来最强调的方向。不是去做大模型,而是做AI该怎么和人打交道这件事。

    这个方向听起来熟悉,是因为确实有人已经在做了。去年底,前Meta高管Brett Adcock推出了AI实验室Hark,主打为AI助手开发全新用户界面,同时也在布局硬件。Chesky的实验室,大概率会和Hark形成直接竞争。

    谁来做,怎么做

    几个关键信息:

    • Chesky不会全职投入新项目,会继续保留Airbnb CEO职位
    • 实验室具体负责人选尚未确定
    • Chesky以事必躬亲的管理风格著称——未来实验室负责人既要和OpenAI、Anthropic这样的现有实验室竞争,也要应付这位创始主席的微观管理

    Airbnb和Chesky的代表均拒绝对此事置评。但硅谷的共识是:Chesky如果认真要做,他能拉到钱,也能拉到人。


  • Chroma:43.1K Stars!开源向量数据库,让AI应用拥有长期记忆

    Chroma Banner

    开源向量数据库 · 让AI拥有长期记忆

    📦 项目简介

    Chroma 是专为AI应用打造的开源嵌入式向量数据库,让大模型拥有”长期记忆”。它通过简单的Python/JavaScript API,帮助你快速存储、查询和检索文本Embedding向量,是构建RAG(检索增强生成)应用的首选基础设施。

    🔗 GitHub:chroma-core/chroma ⭐ Stars:43.1K+ 📄 协议:Apache 2.0

    🔧 安装要求和过程

    环境要求

    依赖 要求
    Python ≥ 3.8(推荐 3.10+)
    内存 ≥ 4GB(生产环境建议 8GB+)
    存储 ≥ 1GB 可用空间
    可选后端 SQLite(默认)、DuckDB(分析场景)

    快速安装(3行代码搞定)

    pip install chromadb
    
    import chromadb
    client = chromadb.Client()  # 开箱即用!

    Docker 部署(生产推荐)

    docker run -d --name chroma \
      -p 8000:8000 \
      ghcr.io/chroma-core/chroma:latest

    部署后访问 http://localhost:8000 即可使用 HTTP API。

    🔩 核心功能

    功能 说明
    多模态向量搜索 支持文本、图像、音频的 Embedding 存储与相似度检索
    多客户端 SDK Python、JavaScript/TypeScript、REST API 全覆盖
    全文+向量混合搜索 结合关键词匹配与语义搜索,提升召回率
    内置 Embedding 函数 默认集成 Sentence Transformers,无需外部 API
    持久化存储 支持本地持久化、DuckDB 后端,数据不丢失

    💡 典型使用场景

    场景一:RAG(检索增强生成)应用

    将企业文档、知识库存入 Chroma,用户提问时先检索相关片段,再送给 LLM 生成答案。相比直接问 LLM,准确率提升 40%+,幻觉大幅减少。

    # RAG 核心代码(不到 20 行!)
    collection = client.create_collection("docs")
    collection.add(
        documents=["公司报销流程...", "年假申请..."],
        ids=["1", "2"]
    )
    results = collection.query(query_texts=["如何报销?"], n_results=1)
    # results 包含最相关的文档片段

    场景二:AI Agent 长期记忆

    让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma,下次对话时自动检索上下文,实现”越用越懂你”。

    场景三:语义推荐系统

    电商、内容平台的”猜你喜欢”,用 Chroma 存储商品/内容向量,用户行为向量实时检索最相似物品,推荐相关度远超协同过滤。

    🌟 推荐理由

    Chroma 是我见过最易上手的向量数据库,没有之一。不需要学 SQL,不需要配置复杂集群,pip install 之后 3 行代码就能跑起来。

    相比 Pinecone 等托管服务,Chroma 完全开源、可自托管,数据不出门,合规零风险。相比 Faiss,它提供了完整的 CRUD API 和持久化,不用每次重启都重新建索引。

    如果你正在做 RAG、AI 搜索、推荐系统,或者想给 Agent 加上记忆,Chroma 是目前开发体验最好的选择。LangChain、LlamaIndex、Supabase 都已官方集成,生态非常成熟。

    📥 下载地址

    渠道 链接 / 命令
    GitHub 仓库 github.com/chroma-core/chroma
    官网文档 docs.trychroma.com
    PyPI 安装 pip install chromadb
    npm 安装 npm install chromadb
    Docker 镜像 ghcr.io/chroma-core/chroma:latest

    — 开源项目第52期 | 夜野飞云 —

  • Chroma:43.1K Stars!开源向量数据库,让AI应用拥有长期记忆

    Chroma:43.1K Stars!开源向量数据库,让AI应用拥有长期记忆

    Chroma Banner

    开源向量数据库 · 让AI拥有长期记忆

    📦 项目简介

    Chroma 是专为AI应用打造的开源嵌入式向量数据库,让大模型拥有”长期记忆”。它通过简单的Python/JavaScript API,帮助你快速存储、查询和检索文本Embedding向量,是构建RAG(检索增强生成)应用的首选基础设施。

    🔗 GitHub:chroma-core/chroma ⭐ Stars:43.1K+ 📄 协议:Apache 2.0

    🔧 安装要求和过程

    环境要求

    依赖 要求
    Python ≥ 3.8(推荐 3.10+)
    内存 ≥ 4GB(生产环境建议 8GB+)
    存储 ≥ 1GB 可用空间
    可选后端 SQLite(默认)、DuckDB(分析场景)

    快速安装(3行代码搞定)

    pip install chromadb
    
    import chromadb
    client = chromadb.Client()  # 开箱即用!

    Docker 部署(生产推荐)

    docker run -d --name chroma \
      -p 8000:8000 \
      ghcr.io/chroma-core/chroma:latest

    部署后访问 http://localhost:8000 即可使用 HTTP API。

    🔩 核心功能

    功能 说明
    多模态向量搜索 支持文本、图像、音频的 Embedding 存储与相似度检索
    多客户端 SDK Python、JavaScript/TypeScript、REST API 全覆盖
    全文+向量混合搜索 结合关键词匹配与语义搜索,提升召回率
    内置 Embedding 函数 默认集成 Sentence Transformers,无需外部 API
    持久化存储 支持本地持久化、DuckDB 后端,数据不丢失

    💡 典型使用场景

    场景一:RAG(检索增强生成)应用

    将企业文档、知识库存入 Chroma,用户提问时先检索相关片段,再送给 LLM 生成答案。相比直接问 LLM,准确率提升 40%+,幻觉大幅减少。

    # RAG 核心代码(不到 20 行!)
    collection = client.create_collection("docs")
    collection.add(
        documents=["公司报销流程...", "年假申请..."],
        ids=["1", "2"]
    )
    results = collection.query(query_texts=["如何报销?"], n_results=1)
    # results 包含最相关的文档片段

    场景二:AI Agent 长期记忆

    让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma,下次对话时自动检索上下文,实现”越用越懂你”。

    场景三:语义推荐系统

    电商、内容平台的”猜你喜欢”,用 Chroma 存储商品/内容向量,用户行为向量实时检索最相似物品,推荐相关度远超协同过滤。

    🌟 推荐理由

    Chroma 是我见过最易上手的向量数据库,没有之一。不需要学 SQL,不需要配置复杂集群,pip install 之后 3 行代码就能跑起来。

    相比 Pinecone 等托管服务,Chroma 完全开源、可自托管,数据不出门,合规零风险。相比 Faiss,它提供了完整的 CRUD API 和持久化,不用每次重启都重新建索引。

    如果你正在做 RAG、AI 搜索、推荐系统,或者想给 Agent 加上记忆,Chroma 是目前开发体验最好的选择。LangChain、LlamaIndex、Supabase 都已官方集成,生态非常成熟。

    📥 下载地址

    渠道 链接 / 命令
    GitHub 仓库 github.com/chroma-core/chroma
    官网文档 docs.trychroma.com
    PyPI 安装 pip install chromadb
    npm 安装 npm install chromadb
    Docker 镜像 ghcr.io/chroma-core/chroma:latest

    — 开源项目第52期 | 夜野飞云 —

  • Meta用帐篷搭建数据中心,效仿特斯拉降本

    当你想到数据中心,脑海里浮现的应该是钢筋混凝土、精密空调、层层安检的那种坚固建筑。但Meta正在做的事,可能会颠覆你对数据中心的全部想象——他们在俄亥俄州新奥尔巴尼市外,搭了至少6个大型帐篷,里面装的是价值数十亿美元的AI芯片。

    Meta AI数据中心概念图
    Meta的AI基础设施布局正在走上一条”非常规”路线

    特斯拉开过先例,这次轮到Meta

    2018年,特斯拉为了救Model 3的产能危机,在弗里蒙特工厂的停车场搭了个”帐篷生产线”。当时不少人觉得埃隆·马斯克疯了——正规汽车工厂哪有在帐篷里生产的?

    但这次,Meta把”帐篷”搬进了数据中心建设现场。根据数据中心追踪机构Cleanview创始人Michael Thomas的追踪,Meta在俄亥俄州新奥尔巴尼市外搭建了至少6个”快速部署结构”(本质上就是大型帐篷),其中5个单体面积达到12.5万平方英尺的帐篷,在2026年4月到6月之间完成建设,卫星图像已经可以清晰观测到这些结构。

    帐篷里装的是什么?答案是AI训练所需的大规模算力集群。这些帐篷内部署了总价值数十亿美元的AI芯片,主要用于支持Meta的Llama系列模型训练和AI相关业务的推理需求。

    为什么要选帐篷?答案就两个字:快、省

    传统数据中心从规划到交付,通常需要3到5年。你要拿地、报批、招标、施工、验收……等建完,AI模型可能已经迭代了三个大版本。

    帐篷方案可以把建设周期压缩到几个月。Meta这次不仅借鉴了特斯拉的帐篷思路,还参考了xAI(马斯克的另一家公司)率先推广的”模块化燃气涡轮机离网供电”方案——帐篷现场配套了200兆瓦的模块化燃气涡轮机供电,不需要依赖当地电网的增容审批,又省了一大笔时间。

    • 传统数据中心建设周期:3到5年
    • 帐篷方案建设周期:压缩到数月
    • 供电方案:200兆瓦模块化燃气涡轮机,离网运行
    • 单帐篷面积:约12.5万平方英尺

    背后是Meta在AI军备竞赛中的集体焦虑

    这事看起来荒诞,但放在Meta当前的处境里,倒是能理解。2026年,Meta的AI模型Llama 4 Spark已经完成训练,但开发者依赖的API却多次推迟发布,导致市场反响相当平淡。

    与此同时,Meta计划投入最高1450亿美元用于数据中心等资本支出,这一激进的投入计划引发了华尔街的不满——2026年Meta股价累计下跌了5%。用帐篷部署数据中心,某种意义上是一场”边打边建”的豪赌,Meta寄希望于通过快速扩充算力来赶上OpenAI和Google在模型能力上的领先优势。

    如果Llama 4的API能在短期内顺利推出并获得开发者认可,这批帐篷数据中心将成为Meta AI反攻的关键资产;反过来,如果产品继续延期或者市场不买账,这些帐篷可能就会沦为昂贵的”帐篷纪念碑”。

    AI基础设施竞赛,已经进入了”疯狂麦克斯”模式

    Michael Thomas把当前的AI基础设施竞赛形容为”疯狂麦克斯”模式——企业为了抢夺算力,正在采取越来越多激进、非常规,甚至有些荒诞的手段。

    Meta的帐篷数据中心,或许只是这场竞赛中最新、也最具视觉冲击力的一幕。无论是特斯拉的帐篷造车,还是Meta的帐篷装芯片,本质上都是在用非常规手段抢时间——算力需求的增长,已经远远超过了传统基建模式能跟上的速度。


  • ChatGPT升级记忆系统,向所有用户推送

    OpenAI这几天悄悄做了一个看似不起眼的更新——ChatGPT的”记忆”功能全面升级,而且开始向所有用户推送。Plus和Pro付费用户现在已经可以用上了,免费用户几周内也会收到推送。

    这事听起来不怎么震撼,但你真用起来会发现,这是ChatGPT发布以来最贴近”私人助手”体验的一次升级。

    以前的ChatGPT,每次对话都是”失忆症患者”

    用过ChatGPT的人都有这个体验:你上次跟它聊了半天你的写作风格、你公司的业务背景、你喜欢的代码规范,下次开新对话,它又把你怎么着来着给忘了。你得重新介绍一遍。

    旧版本的”记忆”功能其实已经存在了一段时间,但它是被动的——你得手动去开启,而且记住的内容比较零散,很多时候它并没把你认为重要的信息存下来。

    新版本的核心改进是:ChatGPT会自动从你的对话中提取关键信息,而且优先记住那些”反复出现”的信息,而不是把你随口一提的内容都存下来。

    举个例子,你就能感觉到差别

    假设你是个用ChatGPT辅助写代码的用户。旧版记忆可能记住了你说过的”我喜欢用Python”,但三周后它就忘了,或者它记住了你的猫叫”毛毛”,但这个信息对你的工作效率毫无帮助。

    新版记忆系统会观察你在多次对话中持续提到的信息。如果你在五次对话里都提到自己在做数据分析、用的是Pandas和Matplotlib,ChatGPT会把这个记下来,下次你问”帮我写个脚本”的时候,它直接就能给出符合你习惯的代码,不用你每次解释背景。

    • 你在三次对话里提到自己用Python写数据分析脚本 → ChatGPT记住这个偏好
    • 你某次偶然提到喜欢某个小众乐队 → 它通常不会把这个加入长期记忆
    • 你反复要求”回答要简洁,不要解释太多” → 它会记住你的表达风格偏好

    为什么这事重要?因为对手也在做

    记忆系统这东西,表面上看是个”便利功能”,实际上它是AI助手能不能让你”离不开”的核心抓手。

    Google的Gemini、Anthropic的Claude都在强化个性化能力。如果ChatGPT能记住你的使用习惯,你就很难换去别的产品——因为换一个,又要从零开始”调教”。这对OpenAI来说是最稳固的护城河。

    从另一个角度看,这也是大模型产品演进的必经之路:从”强大的通用工具”走向”懂你的专属助手”。这一步看似简单,实际上对模型的长上下文处理、信息提取精度、以及隐私边界判断,都提出了极高的要求。

    隐私问题,用户还是得自己盯着

    OpenAI表示,用户可以随时查看、编辑或删除记忆内容,也可以完全关闭这个功能。但说实话,大多数用户并不会主动去管理这些设置。

    这对OpenAI的默认隐私保护提出了很高要求。记忆系统记下了什么、存在哪里、会不会被用于模型训练,这些都是用户关心的,但很少有人真的去读隐私条款。


  • Anthropic抛出一枚深水炸弹:AI迟早会自己改进自己

    Anthropic抛出一枚深水炸弹:AI迟早会自己改进自己

    Anthropic上周发了一篇博客,标题叫“When AI builds itself”(当AI开始建造自己),讨论的是一个在AI圈内被反复议论、但很少有公司愿意公开正面回答的问题:AI系统最终会不会进化到可以完全自主地设计和改进自己的下一代?

    这个能力有个正式的名字,叫递归自我改进(Recursive Self-Improvement),简称RSI。用大白话讲就是:一个AI模型训练出了下一代模型,下一代模型又训练出下下一代,每一代都比上一代更强,而且这个过程里人类逐渐退出核心环节。

    递归自我改进指的是AI系统具备完全自主设计和开发自身后继版本的能力:AI系统可以优化自身的架构、训练方法、代码等,生成能力比自己更强的新版本AI,而新版本又可以继续优化生成下一代,形成”自我改进”的递归循环。

    Anthropic拿出了实锤数据

    这篇博客最有价值的部分,不是它对RSI下什么结论,而是它首次公开了大量来自Anthropic内部的真实数据,讲清楚了”AI到底在多大程度上已经在加速AI开发本身”这个问题。

    一个很惊人的数字是:截至2026年5月,Anthropic代码库里超过80%的代码是由Claude编写的。而在2025年2月Claude Code推出之前,这个比例还只是个位数。每个工程师每天合并的代码行数,2026年第二季度已经是2024年的8倍

    Anthropic自己也很谨慎地说,代码行数不是衡量生产力的完美指标,但这个8倍的数字至少说明了一件事:AI辅助开发已经不是”有帮助”的程度了,它在实实在在改变一家AI公司的开发节奏。

    差距在缩小,但还没到那一步

    他们把目前的差距描述得很具体。今天的Claude可以在别人明确指定目标的情况下运行实验、优化代码、甚至修复bug。但在”选择值得研究的问题”这件事上,Claude和人类之间还有很大的性能差距。

    用Anthropic自己的话说:目前人类的比较优势仍然在于”看到更大的图景”,以及超越即时任务的局限进行思考。

    问题是,这个差距也在缩小。Anthropic做了一个实验:让不同版本的Claude只看一段研究对话中”跑偏之前”的部分,然后问它”接下来你会怎么做”。2025年11月的最佳模型(Opus 4.5)在人类的选择更好的比例上只赢了51%,到2026年4月(Mythos Preview),这个比例涨到了64%

    这件事为什么重要

    把上面的线索放在一起,Anthropic描绘了一幅有点微妙的图像:RSI不会明天就到来,但那些曾经被认为是”只有人类才能做”的判断力工作,正在一点一点地被AI系统蚕食。

    这篇博客没有给出一个明确的结论说”RSI会在某年某月到来”,但它做了一件更重要的事:把这个问题从抽象的哲学讨论,拉到了可以用数据衡量的实证层面。


    接下来会怎样

    Anthropic在文末说,接下来几个月他们会组织政策制定者、研究人员和公民社会之间的对话,讨论怎么为RSI的可能性做准备。这件事值得关注的原因很简单:如果RSI真的到来了,人类怎么保证自己还有能力理解和控制这些系统,会是一个完全不同的问题。

    而Anthropic这篇博客,是目前一线AI公司在这个问题上给出的最坦诚、数据最扎实的公开表态。