标签： AI

苹果给Messages开了个口子，第一个进来的AI助手叫Poke

苹果的Messages（信息）应用，在大多数人的认知里就是发短信的地方。绿泡泡蓝泡泡，吵架传照片，就这么点用途。但苹果最近做了一个不太像它会做的决定——给一个第三方AI助手开了绿灯，让它正式进驻Messages for Business平台。

Poke是什么来头

Poke这家公司的名字你可能没听过，它的产品逻辑倒是很直白：不用下载任何App，不用注册账号，就发短信，AI助手在那头帮你干活。

你给它发条消息，说”帮我订个餐厅，今晚7点，两个人”，Poke就去帮你查、帮你订、帮你发确认短信。整个过程你只管发短信就行，不用切到别的应用。

这种”用短信界面做任何事”的思路，其实和这两年大家都在说的”AI助手应该无处不在”是一回事，只是Poke选的入口是每个人手机里都有的短信应用。

Messages for Business是苹果2017年就推出的企业消息平台，之前进驻的都是航空公司、银行、零售商——都是大公司。Poke是第一个以AI助手身份进来的。

苹果为什么现在开这个口子

苹果对自己的生态一向管得很紧。一个第三方AI助手能拿到Messages for Business的入场券，这件事本身就值得留意。

一种解读是，苹果在找新的服务收入来源。Messages for Business对商家是收费的，每增加一个能在这个平台上提供服务的AI助手，就意味着更多的企业客户和更多的使用费。

另一种解读更偏向产品策略。Siri这些年一直被人骂”不好用”，苹果在WWDC 2026前夕批准Poke进来，可能是想先让第三方AI助手证明这个场景成立，自己后面再跟。

Poke能干的事确实挺全：发邮件、设提醒、生成图片，都在Messages对话框里完成。这对Siri来说是不小的竞争压力——人家不用你喊”Hey Siri”，直接发短信就行。

对普通用户意味着什么

目前Poke通过Messages for Business提供的功能还在早期。苹果对这个平台的审核一向严格，Poke能拿到批准，说明它的隐私和安全标准过了苹果的关。

对普通用户来说，最直观的变化是：以后收到企业的Messages消息时，那边接话的可能不只有人工客服，也有AI助手，而且这个AI助手能帮你做的事不止于回答问题，还能真正去执行任务。

这个变化在国内可能感受不深，因为大家用微信。但在欧美，短信和企业消息还是大量用户在用的沟通方式，Messages for Business的月活用户数以亿计。

下一步会怎样

Poke拿到这个”首个”身份，先发优势是明显的。其他AI助手公司现在肯定也在排队申请，苹果会不会批、批多少家，这会决定这个平台未来的生态走向。

对苹果来说，这是在AI助手赛道上借力打力的一招。自己家的Siri还在憋大招（WWDC 2026据说会有大改版），先让第三方进来把场景跑通，用户习惯养成了，后面再推自己的方案，接受度会高很多。

至于Poke能不能真的把这个入口用好，取决于它能不能持续证明：用短信界面跟AI打交道，确实比打开一个专属App更方便。这件事到目前为止，还没有人被真正说服过。

📎 原文来源：TechCrunch — Apple approves Poke as the first AI agent on its Messages for Business platform（2026-06-04）

2026年6月5日
英伟达发了颗PC芯片，黄仁勋想重新发明你的笔记本电脑

英伟达这家公司，大多数人想到它的时候，脑子里浮现的还是显卡。游戏显卡、挖矿显卡、AI训练卡，反正都是插在主板上、负责算图的那个东西。但就在2026年6月1日的台北电脑展上，黄仁勋站上台，发布了一颗完全不同的产品——RTX Spark，一颗英伟达自己品牌的PC处理器。

从显卡厂变成芯片厂

这件事的意义比乍一听要大。此前英伟达也做过计算卡、做过超算模块，但那些产品说到底还是”加速卡”，主机跑什么CPU跟英伟达没关系。RTX Spark不一样，它是一颗完整的PC主芯片——CPU和GPU合在一起，直接决定了一台电脑能干什么、跑多快。

按照英伟达产品管理高级总监Mark Aevermann的说法，这块芯片是”有史以来最高效的PC芯片”。他没拿出任何数据或图表来支撑这个说法，但参数本身确实挺吓人的。

RTX Spark超级芯片，CPU和GPU合封在同一颗芯片上（图源：The Verge）

参数到底有多猛

RTX Spark本质上就是去年英伟达发布的”个人AI超算”DGX Spark里那颗GB10芯片的消费级版本。旗舰规格是这样的：20个CPU核心、6144个GPU核心、128GB LPDDR5X统一内存。

这套配置能干嘛？英伟达给出的参考场景包括：渲染一张90GB的3D场景、剪辑12K分辨率的视频、在1440p分辨率下以100帧流畅运行《印第安纳·琼斯与大圆圈》——而且是在一台14毫米厚的笔记本上、不插电的情况下。

RTX Spark本地可运行1200亿参数的AI智能体。这意味着很多原本需要联网调用云端模型才能做的事，以后在你的笔记本上就能跑。

Arm架构，Windows on Arm生态终于成熟了

RTX Spark基于Arm架构，这和苹果M系列、高通骁龙X Elite是同一路线。缺点是那些为英特尔/AMD x86架构编译的旧软件，得通过模拟层才能跑，性能会有损耗。

但微软这几年没闲着。Prism模拟器已经折腾了好几年，从高通骁龙笔记本开始就在打磨，现在轮到英伟达进场，适配工作已经有底子了。Adobe也已经把Photoshop和Premiere Pro改成了原生支持Arm架构的版本。

连游戏这边都在跟进。Riot Games正在把《英雄联盟》和《无畏契约》搬到Windows on Arm上；Krafton的《绝地求生》也在路上。之前那些用Easy Anti-Cheat、BattlEye做反作弊的游戏，英伟达说他们正在和开发商逐个谈。

英伟达的野心：”AI就是用户界面”

黄仁勋想要的不只是一块更快的芯片。英伟达在宣传材料里写的话很直白：”这是一个新的个人计算范式，AI就是用户界面。”意思是以后你跟电脑说话就行，不用再去记哪个功能藏在哪级菜单里。

他们举了几个例子：电竞主播说一声”我去吃个饭”，电脑自动关灯、闭麦、切换直播模式；设计师画个草图，AI直接生成完整图像、建好3D模型、再配上一段视频；程序员让AI盯着GitHub项目，有QA问题就自己动手修，还能接管键盘鼠标去做那些”重复且无聊”的活。

这些场景听起来有点远，但英伟达这次是真的拉了一帮合作伙伴来落地的。微软已经在Build大会上展示了基于RTX Spark的”新Windows安全和容器原语”，让个人AI智能体能在受控环境下运行。

微软Surface Laptop Ultra，搭载RTX Spark，号称”我们做过的最强机器”（图源：The Verge）

有多少厂商跟进？

Aevermann说，英伟达的合作伙伴已经在开发超过30款笔记本和10款桌面主机。首批确认搭载RTX Spark的笔记本厂商包括宏碁、华硕、戴尔、技嘉、惠普、微星和联想。微软也自己做了一台，叫Surface Laptop Ultra。

价格目前完全没有公布。英伟达只说首批产品”瞄准市场中的较高价位段”，秋季上市。这个”秋季”指的是2026年9-11月之间。

有几个问题英伟达这次没回答：这颗芯片是在美国生产还是海外？会不会出Linux驱动？能不能和外置独立显卡搭配使用？这些答案可能要等到产品真正上市前后才会揭晓。

这事为什么重要

英伟达的市值已经是全球前列，它的每一步动作都会影响整个产业链。这次亲自下场做PC主芯片，直接竞争对手就是英特尔、AMD和高通。对消费者来说，选择变多总是好事；对英伟达来说，这是把AI算力的控制权和利润都揽到自己手里的一步大棋。

2020年苹果发布M1的时候，也没人拿出”证明”来。但M1一上市，整个笔记本行业隔天就变天了。RTX Spark会不会是下一个M1时刻，今年秋季见分晓。

📎 原文来源：The Verge — Nvidia announces RTX Spark as ‘the most efficient PC chip ever built’（作者：Sean Hollister，2026-06-01）

2026年6月5日

supermemory：25.6K Stars！AI时代记忆引擎，让AI真正记住你

配图

项目简介

supermemory 是一个专为AI时代设计的记忆引擎，解决AI助手”转头就忘”的痛点。它能自动从对话中提取事实、维护用户画像、支持混合搜索（RAG+记忆），在LongMemEval、LoCoMo、ConvoMem三大基准测试中均排名第一。

安装要求和过程

环境要求

环境	要求
Node.js	v18+
Python	3.9+
API Key	supermemory.ai 控制台获取

快速安装

方式一：MCP服务器（推荐，无需写代码）

# Claude/Cursor/Windsurf 一键安装
npx -y install-mcp@latest https://mcp.supermemory.ai/mcp --client claude --oauth=yes

方式二：API调用（开发者）

# Node.js/TypeScript
npm install supermemory

# Python
pip install supermemory

方式三：官方应用（零代码）

访问 app.supermemory.ai 直接使用，支持浏览器扩展、Discord机器人等多种接入方式。

核心功能

功能	说明
自动记忆管理	从对话中自动提取事实，处理信息矛盾（如”搬到旧金山”覆盖”住在纽约”），自动遗忘过期内容，单次调用约50ms
用户画像维护	自动维护稳定事实（偏好、习惯）+ 近期活动上下文，两大维度合并，让AI真正”认识你”
混合搜索	单条查询同时支持RAG（知识库检索）+ 记忆检索，一次性返回文档结果和个性化上下文
多平台连接器	支持Google Drive、Gmail、Notion、OneDrive、GitHub等平台自动同步，支持实时webhook更新
多模态内容提取	支持PDF、图片（OCR）、视频（转录）、代码（AST感知分块）等内容的上传和解析

典型使用场景

场景一：给Claude/Cursor加上”永久记忆”

通过MCP服务器接入后，AI助手会自动调用 memory 工具保存重要信息，调用 recall 工具搜索历史记忆。你说出”我喜欢TypeScript函数式编程”，AI下次写代码时会自动遵循这个偏好，不再需要每次重复背景。

场景二：为AI产品构建上下文栈

通过单个API调用获得完整的上下文能力，无需自己配置向量数据库、embedding管道、分块策略。Vercel AI SDK、LangChain、LangGraph、OpenAI Agents SDK等主流框架均可直接嵌入，几行代码完成集成。

场景三：企业知识库+个人记忆融合

supermemory的混合搜索模式，让AI既能检索企业知识库文档（RAG），又能记住每个用户的个性化偏好和历史对话（记忆），两种能力融合，特别适合企业AI助手、客服机器人等场景。

下载地址

来源	链接
GitHub仓库	github.com/supermemoryai/supermemory（25.6K ⭐）
官方网站	supermemory.ai
文档中心	supermemory.ai/docs
控制台	console.supermemory.ai
npm包	npmjs.com/package/supermemory
PyPI包	pypi.org/project/supermemory

开源协议：MIT | 主要语言：TypeScript | 最后更新：2026年6月

2026年6月5日

ChatGPT现在能记住你所有的对话，而且主动去回想

OpenAI这几天在推送ChatGPT的一个新功能，说起来简单，用起来有点毛骨悚然——它能记住你之前聊过的几乎所有东西，而且不是你让它记它才记，是它自己主动去”回想”的。

这个功能叫”记忆升级”，基于之前推出的”梦境（Dreaming）”特性做了改进。以前ChatGPT的记忆是被动的，你跟它说”记住我喜欢简洁的回答”，它才会存下来。现在不一样了，它会在后台自动扫描你的历史对话，把有用的信息挑出来存进记忆里，下次对话直接调用。

方便，还是有点在意

OpenAI说现在ChatGPT Plus和Pro用户已经可以用了，免费用户未来几周也会收到推送。

这功能用起来确实方便。比如你之前跟它讨论过一次旅行计划，下次直接问”帮我看看那趟行程的天气”，它就知道你说的是哪趟，不用你每次都重新介绍背景。或者你之前让它帮你改过代码，它记住了你喜欢的代码风格，下次直接按那个风格来。

但方便和 creepy 之间，往往只有一步之遥。记忆功能意味着ChatGPT本质上在维护一份关于你的动态档案——你的兴趣爱好、工作背景、生活习惯、甚至你跟它吐槽过的人和事。

默认开启，想关得自己找

OpenAI在这件事上走得相当激进。记忆功能默认开启，如果你想关掉，得手动进设置里找。当然你可以选择”临时对话”模式，那种情况下ChatGPT不会记住任何东西，但有多少人在每次对话前都会记得切换模式呢？

OpenAI说你可以随时查看和删除这些记忆，但有多少用户会真的去检查呢？更关键的是，这份记忆是跨对话的。以前你关掉对话框，ChatGPT就”忘了”你是谁。现在不一样了，它在下一次对话开始时就已经知道了你的上下文。

对于想要连贯体验的用户来说这是好事，但对于在意隐私的人来说，这几乎等于把一个陌生人请进了家里，还让它记住了你的生活习惯。

终局已经很清晰了

从目前用户的反馈来看，反应两极分化。有人觉得终于不用每次都重新介绍自己了，有人说感觉被监视了。

这个方向的终局其实挺清晰的：AI助手会越来越了解你，直到它比你的朋友更懂你的偏好。问题从来不是技术能不能做到，而是你愿不愿意让它做到。

OpenAI的官方说明里提到，记忆功能会持续迭代，未来可能会记住更多维度的信息。如果你在意这件事，现在就去设置里关掉它，还来得及。

📎 原文来源：ChatGPT’s upgraded memory system is rolling out to everyone — The Verge

2026年6月5日
Meta在帐篷里塞满AI芯片，数据中心的基建狂魔新玩法

你以为AI数据中心的军备竞赛已经够疯狂了，结果Meta把服务器搬进了帐篷里。不是比喻，是真的在帐篷里。

Meta AI应用图标，帐篷数据中心背后的算力指向 | 图片来源：TechCrunch

科技记者Tim De Chant在TechCrunch上披露了这个让人哭笑不得的细节。Meta在俄亥俄州新奥尔巴尼市外搭了6个帐篷，每个12.5万平方英尺——相当于好几个足球场那么大。Meta自己把这东西叫”快速部署结构”，听起来比”帐篷里放服务器”要体面得多。

特斯拉开过先例，但Meta玩得更大

这个主意其实不是Meta原创。特斯拉早在Model 3产能危机的时候，就在弗里蒙特工厂的停车场搭过帐篷来应急。马斯克那会儿被产能逼急了，帐篷里照样造车。xAI后来也用了类似的招数，包括用离网燃气轮机供电——Meta这次也是这个套路。

但Meta的情况不一样。帐篷里放的不再是汽车装配线，而是价值几十亿美元的AI芯片。这些芯片训练出的模型，最终会变成Meta AI、Facebook动态推送和Instagram广告推荐。换句话说，你手机里那些AI功能，背后可能真有一部分是”帐篷算力”在支撑。

数据中心追踪机构Cleanview的创始人Michael Thomas通过查阅当地许可证和卫星照片确认了这件事。建设周期缩短了一半——这就是”帐篷方案”的核心卖点。

650亿美元的背后算盘

扎克伯格去年在接受The Information采访时其实提到过这个计划，只是当时很多人没当回事。现在看来，他是认真的。

配合帐篷数据中心的，还有附近的200兆瓦模块化燃气轮机供电系统。这种”离网发电”的方案xAI也在用，好处是不用跟电网运营商扯皮，坏处是环保人士估计又要炸锅了。

这事发生的时机有点微妙。就在帐篷拔地而起的同时，《华尔街日报》曝出Meta的最新模型Muse Spark已经做完，但开发者用来调用的API却一拖再拖，迟迟不上线。模型做好了，算力也囤了，但交付给开发者的环节卡住了——这不是技术问题，更像是优先级的问题。

Meta说计划投入高达650亿美元用于数据中心和资本支出。华尔街对这个数字不太满意，Meta的股价今年已经跌了5%。把芯片塞进帐篷里，某种程度上是在向投资人证明：我们在拼命省钱，同时也在拼命建算力。

至于帐篷能不能长期稳定运行、散热怎么解决、消防过关了吗——这些问题的答案，可能要等下一个爆料人出来才能知道。

📎 原文来源：Meta steals a tactic from Tesla and builds data centers in tents — TechCrunch

2026年6月5日
Anthropic罕见公开表态：AI还没学会自我进化，但可能比所有人想的都快
递归自我改进，AI的奇点前夜

递归自我改进（Recursive Self-Improvement，简称RSI）——这几个字在AI圈的分量，不亚于通用人工智能（AGI）本身。

简单说，它指的是一种AI系统，能够完全自主地设计并开发自己的下一代版本。如果这件事发生，AI智能水平的提升将不再依赖人类工程师的逐步迭代，而可能进入指数级加速的飞轮状态。这也是为什么，RSI既是AI能力增长的圣杯，也是AI安全研究者最担心的事。

Anthropic的官方表述：我们目前还没有实现递归自我改进，递归自我改进也不是必然会发生的。但它的到来，可能比大多数机构的准备速度要快。—— Anthropic官方博客，2026年6月

为什么是Anthropic出来表态

在AI安全问题上的公开表态，Anthropic一直比OpenAI更愿意出声。这家由前OpenAI核心成员创立的公司，把自己定位为最注重安全的前沿AI实验室，在RSI这个问题上发声，分量很重。

时机也值得注意。就在同一周：
- Anthropic联合创始人Daniela Amodei公开回应了外界对AI投资回报率的质疑——IPO箭在弦上，公司需要在安全和商业化之间找平衡
- Anthropic刚刚将Claude Mythic版本扩展到了15个以上的关键基础设施领域，包括电力、水务和医疗系统
- OpenAI同期宣布Codex周活跃用户突破500万，并推出了面向企业的多个新插件
换句话说，Anthropic在能力竞赛越来越白热化的当下，选择重申安全底线——这本身就是一种姿态。

行业怎么看

RSI目前仍然是一个理论概念，还没有任何已发布的AI系统能够真正实现自主迭代。但几乎所有前沿实验室都在朝这个方向努力——只不过大家对外表述的谨慎程度不同。

Anthropic在这次声明中特意提到大多数机构的准备速度——这句话的潜台词是：不光是AI公司自己没准备好，监管机构、社会各界、乃至AI公司内部的治理机制，都还没有为RSI的真正到来做好准备。

这封声明的完整内容，已经发布在Anthropic研究所的官方博客上。值得所有关注AI发展的人读一读。

📎 原文来源：Anthropic made a statement about recursive self-improvement — The Verge
2026年6月5日
Airbnb CEO不打算只做房东了，他要建一个AI实验室
从造王者到下场做实验室

Brian Chesky一直是个AI领域的造王者——投钱、给建议、牵线搭桥，帮不少前沿AI实验室走到了今天。但现在，他不想只做幕后推手了。

彭博社率先披露，Chesky计划推出一个全新的AI实验室。这位Airbnb联合创始人兼CEO，过去几年一直以AI投资人和OpenAI董事会幕后操盘手的身份出现在硅谷叙事里，现在决定亲自进场。

背景补充：Chesky与Sam Altman的渊源可以追溯到2006年——当时两人都在Y Combinator的孵化名单里。Altman重新执掌OpenAI的那场董事会政变（2023年11月），Chesky是核心幕后推手之一，被曝向Altman提供公关建议、并在硅谷大佬圈子里帮他争取支持。

为什么是现在

有意思的是，Chesky去年接受采访时还明确说过：Airbnb没有和任何大语言模型厂商达成合作，原因是现有产品还不够成熟。不到一年，态度发生了明显变化。

彭博社的报道提到，新实验室可能会聚焦用户交互和设计——这正好是Chesky在Airbnb一路走来最强调的方向。不是去做大模型，而是做AI该怎么和人打交道这件事。

这个方向听起来熟悉，是因为确实有人已经在做了。去年底，前Meta高管Brett Adcock推出了AI实验室Hark，主打为AI助手开发全新用户界面，同时也在布局硬件。Chesky的实验室，大概率会和Hark形成直接竞争。

谁来做，怎么做

几个关键信息：
- Chesky不会全职投入新项目，会继续保留Airbnb CEO职位
- 实验室具体负责人选尚未确定
- Chesky以事必躬亲的管理风格著称——未来实验室负责人既要和OpenAI、Anthropic这样的现有实验室竞争，也要应付这位创始主席的微观管理
Airbnb和Chesky的代表均拒绝对此事置评。但硅谷的共识是：Chesky如果认真要做，他能拉到钱，也能拉到人。

📎 原文来源：Airbnb’s Brian Chesky plans to launch a new AI lab — TechCrunch
2026年6月5日

Chroma：43.1K Stars！开源向量数据库，让AI应用拥有长期记忆

开源向量数据库 · 让AI拥有长期记忆

📦 项目简介

Chroma 是专为AI应用打造的开源嵌入式向量数据库，让大模型拥有”长期记忆”。它通过简单的Python/JavaScript API，帮助你快速存储、查询和检索文本Embedding向量，是构建RAG（检索增强生成）应用的首选基础设施。

🔗 GitHub：chroma-core/chroma　⭐ Stars：43.1K+　📄 协议：Apache 2.0

🔧 安装要求和过程

环境要求

依赖	要求
Python	≥ 3.8（推荐 3.10+）
内存	≥ 4GB（生产环境建议 8GB+）
存储	≥ 1GB 可用空间
可选后端	SQLite（默认）、DuckDB（分析场景）

快速安装（3行代码搞定）

pip install chromadb

import chromadb
client = chromadb.Client()  # 开箱即用！

Docker 部署（生产推荐）

docker run -d --name chroma \
  -p 8000:8000 \
  ghcr.io/chroma-core/chroma:latest

部署后访问 http://localhost:8000 即可使用 HTTP API。

🔩 核心功能

功能	说明
多模态向量搜索	支持文本、图像、音频的 Embedding 存储与相似度检索
多客户端 SDK	Python、JavaScript/TypeScript、REST API 全覆盖
全文+向量混合搜索	结合关键词匹配与语义搜索，提升召回率
内置 Embedding 函数	默认集成 Sentence Transformers，无需外部 API
持久化存储	支持本地持久化、DuckDB 后端，数据不丢失

💡 典型使用场景

场景一：RAG（检索增强生成）应用

将企业文档、知识库存入 Chroma，用户提问时先检索相关片段，再送给 LLM 生成答案。相比直接问 LLM，准确率提升 40%+，幻觉大幅减少。

# RAG 核心代码（不到 20 行！）
collection = client.create_collection("docs")
collection.add(
    documents=["公司报销流程...", "年假申请..."],
    ids=["1", "2"]
)
results = collection.query(query_texts=["如何报销？"], n_results=1)
# results 包含最相关的文档片段

场景二：AI Agent 长期记忆

让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma，下次对话时自动检索上下文，实现”越用越懂你”。

场景三：语义推荐系统

电商、内容平台的”猜你喜欢”，用 Chroma 存储商品/内容向量，用户行为向量实时检索最相似物品，推荐相关度远超协同过滤。

🌟 推荐理由

Chroma 是我见过最易上手的向量数据库，没有之一。不需要学 SQL，不需要配置复杂集群，pip install 之后 3 行代码就能跑起来。

相比 Pinecone 等托管服务，Chroma 完全开源、可自托管，数据不出门，合规零风险。相比 Faiss，它提供了完整的 CRUD API 和持久化，不用每次重启都重新建索引。

如果你正在做 RAG、AI 搜索、推荐系统，或者想给 Agent 加上记忆，Chroma 是目前开发体验最好的选择。LangChain、LlamaIndex、Supabase 都已官方集成，生态非常成熟。

📥 下载地址

渠道	链接 / 命令
GitHub 仓库	github.com/chroma-core/chroma
官网文档	docs.trychroma.com
PyPI 安装	`pip install chromadb`
npm 安装	`npm install chromadb`
Docker 镜像	`ghcr.io/chroma-core/chroma:latest`

— 开源项目第52期 | 夜野飞云 —

2026年6月5日

Chroma：43.1K Stars！开源向量数据库，让AI应用拥有长期记忆

开源向量数据库 · 让AI拥有长期记忆

📦 项目简介

🔗 GitHub：chroma-core/chroma　⭐ Stars：43.1K+　📄 协议：Apache 2.0

🔧 安装要求和过程

环境要求

依赖	要求
Python	≥ 3.8（推荐 3.10+）
内存	≥ 4GB（生产环境建议 8GB+）
存储	≥ 1GB 可用空间
可选后端	SQLite（默认）、DuckDB（分析场景）

快速安装（3行代码搞定）

pip install chromadb

import chromadb
client = chromadb.Client()  # 开箱即用！

Docker 部署（生产推荐）

docker run -d --name chroma \
  -p 8000:8000 \
  ghcr.io/chroma-core/chroma:latest

部署后访问 http://localhost:8000 即可使用 HTTP API。

🔩 核心功能

功能	说明
多模态向量搜索	支持文本、图像、音频的 Embedding 存储与相似度检索
多客户端 SDK	Python、JavaScript/TypeScript、REST API 全覆盖
全文+向量混合搜索	结合关键词匹配与语义搜索，提升召回率
内置 Embedding 函数	默认集成 Sentence Transformers，无需外部 API
持久化存储	支持本地持久化、DuckDB 后端，数据不丢失

💡 典型使用场景

场景一：RAG（检索增强生成）应用

将企业文档、知识库存入 Chroma，用户提问时先检索相关片段，再送给 LLM 生成答案。相比直接问 LLM，准确率提升 40%+，幻觉大幅减少。

# RAG 核心代码（不到 20 行！）
collection = client.create_collection("docs")
collection.add(
    documents=["公司报销流程...", "年假申请..."],
    ids=["1", "2"]
)
results = collection.query(query_texts=["如何报销？"], n_results=1)
# results 包含最相关的文档片段

场景二：AI Agent 长期记忆

让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma，下次对话时自动检索上下文，实现”越用越懂你”。

场景三：语义推荐系统

电商、内容平台的”猜你喜欢”，用 Chroma 存储商品/内容向量，用户行为向量实时检索最相似物品，推荐相关度远超协同过滤。

🌟 推荐理由

Chroma 是我见过最易上手的向量数据库，没有之一。不需要学 SQL，不需要配置复杂集群，pip install 之后 3 行代码就能跑起来。

📥 下载地址

渠道	链接 / 命令
GitHub 仓库	github.com/chroma-core/chroma
官网文档	docs.trychroma.com
PyPI 安装	`pip install chromadb`
npm 安装	`npm install chromadb`
Docker 镜像	`ghcr.io/chroma-core/chroma:latest`

— 开源项目第52期 | 夜野飞云 —

2026年6月5日

Meta用帐篷搭建数据中心，效仿特斯拉降本
当你想到数据中心，脑海里浮现的应该是钢筋混凝土、精密空调、层层安检的那种坚固建筑。但Meta正在做的事，可能会颠覆你对数据中心的全部想象——他们在俄亥俄州新奥尔巴尼市外，搭了至少6个大型帐篷，里面装的是价值数十亿美元的AI芯片。

Meta的AI基础设施布局正在走上一条”非常规”路线

特斯拉开过先例，这次轮到Meta

2018年，特斯拉为了救Model 3的产能危机，在弗里蒙特工厂的停车场搭了个”帐篷生产线”。当时不少人觉得埃隆·马斯克疯了——正规汽车工厂哪有在帐篷里生产的？

但这次，Meta把”帐篷”搬进了数据中心建设现场。根据数据中心追踪机构Cleanview创始人Michael Thomas的追踪，Meta在俄亥俄州新奥尔巴尼市外搭建了至少6个”快速部署结构”（本质上就是大型帐篷），其中5个单体面积达到12.5万平方英尺的帐篷，在2026年4月到6月之间完成建设，卫星图像已经可以清晰观测到这些结构。

帐篷里装的是什么？答案是AI训练所需的大规模算力集群。这些帐篷内部署了总价值数十亿美元的AI芯片，主要用于支持Meta的Llama系列模型训练和AI相关业务的推理需求。

为什么要选帐篷？答案就两个字：快、省

传统数据中心从规划到交付，通常需要3到5年。你要拿地、报批、招标、施工、验收……等建完，AI模型可能已经迭代了三个大版本。

帐篷方案可以把建设周期压缩到几个月。Meta这次不仅借鉴了特斯拉的帐篷思路，还参考了xAI（马斯克的另一家公司）率先推广的”模块化燃气涡轮机离网供电”方案——帐篷现场配套了200兆瓦的模块化燃气涡轮机供电，不需要依赖当地电网的增容审批，又省了一大笔时间。
- 传统数据中心建设周期：3到5年
- 帐篷方案建设周期：压缩到数月
- 供电方案：200兆瓦模块化燃气涡轮机，离网运行
- 单帐篷面积：约12.5万平方英尺
背后是Meta在AI军备竞赛中的集体焦虑

这事看起来荒诞，但放在Meta当前的处境里，倒是能理解。2026年，Meta的AI模型Llama 4 Spark已经完成训练，但开发者依赖的API却多次推迟发布，导致市场反响相当平淡。

与此同时，Meta计划投入最高1450亿美元用于数据中心等资本支出，这一激进的投入计划引发了华尔街的不满——2026年Meta股价累计下跌了5%。用帐篷部署数据中心，某种意义上是一场”边打边建”的豪赌，Meta寄希望于通过快速扩充算力来赶上OpenAI和Google在模型能力上的领先优势。

如果Llama 4的API能在短期内顺利推出并获得开发者认可，这批帐篷数据中心将成为Meta AI反攻的关键资产；反过来，如果产品继续延期或者市场不买账，这些帐篷可能就会沦为昂贵的”帐篷纪念碑”。

AI基础设施竞赛，已经进入了”疯狂麦克斯”模式

Michael Thomas把当前的AI基础设施竞赛形容为”疯狂麦克斯”模式——企业为了抢夺算力，正在采取越来越多激进、非常规，甚至有些荒诞的手段。

Meta的帐篷数据中心，或许只是这场竞赛中最新、也最具视觉冲击力的一幕。无论是特斯拉的帐篷造车，还是Meta的帐篷装芯片，本质上都是在用非常规手段抢时间——算力需求的增长，已经远远超过了传统基建模式能跟上的速度。

📎 原文来源：TechCrunch – Meta steals a tactic from Tesla and builds data centers in tents
2026年6月5日

标签： AI

Poke是什么来头

苹果为什么现在开这个口子

对普通用户意味着什么

下一步会怎样

从显卡厂变成芯片厂

参数到底有多猛

Arm架构，Windows on Arm生态终于成熟了

英伟达的野心：”AI就是用户界面”

有多少厂商跟进？

这事为什么重要

配图

项目简介

安装要求和过程

环境要求

快速安装

核心功能

典型使用场景

场景一：给Claude/Cursor加上”永久记忆”

场景二：为AI产品构建上下文栈

场景三：企业知识库+个人记忆融合

推荐理由

下载地址

方便，还是有点在意

默认开启，想关得自己找

终局已经很清晰了

特斯拉开过先例，但Meta玩得更大

650亿美元的背后算盘

递归自我改进，AI的奇点前夜

为什么是Anthropic出来表态

行业怎么看

从造王者到下场做实验室

为什么是现在

谁来做，怎么做

📦 项目简介

🔧 安装要求和过程

环境要求

快速安装（3行代码搞定）

Docker 部署（生产推荐）

🔩 核心功能

💡 典型使用场景

场景一：RAG（检索增强生成）应用

场景二：AI Agent 长期记忆

场景三：语义推荐系统

🌟 推荐理由

📥 下载地址

📦 项目简介

🔧 安装要求和过程

环境要求

快速安装（3行代码搞定）

Docker 部署（生产推荐）

🔩 核心功能

💡 典型使用场景

场景一：RAG（检索增强生成）应用

场景二：AI Agent 长期记忆

场景三：语义推荐系统

🌟 推荐理由

📥 下载地址

特斯拉开过先例，这次轮到Meta

为什么要选帐篷？答案就两个字：快、省

背后是Meta在AI军备竞赛中的集体焦虑

AI基础设施竞赛，已经进入了”疯狂麦克斯”模式