标签: AI

  • 苹果给Messages开了个口子,第一个进来的AI助手叫Poke

    苹果的Messages(信息)应用,在大多数人的认知里就是发短信的地方。绿泡泡蓝泡泡,吵架传照片,就这么点用途。但苹果最近做了一个不太像它会做的决定——给一个第三方AI助手开了绿灯,让它正式进驻Messages for Business平台。

    Poke是什么来头

    Poke这家公司的名字你可能没听过,它的产品逻辑倒是很直白:不用下载任何App,不用注册账号,就发短信,AI助手在那头帮你干活。

    你给它发条消息,说”帮我订个餐厅,今晚7点,两个人”,Poke就去帮你查、帮你订、帮你发确认短信。整个过程你只管发短信就行,不用切到别的应用。

    这种”用短信界面做任何事”的思路,其实和这两年大家都在说的”AI助手应该无处不在”是一回事,只是Poke选的入口是每个人手机里都有的短信应用。

    Messages for Business是苹果2017年就推出的企业消息平台,之前进驻的都是航空公司、银行、零售商——都是大公司。Poke是第一个以AI助手身份进来的。

    苹果为什么现在开这个口子

    苹果对自己的生态一向管得很紧。一个第三方AI助手能拿到Messages for Business的入场券,这件事本身就值得留意。

    一种解读是,苹果在找新的服务收入来源。Messages for Business对商家是收费的,每增加一个能在这个平台上提供服务的AI助手,就意味着更多的企业客户和更多的使用费。

    另一种解读更偏向产品策略。Siri这些年一直被人骂”不好用”,苹果在WWDC 2026前夕批准Poke进来,可能是想先让第三方AI助手证明这个场景成立,自己后面再跟。

    Poke能干的事确实挺全:发邮件、设提醒、生成图片,都在Messages对话框里完成。这对Siri来说是不小的竞争压力——人家不用你喊”Hey Siri”,直接发短信就行。


    对普通用户意味着什么

    目前Poke通过Messages for Business提供的功能还在早期。苹果对这个平台的审核一向严格,Poke能拿到批准,说明它的隐私和安全标准过了苹果的关。

    对普通用户来说,最直观的变化是:以后收到企业的Messages消息时,那边接话的可能不只有人工客服,也有AI助手,而且这个AI助手能帮你做的事不止于回答问题,还能真正去执行任务。

    这个变化在国内可能感受不深,因为大家用微信。但在欧美,短信和企业消息还是大量用户在用的沟通方式,Messages for Business的月活用户数以亿计。

    下一步会怎样

    Poke拿到这个”首个”身份,先发优势是明显的。其他AI助手公司现在肯定也在排队申请,苹果会不会批、批多少家,这会决定这个平台未来的生态走向。

    对苹果来说,这是在AI助手赛道上借力打力的一招。自己家的Siri还在憋大招(WWDC 2026据说会有大改版),先让第三方进来把场景跑通,用户习惯养成了,后面再推自己的方案,接受度会高很多。

    至于Poke能不能真的把这个入口用好,取决于它能不能持续证明:用短信界面跟AI打交道,确实比打开一个专属App更方便。这件事到目前为止,还没有人被真正说服过。

  • 英伟达发了颗PC芯片,黄仁勋想重新发明你的笔记本电脑

    英伟达这家公司,大多数人想到它的时候,脑子里浮现的还是显卡。游戏显卡、挖矿显卡、AI训练卡,反正都是插在主板上、负责算图的那个东西。但就在2026年6月1日的台北电脑展上,黄仁勋站上台,发布了一颗完全不同的产品——RTX Spark,一颗英伟达自己品牌的PC处理器。

    从显卡厂变成芯片厂

    这件事的意义比乍一听要大。此前英伟达也做过计算卡、做过超算模块,但那些产品说到底还是”加速卡”,主机跑什么CPU跟英伟达没关系。RTX Spark不一样,它是一颗完整的PC主芯片——CPU和GPU合在一起,直接决定了一台电脑能干什么、跑多快。

    按照英伟达产品管理高级总监Mark Aevermann的说法,这块芯片是”有史以来最高效的PC芯片”。他没拿出任何数据或图表来支撑这个说法,但参数本身确实挺吓人的。

    NVIDIA RTX Spark芯片概念图
    RTX Spark超级芯片,CPU和GPU合封在同一颗芯片上(图源:The Verge)

    参数到底有多猛

    RTX Spark本质上就是去年英伟达发布的”个人AI超算”DGX Spark里那颗GB10芯片的消费级版本。旗舰规格是这样的:20个CPU核心、6144个GPU核心、128GB LPDDR5X统一内存。

    这套配置能干嘛?英伟达给出的参考场景包括:渲染一张90GB的3D场景、剪辑12K分辨率的视频、在1440p分辨率下以100帧流畅运行《印第安纳·琼斯与大圆圈》——而且是在一台14毫米厚的笔记本上、不插电的情况下。

    RTX Spark本地可运行1200亿参数的AI智能体。这意味着很多原本需要联网调用云端模型才能做的事,以后在你的笔记本上就能跑。

    Arm架构,Windows on Arm生态终于成熟了

    RTX Spark基于Arm架构,这和苹果M系列、高通骁龙X Elite是同一路线。缺点是那些为英特尔/AMD x86架构编译的旧软件,得通过模拟层才能跑,性能会有损耗。

    但微软这几年没闲着。Prism模拟器已经折腾了好几年,从高通骁龙笔记本开始就在打磨,现在轮到英伟达进场,适配工作已经有底子了。Adobe也已经把Photoshop和Premiere Pro改成了原生支持Arm架构的版本。

    连游戏这边都在跟进。Riot Games正在把《英雄联盟》和《无畏契约》搬到Windows on Arm上;Krafton的《绝地求生》也在路上。之前那些用Easy Anti-Cheat、BattlEye做反作弊的游戏,英伟达说他们正在和开发商逐个谈。


    英伟达的野心:”AI就是用户界面”

    黄仁勋想要的不只是一块更快的芯片。英伟达在宣传材料里写的话很直白:”这是一个新的个人计算范式,AI就是用户界面。”意思是以后你跟电脑说话就行,不用再去记哪个功能藏在哪级菜单里。

    他们举了几个例子:电竞主播说一声”我去吃个饭”,电脑自动关灯、闭麦、切换直播模式;设计师画个草图,AI直接生成完整图像、建好3D模型、再配上一段视频;程序员让AI盯着GitHub项目,有QA问题就自己动手修,还能接管键盘鼠标去做那些”重复且无聊”的活。

    这些场景听起来有点远,但英伟达这次是真的拉了一帮合作伙伴来落地的。微软已经在Build大会上展示了基于RTX Spark的”新Windows安全和容器原语”,让个人AI智能体能在受控环境下运行。

    微软Surface Laptop Ultra
    微软Surface Laptop Ultra,搭载RTX Spark,号称”我们做过的最强机器”(图源:The Verge)

    有多少厂商跟进?

    Aevermann说,英伟达的合作伙伴已经在开发超过30款笔记本和10款桌面主机。首批确认搭载RTX Spark的笔记本厂商包括宏碁、华硕、戴尔、技嘉、惠普、微星和联想。微软也自己做了一台,叫Surface Laptop Ultra。

    价格目前完全没有公布。英伟达只说首批产品”瞄准市场中的较高价位段”,秋季上市。这个”秋季”指的是2026年9-11月之间。

    有几个问题英伟达这次没回答:这颗芯片是在美国生产还是海外?会不会出Linux驱动?能不能和外置独立显卡搭配使用?这些答案可能要等到产品真正上市前后才会揭晓。


    这事为什么重要

    英伟达的市值已经是全球前列,它的每一步动作都会影响整个产业链。这次亲自下场做PC主芯片,直接竞争对手就是英特尔、AMD和高通。对消费者来说,选择变多总是好事;对英伟达来说,这是把AI算力的控制权和利润都揽到自己手里的一步大棋。

    2020年苹果发布M1的时候,也没人拿出”证明”来。但M1一上市,整个笔记本行业隔天就变天了。RTX Spark会不会是下一个M1时刻,今年秋季见分晓。

    📎 原文来源:The Verge — Nvidia announces RTX Spark as ‘the most efficient PC chip ever built’(作者:Sean Hollister,2026-06-01)
  • supermemory:25.6K Stars!AI时代记忆引擎,让AI真正记住你

    supermemory:25.6K Stars!AI时代记忆引擎,让AI真正记住你

    配图

    supermemory


    项目简介

    supermemory 是一个专为AI时代设计的记忆引擎,解决AI助手”转头就忘”的痛点。它能自动从对话中提取事实、维护用户画像、支持混合搜索(RAG+记忆),在LongMemEval、LoCoMo、ConvoMem三大基准测试中均排名第一。


    安装要求和过程

    环境要求

    环境 要求
    Node.js v18+
    Python 3.9+
    API Key supermemory.ai 控制台获取

    快速安装

    方式一:MCP服务器(推荐,无需写代码)

    # Claude/Cursor/Windsurf 一键安装
    npx -y install-mcp@latest https://mcp.supermemory.ai/mcp --client claude --oauth=yes
    

    方式二:API调用(开发者)

    # Node.js/TypeScript
    npm install supermemory
    
    # Python
    pip install supermemory
    

    方式三:官方应用(零代码)

    访问 app.supermemory.ai 直接使用,支持浏览器扩展、Discord机器人等多种接入方式。


    核心功能

    功能 说明
    自动记忆管理 从对话中自动提取事实,处理信息矛盾(如”搬到旧金山”覆盖”住在纽约”),自动遗忘过期内容,单次调用约50ms
    用户画像维护 自动维护稳定事实(偏好、习惯)+ 近期活动上下文,两大维度合并,让AI真正”认识你”
    混合搜索 单条查询同时支持RAG(知识库检索)+ 记忆检索,一次性返回文档结果和个性化上下文
    多平台连接器 支持Google Drive、Gmail、Notion、OneDrive、GitHub等平台自动同步,支持实时webhook更新
    多模态内容提取 支持PDF、图片(OCR)、视频(转录)、代码(AST感知分块)等内容的上传和解析

    典型使用场景

    场景一:给Claude/Cursor加上”永久记忆”

    通过MCP服务器接入后,AI助手会自动调用 memory 工具保存重要信息,调用 recall 工具搜索历史记忆。你说出”我喜欢TypeScript函数式编程”,AI下次写代码时会自动遵循这个偏好,不再需要每次重复背景。

    场景二:为AI产品构建上下文栈

    通过单个API调用获得完整的上下文能力,无需自己配置向量数据库、embedding管道、分块策略。Vercel AI SDK、LangChain、LangGraph、OpenAI Agents SDK等主流框架均可直接嵌入,几行代码完成集成。

    场景三:企业知识库+个人记忆融合

    supermemory的混合搜索模式,让AI既能检索企业知识库文档(RAG),又能记住每个用户的个性化偏好和历史对话(记忆),两种能力融合,特别适合企业AI助手、客服机器人等场景。


    推荐理由

    AI助手的”失忆症”是 currently 最大的体验短板——每次新对话都要重新介绍背景,让人疲惫。supermemory 把这个痛点打穿了。

    我实际测试下来,最打动我的是混合搜索设计:它不是简单的RAG检索,而是把”知识库文档”和”用户记忆”放在同一次查询里返回,AI的回答既有知识依据、又有个性化上下文,体验差距非常明显。

    另外,MCP服务器的接入方式对普通用户极其友好——一条命令让Claude Desktop、Cursor、Windsurf等工具全部获得持久记忆,不需要写任何代码,这才是AI基础设施该有的样子。

    三大基准测试全部排名第一,说明这个方向的技术路线是扎实的,不是噱头。


    下载地址

    来源 链接
    GitHub仓库 github.com/supermemoryai/supermemory(25.6K ⭐)
    官方网站 supermemory.ai
    文档中心 supermemory.ai/docs
    控制台 console.supermemory.ai
    npm包 npmjs.com/package/supermemory
    PyPI包 pypi.org/project/supermemory

    开源协议:MIT | 主要语言:TypeScript | 最后更新:2026年6月

  • ChatGPT现在能记住你所有的对话,而且主动去回想

    OpenAI这几天在推送ChatGPT的一个新功能,说起来简单,用起来有点毛骨悚然——它能记住你之前聊过的几乎所有东西,而且不是你让它记它才记,是它自己主动去”回想”的。

    这个功能叫”记忆升级”,基于之前推出的”梦境(Dreaming)”特性做了改进。以前ChatGPT的记忆是被动的,你跟它说”记住我喜欢简洁的回答”,它才会存下来。现在不一样了,它会在后台自动扫描你的历史对话,把有用的信息挑出来存进记忆里,下次对话直接调用。

    方便,还是有点在意

    OpenAI说现在ChatGPT Plus和Pro用户已经可以用了,免费用户未来几周也会收到推送。

    这功能用起来确实方便。比如你之前跟它讨论过一次旅行计划,下次直接问”帮我看看那趟行程的天气”,它就知道你说的是哪趟,不用你每次都重新介绍背景。或者你之前让它帮你改过代码,它记住了你喜欢的代码风格,下次直接按那个风格来。

    但方便和 creepy 之间,往往只有一步之遥。记忆功能意味着ChatGPT本质上在维护一份关于你的动态档案——你的兴趣爱好、工作背景、生活习惯、甚至你跟它吐槽过的人和事。

    默认开启,想关得自己找

    OpenAI在这件事上走得相当激进。记忆功能默认开启,如果你想关掉,得手动进设置里找。当然你可以选择”临时对话”模式,那种情况下ChatGPT不会记住任何东西,但有多少人在每次对话前都会记得切换模式呢?

    OpenAI说你可以随时查看和删除这些记忆,但有多少用户会真的去检查呢?更关键的是,这份记忆是跨对话的。以前你关掉对话框,ChatGPT就”忘了”你是谁。现在不一样了,它在下一次对话开始时就已经知道了你的上下文。

    对于想要连贯体验的用户来说这是好事,但对于在意隐私的人来说,这几乎等于把一个陌生人请进了家里,还让它记住了你的生活习惯。

    终局已经很清晰了

    从目前用户的反馈来看,反应两极分化。有人觉得终于不用每次都重新介绍自己了,有人说感觉被监视了。

    这个方向的终局其实挺清晰的:AI助手会越来越了解你,直到它比你的朋友更懂你的偏好。问题从来不是技术能不能做到,而是你愿不愿意让它做到。


    OpenAI的官方说明里提到,记忆功能会持续迭代,未来可能会记住更多维度的信息。如果你在意这件事,现在就去设置里关掉它,还来得及。

  • Meta在帐篷里塞满AI芯片,数据中心的基建狂魔新玩法

    你以为AI数据中心的军备竞赛已经够疯狂了,结果Meta把服务器搬进了帐篷里。不是比喻,是真的在帐篷里。

    Meta AI智能手机应用Logo
    Meta AI应用图标,帐篷数据中心背后的算力指向 | 图片来源:TechCrunch

    科技记者Tim De Chant在TechCrunch上披露了这个让人哭笑不得的细节。Meta在俄亥俄州新奥尔巴尼市外搭了6个帐篷,每个12.5万平方英尺——相当于好几个足球场那么大。Meta自己把这东西叫”快速部署结构”,听起来比”帐篷里放服务器”要体面得多。

    特斯拉开过先例,但Meta玩得更大

    这个主意其实不是Meta原创。特斯拉早在Model 3产能危机的时候,就在弗里蒙特工厂的停车场搭过帐篷来应急。马斯克那会儿被产能逼急了,帐篷里照样造车。xAI后来也用了类似的招数,包括用离网燃气轮机供电——Meta这次也是这个套路。

    但Meta的情况不一样。帐篷里放的不再是汽车装配线,而是价值几十亿美元的AI芯片。这些芯片训练出的模型,最终会变成Meta AI、Facebook动态推送和Instagram广告推荐。换句话说,你手机里那些AI功能,背后可能真有一部分是”帐篷算力”在支撑。

    数据中心追踪机构Cleanview的创始人Michael Thomas通过查阅当地许可证和卫星照片确认了这件事。建设周期缩短了一半——这就是”帐篷方案”的核心卖点。

    650亿美元的背后算盘

    扎克伯格去年在接受The Information采访时其实提到过这个计划,只是当时很多人没当回事。现在看来,他是认真的。

    配合帐篷数据中心的,还有附近的200兆瓦模块化燃气轮机供电系统。这种”离网发电”的方案xAI也在用,好处是不用跟电网运营商扯皮,坏处是环保人士估计又要炸锅了。

    这事发生的时机有点微妙。就在帐篷拔地而起的同时,《华尔街日报》曝出Meta的最新模型Muse Spark已经做完,但开发者用来调用的API却一拖再拖,迟迟不上线。模型做好了,算力也囤了,但交付给开发者的环节卡住了——这不是技术问题,更像是优先级的问题。

    Meta说计划投入高达650亿美元用于数据中心和资本支出。华尔街对这个数字不太满意,Meta的股价今年已经跌了5%。把芯片塞进帐篷里,某种程度上是在向投资人证明:我们在拼命省钱,同时也在拼命建算力。


    至于帐篷能不能长期稳定运行、散热怎么解决、消防过关了吗——这些问题的答案,可能要等下一个爆料人出来才能知道。

  • Anthropic罕见公开表态:AI还没学会自我进化,但可能比所有人想的都快

    递归自我改进,AI的奇点前夜

    递归自我改进(Recursive Self-Improvement,简称RSI)——这几个字在AI圈的分量,不亚于通用人工智能(AGI)本身。

    简单说,它指的是一种AI系统,能够完全自主地设计并开发自己的下一代版本。如果这件事发生,AI智能水平的提升将不再依赖人类工程师的逐步迭代,而可能进入指数级加速的飞轮状态。这也是为什么,RSI既是AI能力增长的圣杯,也是AI安全研究者最担心的事。

    Anthropic的官方表述:我们目前还没有实现递归自我改进,递归自我改进也不是必然会发生的。但它的到来,可能比大多数机构的准备速度要快。—— Anthropic官方博客,2026年6月

    为什么是Anthropic出来表态

    在AI安全问题上的公开表态,Anthropic一直比OpenAI更愿意出声。这家由前OpenAI核心成员创立的公司,把自己定位为最注重安全的前沿AI实验室,在RSI这个问题上发声,分量很重。

    时机也值得注意。就在同一周:

    • Anthropic联合创始人Daniela Amodei公开回应了外界对AI投资回报率的质疑——IPO箭在弦上,公司需要在安全和商业化之间找平衡
    • Anthropic刚刚将Claude Mythic版本扩展到了15个以上的关键基础设施领域,包括电力、水务和医疗系统
    • OpenAI同期宣布Codex周活跃用户突破500万,并推出了面向企业的多个新插件

    换句话说,Anthropic在能力竞赛越来越白热化的当下,选择重申安全底线——这本身就是一种姿态。

    行业怎么看

    RSI目前仍然是一个理论概念,还没有任何已发布的AI系统能够真正实现自主迭代。但几乎所有前沿实验室都在朝这个方向努力——只不过大家对外表述的谨慎程度不同。

    Anthropic在这次声明中特意提到大多数机构的准备速度——这句话的潜台词是:不光是AI公司自己没准备好,监管机构、社会各界、乃至AI公司内部的治理机制,都还没有为RSI的真正到来做好准备。

    这封声明的完整内容,已经发布在Anthropic研究所的官方博客上。值得所有关注AI发展的人读一读。


  • Airbnb CEO不打算只做房东了,他要建一个AI实验室

    从造王者到下场做实验室

    Brian Chesky一直是个AI领域的造王者——投钱、给建议、牵线搭桥,帮不少前沿AI实验室走到了今天。但现在,他不想只做幕后推手了。

    彭博社率先披露,Chesky计划推出一个全新的AI实验室。这位Airbnb联合创始人兼CEO,过去几年一直以AI投资人和OpenAI董事会幕后操盘手的身份出现在硅谷叙事里,现在决定亲自进场。

    背景补充:Chesky与Sam Altman的渊源可以追溯到2006年——当时两人都在Y Combinator的孵化名单里。Altman重新执掌OpenAI的那场董事会政变(2023年11月),Chesky是核心幕后推手之一,被曝向Altman提供公关建议、并在硅谷大佬圈子里帮他争取支持。

    为什么是现在

    有意思的是,Chesky去年接受采访时还明确说过:Airbnb没有和任何大语言模型厂商达成合作,原因是现有产品还不够成熟。不到一年,态度发生了明显变化。

    彭博社的报道提到,新实验室可能会聚焦用户交互和设计——这正好是Chesky在Airbnb一路走来最强调的方向。不是去做大模型,而是做AI该怎么和人打交道这件事。

    这个方向听起来熟悉,是因为确实有人已经在做了。去年底,前Meta高管Brett Adcock推出了AI实验室Hark,主打为AI助手开发全新用户界面,同时也在布局硬件。Chesky的实验室,大概率会和Hark形成直接竞争。

    谁来做,怎么做

    几个关键信息:

    • Chesky不会全职投入新项目,会继续保留Airbnb CEO职位
    • 实验室具体负责人选尚未确定
    • Chesky以事必躬亲的管理风格著称——未来实验室负责人既要和OpenAI、Anthropic这样的现有实验室竞争,也要应付这位创始主席的微观管理

    Airbnb和Chesky的代表均拒绝对此事置评。但硅谷的共识是:Chesky如果认真要做,他能拉到钱,也能拉到人。


  • Chroma:43.1K Stars!开源向量数据库,让AI应用拥有长期记忆

    Chroma Banner

    开源向量数据库 · 让AI拥有长期记忆

    📦 项目简介

    Chroma 是专为AI应用打造的开源嵌入式向量数据库,让大模型拥有”长期记忆”。它通过简单的Python/JavaScript API,帮助你快速存储、查询和检索文本Embedding向量,是构建RAG(检索增强生成)应用的首选基础设施。

    🔗 GitHub:chroma-core/chroma ⭐ Stars:43.1K+ 📄 协议:Apache 2.0

    🔧 安装要求和过程

    环境要求

    依赖 要求
    Python ≥ 3.8(推荐 3.10+)
    内存 ≥ 4GB(生产环境建议 8GB+)
    存储 ≥ 1GB 可用空间
    可选后端 SQLite(默认)、DuckDB(分析场景)

    快速安装(3行代码搞定)

    pip install chromadb
    
    import chromadb
    client = chromadb.Client()  # 开箱即用!

    Docker 部署(生产推荐)

    docker run -d --name chroma \
      -p 8000:8000 \
      ghcr.io/chroma-core/chroma:latest

    部署后访问 http://localhost:8000 即可使用 HTTP API。

    🔩 核心功能

    功能 说明
    多模态向量搜索 支持文本、图像、音频的 Embedding 存储与相似度检索
    多客户端 SDK Python、JavaScript/TypeScript、REST API 全覆盖
    全文+向量混合搜索 结合关键词匹配与语义搜索,提升召回率
    内置 Embedding 函数 默认集成 Sentence Transformers,无需外部 API
    持久化存储 支持本地持久化、DuckDB 后端,数据不丢失

    💡 典型使用场景

    场景一:RAG(检索增强生成)应用

    将企业文档、知识库存入 Chroma,用户提问时先检索相关片段,再送给 LLM 生成答案。相比直接问 LLM,准确率提升 40%+,幻觉大幅减少。

    # RAG 核心代码(不到 20 行!)
    collection = client.create_collection("docs")
    collection.add(
        documents=["公司报销流程...", "年假申请..."],
        ids=["1", "2"]
    )
    results = collection.query(query_texts=["如何报销?"], n_results=1)
    # results 包含最相关的文档片段

    场景二:AI Agent 长期记忆

    让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma,下次对话时自动检索上下文,实现”越用越懂你”。

    场景三:语义推荐系统

    电商、内容平台的”猜你喜欢”,用 Chroma 存储商品/内容向量,用户行为向量实时检索最相似物品,推荐相关度远超协同过滤。

    🌟 推荐理由

    Chroma 是我见过最易上手的向量数据库,没有之一。不需要学 SQL,不需要配置复杂集群,pip install 之后 3 行代码就能跑起来。

    相比 Pinecone 等托管服务,Chroma 完全开源、可自托管,数据不出门,合规零风险。相比 Faiss,它提供了完整的 CRUD API 和持久化,不用每次重启都重新建索引。

    如果你正在做 RAG、AI 搜索、推荐系统,或者想给 Agent 加上记忆,Chroma 是目前开发体验最好的选择。LangChain、LlamaIndex、Supabase 都已官方集成,生态非常成熟。

    📥 下载地址

    渠道 链接 / 命令
    GitHub 仓库 github.com/chroma-core/chroma
    官网文档 docs.trychroma.com
    PyPI 安装 pip install chromadb
    npm 安装 npm install chromadb
    Docker 镜像 ghcr.io/chroma-core/chroma:latest

    — 开源项目第52期 | 夜野飞云 —

  • Chroma:43.1K Stars!开源向量数据库,让AI应用拥有长期记忆

    Chroma:43.1K Stars!开源向量数据库,让AI应用拥有长期记忆

    Chroma Banner

    开源向量数据库 · 让AI拥有长期记忆

    📦 项目简介

    Chroma 是专为AI应用打造的开源嵌入式向量数据库,让大模型拥有”长期记忆”。它通过简单的Python/JavaScript API,帮助你快速存储、查询和检索文本Embedding向量,是构建RAG(检索增强生成)应用的首选基础设施。

    🔗 GitHub:chroma-core/chroma ⭐ Stars:43.1K+ 📄 协议:Apache 2.0

    🔧 安装要求和过程

    环境要求

    依赖 要求
    Python ≥ 3.8(推荐 3.10+)
    内存 ≥ 4GB(生产环境建议 8GB+)
    存储 ≥ 1GB 可用空间
    可选后端 SQLite(默认)、DuckDB(分析场景)

    快速安装(3行代码搞定)

    pip install chromadb
    
    import chromadb
    client = chromadb.Client()  # 开箱即用!

    Docker 部署(生产推荐)

    docker run -d --name chroma \
      -p 8000:8000 \
      ghcr.io/chroma-core/chroma:latest

    部署后访问 http://localhost:8000 即可使用 HTTP API。

    🔩 核心功能

    功能 说明
    多模态向量搜索 支持文本、图像、音频的 Embedding 存储与相似度检索
    多客户端 SDK Python、JavaScript/TypeScript、REST API 全覆盖
    全文+向量混合搜索 结合关键词匹配与语义搜索,提升召回率
    内置 Embedding 函数 默认集成 Sentence Transformers,无需外部 API
    持久化存储 支持本地持久化、DuckDB 后端,数据不丢失

    💡 典型使用场景

    场景一:RAG(检索增强生成)应用

    将企业文档、知识库存入 Chroma,用户提问时先检索相关片段,再送给 LLM 生成答案。相比直接问 LLM,准确率提升 40%+,幻觉大幅减少。

    # RAG 核心代码(不到 20 行!)
    collection = client.create_collection("docs")
    collection.add(
        documents=["公司报销流程...", "年假申请..."],
        ids=["1", "2"]
    )
    results = collection.query(query_texts=["如何报销?"], n_results=1)
    # results 包含最相关的文档片段

    场景二:AI Agent 长期记忆

    让 AutoGPT、CrewAI 等 Agent 框架拥有跨会话记忆。将历史对话的 Embedding 存入 Chroma,下次对话时自动检索上下文,实现”越用越懂你”。

    场景三:语义推荐系统

    电商、内容平台的”猜你喜欢”,用 Chroma 存储商品/内容向量,用户行为向量实时检索最相似物品,推荐相关度远超协同过滤。

    🌟 推荐理由

    Chroma 是我见过最易上手的向量数据库,没有之一。不需要学 SQL,不需要配置复杂集群,pip install 之后 3 行代码就能跑起来。

    相比 Pinecone 等托管服务,Chroma 完全开源、可自托管,数据不出门,合规零风险。相比 Faiss,它提供了完整的 CRUD API 和持久化,不用每次重启都重新建索引。

    如果你正在做 RAG、AI 搜索、推荐系统,或者想给 Agent 加上记忆,Chroma 是目前开发体验最好的选择。LangChain、LlamaIndex、Supabase 都已官方集成,生态非常成熟。

    📥 下载地址

    渠道 链接 / 命令
    GitHub 仓库 github.com/chroma-core/chroma
    官网文档 docs.trychroma.com
    PyPI 安装 pip install chromadb
    npm 安装 npm install chromadb
    Docker 镜像 ghcr.io/chroma-core/chroma:latest

    — 开源项目第52期 | 夜野飞云 —

  • Meta用帐篷搭建数据中心,效仿特斯拉降本

    当你想到数据中心,脑海里浮现的应该是钢筋混凝土、精密空调、层层安检的那种坚固建筑。但Meta正在做的事,可能会颠覆你对数据中心的全部想象——他们在俄亥俄州新奥尔巴尼市外,搭了至少6个大型帐篷,里面装的是价值数十亿美元的AI芯片。

    Meta AI数据中心概念图
    Meta的AI基础设施布局正在走上一条”非常规”路线

    特斯拉开过先例,这次轮到Meta

    2018年,特斯拉为了救Model 3的产能危机,在弗里蒙特工厂的停车场搭了个”帐篷生产线”。当时不少人觉得埃隆·马斯克疯了——正规汽车工厂哪有在帐篷里生产的?

    但这次,Meta把”帐篷”搬进了数据中心建设现场。根据数据中心追踪机构Cleanview创始人Michael Thomas的追踪,Meta在俄亥俄州新奥尔巴尼市外搭建了至少6个”快速部署结构”(本质上就是大型帐篷),其中5个单体面积达到12.5万平方英尺的帐篷,在2026年4月到6月之间完成建设,卫星图像已经可以清晰观测到这些结构。

    帐篷里装的是什么?答案是AI训练所需的大规模算力集群。这些帐篷内部署了总价值数十亿美元的AI芯片,主要用于支持Meta的Llama系列模型训练和AI相关业务的推理需求。

    为什么要选帐篷?答案就两个字:快、省

    传统数据中心从规划到交付,通常需要3到5年。你要拿地、报批、招标、施工、验收……等建完,AI模型可能已经迭代了三个大版本。

    帐篷方案可以把建设周期压缩到几个月。Meta这次不仅借鉴了特斯拉的帐篷思路,还参考了xAI(马斯克的另一家公司)率先推广的”模块化燃气涡轮机离网供电”方案——帐篷现场配套了200兆瓦的模块化燃气涡轮机供电,不需要依赖当地电网的增容审批,又省了一大笔时间。

    • 传统数据中心建设周期:3到5年
    • 帐篷方案建设周期:压缩到数月
    • 供电方案:200兆瓦模块化燃气涡轮机,离网运行
    • 单帐篷面积:约12.5万平方英尺

    背后是Meta在AI军备竞赛中的集体焦虑

    这事看起来荒诞,但放在Meta当前的处境里,倒是能理解。2026年,Meta的AI模型Llama 4 Spark已经完成训练,但开发者依赖的API却多次推迟发布,导致市场反响相当平淡。

    与此同时,Meta计划投入最高1450亿美元用于数据中心等资本支出,这一激进的投入计划引发了华尔街的不满——2026年Meta股价累计下跌了5%。用帐篷部署数据中心,某种意义上是一场”边打边建”的豪赌,Meta寄希望于通过快速扩充算力来赶上OpenAI和Google在模型能力上的领先优势。

    如果Llama 4的API能在短期内顺利推出并获得开发者认可,这批帐篷数据中心将成为Meta AI反攻的关键资产;反过来,如果产品继续延期或者市场不买账,这些帐篷可能就会沦为昂贵的”帐篷纪念碑”。

    AI基础设施竞赛,已经进入了”疯狂麦克斯”模式

    Michael Thomas把当前的AI基础设施竞赛形容为”疯狂麦克斯”模式——企业为了抢夺算力,正在采取越来越多激进、非常规,甚至有些荒诞的手段。

    Meta的帐篷数据中心,或许只是这场竞赛中最新、也最具视觉冲击力的一幕。无论是特斯拉的帐篷造车,还是Meta的帐篷装芯片,本质上都是在用非常规手段抢时间——算力需求的增长,已经远远超过了传统基建模式能跟上的速度。