标签: AI

  • 有人做了个AI”名气排行榜”,你的名字在大模型里有多大分量?

    有人做了个AI”名气排行榜”,你的名字在大模型里有多大分量?

    AI模型名气排行榜
    “In the Weights”网站界面,像素风设计,展示AI模型对人物的”认知强度”

    你上一次在谷歌上搜索自己的名字是什么时候?如果你试过,你可能已经注意到结果和以前不太一样了。这不是你的错觉——随着聊天机器人越来越成为人们获取信息的主要方式,搜索引擎已经不再是那个”权威记录者”了。

    那么问题来了:如果有人想看看自己在AI眼里”存在”吗,该怎么办?

    两个前OpenAI员工做了一个”AI虚荣搜索”

    托马斯·丁森和乔伊·弗林决定解决这个问题。他们做了一个叫”In the Weights”的网站——名字里的”weights”指的是AI模型的参数权重,也就是那些决定模型输出效果的神秘数字。

    这个网站做的事情很简单,但也足够让人上头:它向十几个主流AI模型(包括Grok、Gemini、多个版本的GPT、Claude、Llama)提出一个类似”XXX是谁?给出最多10个结果”的问题,然后给出一个”强度分数”。分数越高,意味着AI模型们越”认识”你。

    “在weights里,意味着你的存在被认为在创造超级人工智能的过程中是重要的。”——In the Weights网站关于页面

    排行榜一直在变

    网站的排行榜是实时变化的——就在我写这篇文章的时候,排名第一的是《小鬼当家》的主演麦考利·卡尔金,他的强度分数是988,和歌剧演唱家卢西亚诺·帕瓦罗蒂咬得很紧。

    TechCrunch的作者安东尼·哈——就是报道这件事的那位记者——在这个网站上的强度分数是641,排在前6%。他承认自己看了一眼同事的分数之后,感觉还能再高一点。

    网站还会标注可能的AI幻觉:显然GPT-5.4 Mini在回答”Anthony Ha是谁”的时候,给出的答案是”这是一个缩写,可能指代多个人”。

    这不只是虚荣心作祟

    丁森在接受TechCrunch采访时说,2026年做谷歌式的”虚荣搜索”已经不对了,因为越来越多的流量在流向大模型。他还说,这个网站的方向某种程度上是被一篇戏谑的博客文章”定调”的——那篇文章用幽默的方式讨论了AI权重和”我们是否只是一堆肉做的”这个经典哲学问题。

    到目前为止,这个网站的”接收情况”已经超出了他们的预期。他们本来以为这会是一个小小的好奇心满足工具,没想到它好像触发了某种神经——人们真的很好奇自己是否能在超级智能里”永垂不朽”。


    In the Weights用一种轻松、怀旧的方式(网站界面是任天堂NES风格的像素风)提出了一个严肃的问题:当AI模型成为人们认知世界的主要中介的时候,被AI”记住”到底意味着什么?你可以去试试看——但友情提醒,分数可能会让你有点在意。

  • 亚马逊要把自研AI芯片卖给你了,英伟达的护城河开始漏水

    亚马逊要把自研AI芯片卖给你了,英伟达的护城河开始漏水

    亚马逊AI芯片挑战英伟达
    亚马逊Trainium芯片正面挑战英伟达GPU霸主地位

    如果你最近关注AI芯片市场,眼睛大概一直盯着英伟达。毕竟黄仁勋刚刚宣布找到了一个全新的2000亿美元市场——卖CPU给AI基础设施。但就在大家盯着英伟达的时候,一个最意想不到的对手悄悄举了手。

    亚马逊云计算部门AWS的CEO彼得·德桑蒂斯最近向彭博社透露,AWS正在洽谈把自家的AI训练芯片Trainium卖给其他公司。德桑蒂斯没有点名潜在买家,但光这个信号就足够让整个AI芯片市场侧目了。

    为什么现在要卖?

    AWS做芯片这么多年,一直只给自己用。原因很简单——它靠这些芯片在云端处理客户的AI任务,赚的是一整套服务的钱:不光是AI算力本身的费用,还有存储、安全、网络、监控等配套收入。把芯片卖给别人,等于培养竞争对手,还让自己现有的云客户排更长的队。

    但亚马逊CEO安迪·贾西今年4月在年度股东信里把底牌亮出来了:如果芯片业务是一家独立公司,把今年生产的芯片卖给AWS和其他第三方,年化营收运行率大概是500亿美元。他还说得很直白:对自家芯片的需求太旺盛了,未来很可能会把整机架的芯片卖给第三方。

    Trainium2已经在跑Anthropic和苹果的AI任务了。下一代Trainium4据说到2027年才能交付,但贾西说就连Trainium4的产能都已经被预订一空。

    英伟达真的会被撼动吗?

    500亿美元的体量,即使对英伟达来说也不是完全无所谓。英伟达目前的营收运行率是3260亿美元,500亿还不足以撼动它的地位,但这是一个开始。

    更何况,亚马逊卖芯片有一个英伟达没有的优势:它自己就是全球最大的AI云服务买家之一,它设计的芯片是给自己用的。这意味着它的芯片设计反馈循环比任何独立芯片公司都快——真实工作负载的反馈直接进到下一代芯片的设计里。

    当然,大规模对外卖芯片有个绕不过去的坎:制造产能。亚马逊的芯片由台积电代工——英伟达的芯片也是。而台积电最近的头号客户已经不是苹果了,是英伟达。亚马逊要想抢到足够多的产能,得先说服台积电给自己挤出空间来。


    黄仁勋说AI的CPU市场有2000亿美元。贾西说AWS的芯片生意能做到500亿美元。这两人都在画饼,但饼的大小已经说明问题——AI芯片的战争,已经从”英伟达一家独大”变成了”大家都要来分一杯羹”。

  • ChatGPT与Getty Images达成授权合作,AI版权问题终于有人坐下来谈了

    ChatGPT的回答里,以后会出现带正版授权的图片了。OpenAI和Getty Images上周日宣布达成一项多年合作协议,Getty的授权图片库将直接出现在ChatGPT的搜索和发现功能里。

    ChatGPT Getty Images
    ChatGPT与Getty Images达成授权合作,AI生成内容版权问题出现新解法

    这件事看起来是个小更新,实际上指向的是AI行业最头疼的问题之一:训练数据和生成内容的版权归属。

    为什么是Getty Images

    Getty Images不是普通的图库。它是全球最大的正版视觉内容平台之一,手里握着近60万内容创作者的作品,还有360多个内容合作伙伴。每一年,Getty覆盖超过16万场新闻、体育和娱乐活动。

    在此之前,AI公司用图片训练模型或者生成图片,一直游走在灰色地带。艺术家抱怨自己的作品被拿来训练AI,却没有任何报酬或授权。Getty Images自己也曾把Stability AI告上法庭,理由是Stability AI非法复制了1200万张Getty的图片来训练Stable Diffusion。

    Getty Images CEO Craig Peters在声明里说得很清楚:”高质量、有授权的视觉内容,让AI驱动的搜索和发现更有用,也更值得信任。这次和OpenAI的合作,基于一个共同认知——就是这一点。”

    和Perplexity走的是同一条路

    这条路上不只有OpenAI。Perplexity早就和Getty Images达成了类似的展示合作,在搜索结果里直接显示Getty的授权图片。两家AI公司的逻辑是一样的:用户问问题,AI回答,配图要合法。

    但OpenAI的举动意义更大。ChatGPT的日活用户量级和Perplexity不在一个层次上,这次合作意味着”授权图片进入AI回答”这件事,从一家小众AI搜索公司,变成了行业主流做法。

    对AI版权争议意味着什么

    AI版权的争议,核心是两个问题:训练数据要不要授权,生成内容算不算侵权。这次合作主要解决的是后者——ChatGPT在回答里展示的图片,如果是来自Getty的授权库,那就不存在版权风险。

    但这只是部分解决。训练数据的问题还没碰。GPT模型训练时用了哪些图片,OpenAI至今没有完整公开。Getty和OpenAI的这次合作,也不代表Getty允许OpenAI用它的图片训练未来模型——这是两回事。

    • 展示授权:ChatGPT可以用Getty图片在回答里展示(这次合作的内容)
    • 训练授权:OpenAI能不能用Getty图片训练GPT(这次没说)
    • 生成授权:用户用DALL-E生成的图片会不会侵犯Getty摄影师的权利(依然 open question)

    话说回来,至少OpenAI愿意坐下来谈授权,而不是像某些公司一样先干了再说。这个态度本身,对整个行业是个正向信号。


    Getty Images的CEO说,这让AI搜索”更值得信任”。用户可能不一定感受得到背后的版权博弈,但他们看到的图片,确实会更干净一些——至少理论上,那些图片的创作者拿到了钱。

  • 诺贝尔化学奖得主John Jumper离开DeepMind加入Anthropic,AI人才大战打到诺奖圈了

    2024年诺贝尔化学奖得主John Jumper上周五在X上发了一条消息,宣布自己要离开工作了近9年的Google DeepMind,转投竞争对手Anthropic。这条消息不长,但足以让整个AI圈子侧目。

    John Jumper AlphaFold
    诺贝尔化学奖得主John Jumper(右)与DeepMind CEO Demis Hassabis

    Jumper在DeepMind干了快9年,刚拿到博士学位才6个月就被Hassabis委以重任,领导AlphaFold团队。AlphaFold是什么?简单说,它是一个用AI预测蛋白质三维结构的模型——蛋白质长得啥样,决定了它怎么工作,进而决定药物能不能起效。这个难题困扰了结构生物学家几十年,AlphaFold基本上把它解决了。

    一个模型改变了一门学科

    2024年,Jumper和Hassabis一起拿了诺贝尔化学奖。诺奖委员会的理由很直接:AlphaFold”解决了一个50年来的难题”。这个模型能根据蛋白质的基因序列,精准预测它折叠成什么形状——而形状就是功能的关键。

    AlphaFold的贡献不只是学术上的。它开源了预测结果数据库,覆盖了几乎所有已知的蛋白质结构,全球研究人员可以免费查询。这对新药研发、酶工程、甚至理解神经退行性疾病都有实质推动。

    那么问题来了,这样的人为什么要走?

    Bloomberg透露了一个线索

    Bloomberg的报道说,Jumper在Google内部是编程工具团队的关键成员,而这个团队的产品一直卖不动。这或许是一个原因,但可能还不是全部。

    更值得注意的背景是:这周不只是Jumper一个人离开DeepMind。Character AI的联合创始人Noam Shazeer也宣布离开DeepMind,去了OpenAI。两起人才流动,同一个方向——顶尖人才从Google流向它的AI竞争对手。

    Anthropic这边,拿到Jumper意味着什么?Anthropic一直把”AI安全”挂在嘴边,但它的野心不止于此。Jumper的加入,很可能意味着Anthropic要在科学应用方向上发力——用大模型加速科学研究,而不只是做聊天机器人。

    AI人才大战的缩影

    把视角拉远一点,这件事其实是整个AI行业人才争夺战的缩影。Anthropic和OpenAI都在从DeepMind挖人,而DeepMind作为Google旗下的AI实验室,背靠大厂资源,却似乎留不住最顶尖的研究者。

    • Jumper拿过诺奖,是结构生物学和AI交叉领域最顶尖的人之一
    • 他选择Anthropic而不是留在DeepMind,说明他认为Anthropic能给他更大的空间
    • 对Google来说,这是继Noam Shazeer出走之后又一记人才重拳

    Jumper在告别帖里特意感谢了Hassabis,说DeepMind是个特别的地方,他还会继续关注老东家的发现。话这么说,但人已经走了。


    Anthropic把这则消息加了一层意味:它不只是挖到了一个诺奖得主,更是在向外界传递一个信号——它要做的事,比训练一个更好的聊天机器人要大得多。

  • Signal总裁提醒:AI聊天机器人不是你的朋友,别把隐私交给它

    “这些不是你的朋友。”当被问及对ChatGPT和Claude这类聊天机器人的看法时,加密通讯应用Signal总裁Meredith Whittaker的回答非常直接。这句话出自她最近接受彭博社的专访,背后是一个在谷歌待了十多年的”内部反抗者”对当代AI助手热潮的冷思考。

    Signal与AI隐私
    Signal总裁Whittaker:AI聊天机器人不是你的朋友,别把隐私交给它 图:生成配图

    一个”谷歌抗议领袖”的转向

    Whittaker在谷歌工作了十多年,最出名的举动是2018年组织谷歌员工大罢工,抗议公司处理性骚扰问题的方式,以及反对谷歌参与五角大楼的”Project Maven”AI军事项目。她当时被媒体称为”谷歌抗议领袖”,2019年离开谷歌后加入了Signal。

    在Signal,她的立场一如既往地强硬:隐私是自由社会的先决条件,任何后门都是不可接受的。这次采访中,她把矛头指向了当下最热门的AI个人助手——那些被设计成”你最好的朋友”的聊天机器人。

    “这些不是你的朋友,不是有意识的个体,也不是有感知的对话者。”Whittaker说,”它们很有用,但很多东西都很有用。”

    她自己怎么用AI

    记者问她会不会用ChatGPT之类工具,Whittaker的回答挺有意思:她偶尔会让AI帮她格式化文档,但绝不会向AI”提问”。她说自己对思考和写作的过程非常认真,不希望那种从困惑到厘清思路的过程,被一个只会把网上已有内容取平均值的系统给提前剥夺了。

    这个态度很鲜明——AI可以当工具,但别把它当成了你思想的替代品。她特别提到,你当然可以说”我删除了聊天记录”,但最终决定这些对话数据是否被存储、被挖掘、被用于优化广告推荐的,是运营这个服务的公司,不是你。


    “AI圣诞购物”背后的隐私噩梦

    采访中最精彩的部分,是她对微软AI CEO Mustafa Suleyman的”AI圣诞购物”愿景的回应。Suleyman之前对彭博社说,2026年用户就可以让Copilot全权负责买圣诞礼物了——它会去翻你和家人兄弟姐妹的群聊,猜每个人想要什么,然后自己下单、自己安排寄送。

    Whittaker的拆解非常犀利:要实现这个功能,Copilot需要拿到你的信用卡、浏览器、Signal消息、代表你发消息的权限、家庭住址、日程表……”你刚才描述的,是一个能跨多个应用和服务获取极高权限的系统。放到Signal的场景里,这本质上就是一种后门。”

    她真正的担心是:全球只有三家公司控制着我们的核心操作系统——谷歌的安卓、微软的Windows、苹果的iOS。如果其中任何一家决定在系统层集成这种”全能AI助手”,那么Signal这样的隐私应用就失去了保障用户数据安全的能力。用户的选择权被悄无声息地剥夺了。

    “宁愿退出市场,也不开后门”

    这引出了一个很现实的问题:如果英国或欧盟政府要求Signal提供后背门(以打击儿童色情等名义),Signal会怎么做?Whittaker的回答没有丝毫犹豫:”我们的立场是,我们宁愿退出一个市场,也不会削弱技术保障。”

    她解释道,加密要么对所有人有效,要么对所有人无效。不存在所谓的”只有好人能用的后门”。一旦后门存在,它就会被各国情报机构盯上——她透露,已经有迹象表明俄罗斯愿意为发现Signal漏洞的人付钱。


    Signal的生存账本

    作为一个非营利基金会,Signal的运营模式也和硅谷主流截然不同。Whittaker透露,Signal每年的运营成本大约是5000万美元,70%来自大额捐赠者,30%来自普通用户的每月小额捐款。它没有VC股东,不需要为了下一轮融资拼命增长,也不需要为了IPO把用户数据货币化。

    这种”不为增长而增长”的模式,在当下显得有点格格不入。但Whittaker说得很坦然:”科技行业的经济引擎是数据的收集和货币化。Signal存在的意义就是做完全相反的事情。”

    至于她自己用不用这些AI工具?”我偶尔让它们帮我格式化文档,但我没有和它们建立任何关系。”这句话可能是对当下AI助手”拟人化”营销最干脆的回击。

  • SK海力士把三星拉下马了,AI存储器大战的真正赢家终于浮出水面

    6月22日,韩国股市发生了一件历史性时刻——SK海力士以1.35万亿美元市值超越三星电子,成为韩国市值最高的上市公司。三星自2000年以来占据这个位置已经超过四分之一个世纪,这次被超越,本质上是AI浪潮把一家差点破产的内存厂商推上了王座。

    SK海力士与AI芯片
    SK海力士成为韩国市值最高公司,AI存储器需求是核心驱动力 图:生成配图

    从垃圾股到AI宠儿

    把时间拨回2002年,当时的海力士半导体(SK海力士前身)深陷债务危机,几乎要把自己卖给美光,交易最后黄了,公司进入债权人管理状态长达近十年。2003年,它的股价跌到最低的135韩元,在韩国被戏称为”东田株”(便士垃圾股)。

    谁也没想到,二十几年后,这家曾经的差点破产的企业,会成为AI时代最大的赢家之一。驱动力很简单:HBM(高带宽内存)。这种专门服务于AI训练和推理的高端内存芯片,是英伟达和谷歌等巨头AI系统的核心组件,而SK海力士在这个细分市场的份额高达61%。

    SK海力士今年以来的股价涨幅超过340%,AI浪潮把它从破产边缘直接送上了韩国市值第一的宝座。

    AI重新定义了内存芯片的价值

    过去,内存芯片是典型的周期货——DRAM和NAND闪存的价格大起大落,所有厂商一起卷产能、卷成本,利润薄得像纸。但AI改变了一切。HBM不是普通内存,它是垂直堆叠的超高带宽内存,专门为GPU和其他AI加速器设计,技术门槛高得多,利润率也完全不在一个量级。

    SK海力士几乎独占了HBM3和HBM3E的高端市场,英伟达最新的H100/B200训练集群用的就是它的芯片。与此同时,三星虽然在努力追赶HBM4,但进展并不顺利——有出口数据显示,三星的HBM4产品可能还需要一段时间才能真正量产交付。


    业绩反转的力度

    数字最能说明问题。2023年,内存行业的严重低迷让SK海力士报出了7.73万亿韩元的年度营业亏损。仅仅一年后,AI boom全面爆发,微软、谷歌、Meta疯狂采购AI芯片,SK海力士直接录得23.5万亿韩元的年度营业利润,创下历史纪录。

    这种反转速度在半导体行业也不多见。美利兹证券的高级分析师Kim Sunwoo说得很直白:”定制化AI内存的出现从根本上改变了行业的经济规律,让SK海力士得以确立市场领导者的地位。”

    三星为什么掉队了

    三星的业务比SK海力士复杂得多——它不光做内存,还做逻辑芯片和整机电子产品。在AI内存这个细分赛道上,三星的动作明显慢了半拍。HBM需要先进的封装技术,而SK海力士在这个领域积累了更多经验。等到三星反应过来,SK海力士已经把英伟达和谷歌这两大客户牢牢握在手里了。

    6月22日当天,SK海力士股价上涨5.7%,市值达到2082.5万亿韩元(约1.35万亿美元),而三星电子的市值停在2081.3万亿韩元。差距不大,但象征意义极强——AI时代,卖”更专业的芯片”比卖”更多的芯片”更值钱。

  • Chroma:AI原生开源向量数据库,RAG与语义搜索首选,28,530 Stars让搜索基础设施零门槛

    Chroma:AI原生开源向量数据库,RAG与语义搜索首选,28,530 Stars让搜索基础设施零门槛

    Chroma Logo

    Chroma – Search Infrastructure for AI

    📦 项目简介

    Chroma 是一款AI 原生的开源向量数据库,提供向量、全文、正则表达式和元数据搜索一体化基础设施。专为 AI 应用设计,支持语义相似搜索、混合检索和数据集版本管理,是 RAG(检索增强生成)和 AI 搜索场景的首选开源方案。

    ⭐ 28,530 Stars
    🍴 2,333 Forks
    📜 Apache-2.0
    🐍 Python / TypeScript / Rust
    📦 15M+ 月下载

    ⚙️ 安装要求和过程

    环境要求

    • Python ≥ 3.8(推荐 3.9+)
    • Node.js ≥ 18(TypeScript 客户端)
    • Rust ≥ 1.70(可选,自行编译时使用)
    • Docker(可选,服务端部署)

    快速安装(Python)

    # 安装 Chroma Python 客户端
    pip install chromadb
    
    # 启动 Chroma 服务端(默认端口 8000)
    pip install chromadb[server]
    chromadb run
    
    # 或使用 Docker 一键启动
    docker run -d --name chroma \
      -p 8000:8000 \
      -v $(pwd)/chroma-data:/chroma/chroma \
      chromadb/chroma:latest

    TypeScript / JavaScript 安装

    # npm
    npm install chromadb
    
    # 在 Node.js / 浏览器中使用
    import { ChromaClient } from 'chromadb';
    
    const client = new ChromaClient({ path: "http://localhost:8000" });

    Chroma Cloud(托管服务)

    注册 Chroma Cloud 即可获得免运维、自动扩缩容的托管向量数据库,支持 S3/GCS 对象存储、SOC 2 Type II 合规。

    ✨ 核心功能

    🔍 多模态搜索

    同时支持向量搜索(语义相似度)、全文搜索(BM25/SPLADE 稀疏向量)、正则表达式搜索元数据过滤。可在单次查询中混合多种搜索策略,实现更精准的召回效果。

    📦 集合 Forking(数据集版本管理)

    支持写时复制(Copy-on-Write)Forking,可快速复制整个 Collection 用于 A/B 测试、模型版本对比或数据回滚,无需额外存储空间。

    ⚡ 对象存储原生架构

    索引专门优化用于 S3 / GCS 对象存储,热数据内存缓存 + 温数据 SSD + 冷数据对象存储三层智能分层。存储成本降低 10 倍(向量 1GB → 对象存储 $0.02/GB/mo vs 内存 $5/GB/mo)。

    🔌 多语言 SDK + 生态集成

    官方支持 Python、TypeScript、Rust 三语言 SDK;无缝集成 LangChain、LlamaIndex、OpenAI、Cohere、Hugging Face 等主流 AI 框架;也可通过 MCP 协议直接接入 AI Agent。

    📊 企业级可靠性

    SOC 2 Type II 认证;支持多租户隔离、VPC 私有部署(BYOC)、CMEK 客户托管密钥、AWS PrivateLink 私有网络;索引状态实时监控;读写一致性级别可控(ReadLevel)。

    🚀 典型使用场景

    场景一:RAG(检索增强生成)知识库

    将企业文档、技术手册、FAQ 等嵌入为向量存入 Chroma,LLM 回答问题时先检索相关片段再生成答案。相比直接使用 LLM,准确率提升 40%+,同时可追溯答案来源。

    # RAG 典型代码(Python)
    import chromadb
    from langchain.vectorstores import Chroma
    from langchain.embeddings import OpenAIEmbeddings
    
    # 创建向量库
    vectordb = Chroma.from_documents(
        documents=splits,
        embedding=OpenAIEmbeddings(),
        persist_directory="./chroma_db"
    )
    
    # 检索相关文档
    retriever = vectordb.as_retriever(search_kwargs={"k": 4})
    relevant_docs = retriever.get_relevant_documents("如何重置密码?")

    场景二:语义搜索与推荐系统

    电商、内容平台可用 Chroma 实现”以文搜图”、”相关推荐”等功能。用户查询经嵌入模型转化为向量后,与数据库中商品/内容向量计算相似度,返回最相关的结果。支持混合检索(向量+全文+元数据过滤联合排序)。

    场景三:AI Agent 长期记忆

    为 AI Agent 提供跨会话的持久化记忆。将历史对话、用户偏好、工具调用记录存入 Chroma,Agent 每次运行时检索相关上下文注入 Prompt,实现”越用越懂你”的个性化体验。可与 Mem0、claude-mem 等记忆层搭配使用。

    💡 推荐理由

    Chroma 是目前最易上手的向量数据库,没有之一。pip install chromadb 后 3 行代码即可启动,不需要任何外部依赖或复杂配置。这对于想要快速验证 RAG 想法的开发者来说,是绝对的”第一步”首选。

    它的多模态搜索能力尤其值得称道——不再是单一的向量相似度搜索,而是可以混合稀疏向量(BM25)、稠密向量、全文和正则表达式,在一个查询里完成多路召回再重排序。这个设计让召回率比单纯向量搜索提升了不少,尤其在专业术语、产品编码等”精确匹配”场景。

    对象存储原生架构也是一个被低估的亮点。很多向量数据库把索引放内存,数据量大了成本直线上升。Chroma 把向量存 S3/GCS,热数据才进内存,存储成本直接降到 1/10。对于千万级向量规模的应用,这个差异就是”用得起”和”用不起”的分界线。

    最后,Chroma 的社区活跃度很高,27K+ Stars、15M+ 月下载量、9 万+ GitHub 仓库依赖,意味着你踩过的坑几乎一定有人踩过,Stack Overflow / Discord 上能找到现成答案。加上 LangChain、LlamaIndex 的官方集成,基本上”开箱即用”。

    📊 技术规格

    项目 详情
    GitHub chroma-core/chroma
    Stars 28,530
    最新版本 Python 1.5.9 / JS 3.4.5 / CLI 1.4.4
    开源许可 Apache-2.0
    主要语言 Python、Rust、Go、TypeScript
    月下载量 15,000,000+
    存储后端 S3 / GCS(对象存储原生)
    查询延迟(P50) 20ms(热缓存)/ 650ms(冷启动)
    集合上限 100 万 Collection / 500 万条记录
    搜索类型 向量 / 全文 / 正则 / 元数据 / 混合

    🚀 Chroma 让每个开发者都能在 5 分钟内拥有生产级向量搜索能力。
    无论是构建 RAG 知识库、语义搜索引擎,还是为 AI Agent 配备长期记忆,它都是最值得信赖的开源基石。

  • iOS 27的AI不好玩,但真的好用

    WWDC 2026上,苹果花了大量时间讲新一代Siri AI。但如果你仔细看完整个发布会,会发现苹果真正的AI战略不在这里。它把AI塞进了你每天用的那些小功能里——没有炫酷的对话界面,但用起来确实更顺手了。

    iOS 27 AI功能展示

    iOS 27今年秋天正式推送,开发者测试版现在已经可以装了。以下这些AI功能,是实际用过之后最有感触的几个。

    买单时直接拆账

    iOS 27里,Apple Cash可以直接拆账单了。你拍一张收据的照片,Apple Intelligence自动识别上面的菜品、数量、小费和总金额,然后让你勾选自己吃了哪些——甚至支持选”一半”如果你和别人分了一道菜。

    选完之后,直接通过iMessage群发给一起吃饭的人,大家各自付账,全程不需要额外装任何App。这个功能妙就妙在它不突兀,你只有在真正需要拆账单的时候才会看到这个选项,而且它用的都是你本来就在用的东西:信息、Apple Cash、相机。

    密码自动换新

    这些年大家总算养成了用复杂密码的习惯,但问题在于——你的密码再复杂,碰上数据泄露也没用。iOS 27新增了一个AI驱动的密码更新功能,它能替你自动去那些被泄露过的网站,帮你把密码改成新的随机密码。

    整个过程是AI替你操作的:打开网页、登录、找到修改密码的入口、输入新密码,一气呵成。你只需要做一次生物识别验证,确认是本人操作即可。

    iMessage里的”一键建议”

    比如朋友发消息让你帮忙带杯咖啡,键盘上方会直接出现一个提示,问你要不要把这个待办加到提醒事项里。有人让你把活动的照片发过去,AI会根据照片库里的内容自动推荐相关的照片。

    约了吃饭或者开会,直接问你要不要把这个时间加到日历里。这些东西不需要你主动去用什么”AI助手”,它就长在你正常聊天的界面里,不显山不露水。

    打客服电话时自动显示信息

    iOS 27新增了一个叫”通话上下文”的功能,当你打客服电话的时候,屏幕上会自动显示你可能用到的信息——比如你打航空公司的客服,你的确认码会直接显示在通话界面上。

    这些信息是从你邮件里提取的,而且全部在设备端运行,苹果看不到,第三方更看不到。它就是一个安静在后台工作的工具,不需要你跟AI助手对话来提取信息——该出现的信息自己会出现。


    日历终于支持自然语言了

    你直接说”明天下午三点跟张三讨论方案”,日历就帮你建好了,不需要手动填各个字段。这个第三方日历App FantasyCal早就有,但苹果现在把它做到了系统层面,覆盖所有使用系统日历的用户。

    Safari帮你整理标签页

    每个人电脑上应该都有过这种时候——开了三四十个标签页,然后就再也找不到哪个是哪个了。iOS 27里的Safari会用AI理解你每个标签页的内容,然后自动把它们分组。

    比如你最近在计划一次旅行,所有和旅行相关的标签页会被归到一个组里,显示在浏览器顶部,点一下就能切换。而且苹果特别强调,这个过程不暴露你的浏览数据给任何人——连苹果自己都看不到。


    AI不一定要长成聊天机器人

    这些功能单独拿出一个来,都算不上什么”重大突破”。但它们加在一起,反映出来的是苹果对AI的一种理解:AI不一定要以一个”聊天机器人”的形态出现,它可以就是你的手机本身——更聪明一点,更懂你一点,但不会大张旗鼓地提醒你”嘿,我在用AI帮你”。

    iOS 27的这个方向,比单纯做一个”更聪明的Siri”要实用得多。毕竟对大多数人来说,手机是一个工具,不是一个新的聊天对象。

  • 特朗普政府封杀Anthropic,结果反而帮它做了广告

    6月的第二个周五下午,Anthropic的工程师们收到一封来自美国政府的信。信很短,短到只有几行字,但内容足以让整个公司炸锅——”出于国家安全考虑”,Anthropic刚刚发布的两款最新模型Fable 5和Mythos 5,必须立刻下架。

    Anthropic与特朗普政府对峙

    这件事在过去一周引发了AI圈的大规模讨论。Anthropic和美国政府之间的这场对峙,到底是怎么开始的?又会走向哪里?

    一根导火索

    事情的导火索,说起来有点戏剧性。据多家媒体报道,亚马逊的研究人员在使用Fable 5时,发现了一些可以绕过模型安全护栏的方法。亚马逊CEO Andy Jassy就此向白宫方面表达了担忧,然后事情就一发不可收拾了。

    特朗普政府以”国家安全”为由,要求Anthropic确保这两款模型不能被任何外国公民使用。Anthropic的回应很实在:我们做不到精准识别谁是中国人、谁是美国人,干脆把模型整体下线吧。

    但这里有个问题——什么叫”国家安全隐患”?政府没有公开任何具体报告,也没有给出详细解释。这种不透明的处理方式,让很多人觉得这件事没那么简单。

    关系一直不好

    TechCrunch的播客Equity最近专门讨论了这件事。主持人Sean O’Kane说了一句很直白的话:Anthropic和特朗普政府的关系,比其他AI实验室都要差。

    这可能不是巧合。Anthropic一直以来把自己定位成”最注重安全的AI公司”,嘴上说着”AI太危险了,得慢慢来”,结果转头就发布了Fable 5这样被认为极其强大的模型。这种”两面派”的做法,让它在华盛顿那边没什么人缘。

    更麻烦的是,Anthropic此前还把美国政府告了。你告了人家,然后指望人家对你友好一点?不太现实。很多网络安全专家就直接说,这就是报复。

    专家们在抗议

    这件事最尴尬的地方在于,顶尖的网络安全专家站出来帮Anthropic说话了。一群业内大牛联名写了一封公开信,要求特朗普撤销这个出口管制令。他们的理由是:Anthropic的模型在网络安全防御方面有很强的能力,现在强行下线,等于是把美国网络防御的一件重要武器给缴了。

    这些专家还说,Fable 5存在的那些所谓”漏洞”,别的AI模型也都有。凭什么只盯着Anthropic打?


    反转来了

    但这里有一个很有意思的转折。

    Anthropic和美国政府上一次闹僵的时候,Claude的下载量反而暴涨。很多人之前一直用ChatGPT,那次事件之后开始认真考虑Claude,觉得它更”负责任”,更像是一个有”抵抗精神”的AI助手。

    这一次说不定也会一样。”连特朗普都觉得它太危险”——这种标签贴上去,反而让Anthropic的模型显得更厉害了。就像Rebecca Bellan在播客里说的:”人人都喜欢坏男孩,对吧?”


    谁真的受益了?

    所以回到最开始的问题:Anthropic被盯上,谁受益了?

    短期来看,OpenAI、Google这些竞争对手可能松了一口气——至少这回被盯上的不是自己。但长期来看,这件事暴露出来的问题对整个AI行业都不利好。一个靠”别惹政府生气”来维持监管安全的行业环境,本身就很脆弱。

    至于Anthropic,它现在大概处于一种又急又气的状态。模型被下线,研发节奏被打乱,但它可能没意识到,这场”被封杀”的戏码,反而帮它做了一次效果极好的品牌宣传。

  • Anthropic签了9.15亿美元碳去除大单,AI公司终于开始算环保账了

    碳去除技术 AI环保
    AI数据中心能耗问题日益严重,Anthropic率先加入碳去除联盟(配图由AI生成)

    AI行业有个不太光彩的秘密:那些训练出来帮你写代码、画图的模型,背后烧掉的电力和产生的碳排放,比大多数人意识到的要多得多。

    上周,Anthropic做了一件在AI圈里很少见的事——它加入了Frontier碳去除联盟,并且承诺出资参与一笔总计9.15亿美元的新增资金池。这是第一家纯AI公司加入这个组织。

    Frontier是什么来头?它2022年由Stripe、Google、Shopify这几家科技公司联合发起,干的活说白了就是帮成员公司”碳账”——你公司排了碳,Frontier帮你找靠谱的碳去除项目,你出钱,项目方出力去除对应量的二氧化碳。

    18亿美元的资金池

    这次Anthropic进来,把Frontier累计承诺资金直接推到了18亿美元。到目前为止,Frontier已经在50多个项目上签了将近7亿美元的合约,总共能去除180万吨二氧化碳。数字听起来不小,但跟全球碳排放总量比起来,还是杯水车薪。

    Anthropic为什么这时候站出来?说好听点是意识到了责任,说实际点是压力使然。AI公司这几年在美国疯狂买电、建数据中心,不是每个动作都那么光彩。xAI在密西西比偷偷装天然气涡轮的事,被司法部盯上了;Meta和Oracle的数据中心用电需求,把批发电价推高了两位数百分比。

    Anthropic自己也说支持”全能源”策略,这话翻译过来就是”什么电都用”,包括化石燃料。所以Anthropic加入Frontier,多少有点”先表个态”的意思。

    Frontier投过哪些技术?

    Frontier挑项目有一套自己的流程,相当于一个共享的尽调平台。碳去除这个行业还很小,没有哪家公司的去除规模能大到满足Google、Microsoft这种级别的需求,Frontier的作用就是帮大家甄别哪些项目真能交付。

    • 直接空气捕获:把空气中的CO2直接吸出来封存
    • 强化岩石风化:把研磨后的硅酸盐岩石撒在农田里,让岩石自然吸收CO2
    • 生物油:把生物质转化成稳定的碳化合物埋掉
    • 海洋抗酸剂:往海里加碱性物质,让海洋吸收更多CO2
    • 带碳捕获的生物能源:边发电边把排放的碳捕起来埋掉

    企业不愿意永远贴钱

    这次新增的9.15亿美元,Frontier说要改变打法:少而精,集中投那些最有希望每年去除10亿吨(10亿公吨)以上CO2的项目。新签的合同期限也拉长了,大概8到10年。

    这里有个细节值得注意。Frontier说,以后签的任何新合同,碳去除公司必须”展示出获得政府补贴或支持的路径”。这句话翻译过来就是:企业不愿意永远贴钱养这个行业,最终这个账单大概率要落到政府头上。

    联合国IPCC(政府间气候变化专门委员会)也说过,要达到净零排放,碳去除技术是不可缺少的,但没几个公司或消费者愿意主动买单。Frontier把合同签到2040年,意思是希望到那时候政府已经接手了。

    对AI行业是个信号

    这件事对整个AI行业来说是个信号。Anthropic是第一个加入Frontier的纯AI公司,但它大概率不会是最后一个。AI训练和执行用掉的电力还在快速增长,行业不可能永远回避碳排放这个问题。

    Google和Microsoft早就加入了,现在Anthropic跟进了,接下来OpenAI、Meta这些用电大户会怎么做,值得盯着看。对Anthropic来说,这一步走得聪明。它在美国政府那边正因为模型出口管制的事跟华盛顿闹得不太愉快,这时候拿出一笔气候承诺来,能在公众形象上加点分。

    不过话说回来,9.15亿美元分摊到多年,跟Anthropic最新一轮融资后的估值比起来,只占很小一部分。这家公司能不能真的把碳排放账算清楚、做干净,光看这一笔承诺还远远不够。