作者: hiyoho

  • LightRAG – 轻量级知识图谱RAG框架,微软GraphRAG的高效替代方案

    LightRAG – 轻量级知识图谱RAG框架,微软GraphRAG的高效替代方案

    🔍

    LightRAG

    轻量级知识图谱RAG框架 – 微软GraphRAG的高效替代方案

    🏫 香港大学
    📄 EMNLP 2025
    ⭐ 2.4K+ Stars

    📋 项目简介

    LightRAG 是由香港大学数据科学实验室(HKUDS)开发的轻量级、基于知识图谱的检索增强生成(RAG)框架。作为微软GraphRAG的高效替代方案,LightRAG专为法律、医疗、金融等复杂文档分析场景设计,支持多模态文档处理。其创新的双层级检索架构同时管理知识图谱(KG)和向量嵌入,解决了传统GraphRAG大规模数据处理时的高算力开销、响应慢、增量更新成本高等瓶颈问题。

    ⚙️ 安装要求

    ⚠️ 环境要求

    • Python 3.10 及以上
    • 推荐使用 uv 包管理工具(比 pip 性能更优)
    • 前端构建依赖:bun(如需自行构建WebUI)

    快速安装(三种方式)

    方式一:从PyPI安装(推荐)

    # 安装带API服务的LightRAG
    uv tool install "lightrag-hku[api]"
    
    # 构建前端产物
    cd lightrag_webui
    bun install --frozen-lockfile
    bun run build
    cd ..
    
    # 配置环境变量后启动服务
    cp env.example .env  # 修改.env中的LLM和嵌入模型配置
    lightrag-server

    方式二:从源码安装

    git clone https://github.com/HKUDS/LightRAG.git
    cd LightRAG
    
    # 一键初始化开发环境(自动安装所有依赖+构建前端)
    make dev
    
    source .venv/bin/activate  # Windows用 .venv\Scripts\activate
    
    # 配置环境变量后启动服务
    make env-base  # 生成.env配置文件
    lightrag-server

    方式三:Docker部署

    git clone https://github.com/HKUDS/LightRAG.git
    cd LightRAG
    cp env.example .env  # 修改LLM和嵌入模型配置
    docker compose up

    ✨ 核心功能

    🔍 双层级检索架构

    同时管理知识图谱(KG)和向量嵌入,弥合传统向量RAG和图RAG的技术鸿沟。支持5种查询模式:local(局部上下文)、global(宏观主题)、hybrid(融合模式)、naive(传统向量检索)、mix(默认,最全面)

    ⚡ 增量更新能力

    支持知识库无缝增量更新,新数据通过标准图索引pipeline生成局部图后直接合并到现有图谱,无需重构全局索引。删除文档时可基于构建阶段的LLM缓存快速重建受影响的关系,更新效率极高。

    🎯 多模态文档处理

    v1.5版本起支持多模态文档分析,文档处理管道支持MinerU、Docling、Native等多解析引擎,可高效提取文档中的文本、表格、公式、图像,实现跨模态实体和关系的统一映射与索引。

    💰 成本优势

    无需生成低效的社区报告或多跳推理来处理复杂查询,大幅减少索引和查询阶段的LLM调用次数,降低响应延迟和算力成本。在农业、计算机科学、法律、混合领域四类测试集上,性能均显著优于NaiveRAG、RQ-RAG、HyDE、GraphRAG等基线方法。

    🗄️ 多存储后端支持

    支持4类存储(KV存储、向量存储、图存储、文档状态存储)的灵活配置。生产环境可选择PostgreSQL、MongoDB、OpenSearch等统一后端,也可分别搭配Milvus/Qdrant做向量存储、Neo4j/Memgraph做图存储。

    🎯 典型使用场景

    📄 场景一:垂直领域复杂文档分析

    适用场景:法律合同审查、医疗病历分析、金融研报解读等需要深度上下文理解、逻辑推理的场景。
    优势:LightRAG的图索引能力可捕捉实体间复杂语义依赖,生成质量优于传统RAG。例如在法律领域,其全面性指标达到83.6%,远超NaiveRAG的16.4%。

    🏢 场景二:大规模知识库构建

    适用场景:需要处理海量文档、且知识库需要频繁更新迭代的企业知识库、技术文档站等。
    优势:LightRAG的增量更新能力可大幅降低更新成本,支持30B参数级开源模型也可达到高精度。无需每次都重构全局索引,显著提升运维效率。

    🚀 场景三:生产级RAG系统部署

    适用场景:企业级RAG应用,对高可用、低延迟、安全性有严格要求。
    优势:可通过配置统一存储后端、本地部署嵌入/重排序模型、调整并发参数,满足企业级部署需求。支持引用溯源、文档删除、RAGAS评估集成、Langfuse链路追踪等生产特性。

    💡 推荐理由

    作为一名经常与RAG系统打交道的开发者,我必须说 LightRAG 是我近期见过的最务实的RAG框架创新。它并没有试图颠覆什么,而是精准地解决了GraphRAG在实际落地时的三大痛点:算力开销高、更新成本高、响应速度慢

    最让我印象深刻的是它的增量更新能力。在传统GraphRAG中,每次添加新文档都需要重构整个知识图谱,这在动态知识库场景下几乎是不可接受的。而LightRAG通过局部图合并策略,实现了真正的无缝增量更新,这让它在企业级应用场景中具备了极强的竞争力。

    另外,它的多模态支持也非常实用。在现代文档中,表格、公式、图片的信息同样重要,但传统RAG往往只能处理纯文本。LightRAG v1.5通过集成MinerU、Docling等解析引擎,真正实现了对复杂文档的全面理解。

    当然,它并不是完美的。相比成熟的商业化方案,LightRAG在文档量和用户友好度上还有提升空间。但考虑到它是开源且活跃维护的项目,而且已经有EMNLP 2025论文背书,我相信它会成为RAG领域的一个重要里程碑。

    适用人群:如果你正在构建需要处理复杂文档的RAG系统,或者对GraphRAG的性能和成本不满,LightRAG绝对值得一试。特别是对于法律、医疗、金融等垂直领域的应用,它的知识图谱能力会让你事半功倍。

    ─────────────────── ✨ ✨ ✨ ───────────────────

    LightRAG 为RAG系统提供了一种更高效、更经济的解决方案。无论是构建企业知识库、垂直领域问答系统,还是进行RAG相关研究,它都是一个值得深入探索的优秀工具。

    你是否也在使用RAG技术? 欢迎在评论区分享你的经验和想法!

  • 特朗普封了Anthropic模型,全球「主权AI」大幕拉开

    特朗普封了Anthropic模型,全球「主权AI」大幕拉开

    全球主权AI浪潮
    全球”主权AI”浪潮加速

    特朗普政府一道命令,Anthropic把最新、最强的两个模型Fable 5和Mythos 5全部下线了。理由是国家安全和越狱风险。这件事发生在6月14日,距离这两个模型发布才过去几天。

    Anthropic说它没得选——白宫要求切断所有外国公民的访问权限,连自己的员工也在封禁范围内。这件事传递了一个信号:美国不仅主导了前沿AI,它的政府还可以决定谁能用、谁不能用。

    英国AI与在线安全部长Kanishka Narayan说:”我们以极其严肃的态度对待对主权的一切其他威胁,但我们还没有学会以同样的方式对待这个威胁。”他没有直接点名Anthropic或特朗普,但用这次封禁事件来论证英国必须发展自己的AI能力。

    欧洲:从担心到警惕

    在欧洲,这次封禁让本就存在的”美国技术依赖”焦虑变得更加具体。法国前总理、现任总统候选人Gabriel Attal直接把这件事称为”AI战争”的开始。他把Anthropic撤回模型比作伊朗封锁霍尔木兹海峡——AI访问权现在已经成了一个战略卡点,法国必须为此做好准备。

    Attal这么说不是孤例。《世界报》报道称,法国整个政治光谱都在表达类似的警觉。欧洲议会成员也指出,Mythos和Fable的撤回就是证据,说明欧洲需要把技术主权变成现实——而且要快。

    加拿大也学到了类似的教训。总理Mark Carney说,这种情况凸显了在关键资源(比如AI)上过度依赖单一伙伴的风险。”我们目前共同面临的Mythos和Fable的局面,是过度依赖某些模型时可能发生的事情。没有人在这个局面里做错了什么。但如果我们只是接受这个现状,不吸取教训,不搞多元化,那就是我们的错了。”

    主权AI不等于从头训练大模型

    当然,大多数政府和公司根本无法匹敌美国或中国前沿实验室的规模和资源。但主权AI并不总是意味着要造出最大、最强的工具。

    法国的Mistral和加拿大的Cohere证明了,来自这些国家之外的扎实努力是可能的——即使它们的模型还不能在基准测试上正面对抗。新加坡和阿联酋则专注于更窄但仍然具有战略优先性的方向,比如基础设施,或者更好地支持本地语言的模型。

    还有开源模型这条路。有一天,具有Mythos级别能力的开源模型可能会出现,到那时候,任何单一党派都很难控制访问权。


    特朗普可能把限制Mythos和Fable视为国家安全问题。但这个论点反过来也成立——华盛顿现在在问AI是否对所有人来说都太重要了,不能让所有人都有访问权;而其他国家的政府则在问,他们是否能承受让华盛顿来决定谁有访问权的代价。

    Anthropic可能很快会把Mythos和Fable重新上线。但要让全球对美国AI的信任恢复原状,那就是另一回事了。不管这次封禁持续多久,它都照亮了一个事实:对美国前沿AI模型的访问是多么脆弱。很多政府和公司不喜欢他们看到的情况——而且已经被激发起来,确保这种情况不再发生。

  • Meta给Facebook加了「AI搜索」,答案来自你身边的帖子

    Meta给Facebook加了「AI搜索」,答案来自你身边的帖子

    Meta AI Mode on Facebook
    Meta在Facebook上推出AI搜索新模式

    Meta在AI竞赛里一直像个追赶者,这次它想用Facebook打个翻身仗。6月15日,Meta宣布在Facebook上推出一系列新的AI功能,其中最引人注目的是”AI模式”——一种全新的搜索方式,用Meta AI从平台上的公开帖子里直接给你答案。

    搜索不再翻结果,AI直接给你答案

    说白了,就是你不再需要翻搜索结果了。你用大白话问一个问题,AI帮你把Facebook上所有人讨论这个话题的公开内容汇总成一个答案。它不光搜你的动态,还拉取小组(Groups)和短视频(Reels)里的公开信息。

    这个思路其实上个月就已经露过苗头。Meta悄咪咪上线了一个叫Forum的App,长得像Reddit,里面有个AI”Ask”标签页,让用户提问,然后AI从Facebook小组的讨论里提取答案。现在,这个功能被直接搬到了Facebook主平台。

    Google的AI搜索模式推出后,Reddit上就有用户吐槽说体验还不如普通搜索。Meta的版本面临同样的问题:答案来自普通用户的帖子,可靠性谁来保证?

    不止搜索,还有一堆AI玩法

    除了AI搜索,Facebook这次还加了一堆其他的AI玩法。视频编辑工具升级了,用户可以对视频蒙太奇做拼贴剪裁和转场效果。AI照片预设功能也上线了,你可以换衣服、换发型、加配饰。

    比如体育迷可以虚拟穿上喜欢的球队球衣——只要点一下Stories里的”AI编辑”图标,选”穿上它”就行。或者直接去个人资料图片,选”用AI重新设计头像”和”衣橱”。

    这些功能叠加在一起,看着眼熟吗?对,这就是Snapchat和TikTok玩了好几年的那套。Meta现在把它们搬到Facebook上,时机已经晚了很久。

    Meta的算盘:黏住用户,多赚钱

    把这一切串起来看,Meta的意图其实很清楚:让Facebook的AI工具把用户黏住,让平台更有用,同时开辟更多赚钱的门路。

    配合这些功能推送,Meta最近还推出了Facebook、Instagram和WhatsApp的全局订阅计划,起步价3.99美元/月,解锁额外功能,据说更多AI相关的订阅档位正在路上。

    从2月的动画头像(让你的静态照片”活”过来,加个挥手或者戴个派对帽子),到3月在Marketplace上加的AI自动回复买家消息,再到6月初给创作者推出的AI助手(基于创作者的内容和表现历史给个性化建议),Meta在过去几个月里密集往Facebook里塞AI功能。这次算是把底牌一次性亮出来了。


    AI搜索这件事,Google做了,Perplexity做了,现在Meta也来了。区别是,Meta的答案是从你身边的人那里来的。这让搜索变得更”社交”,但也可能变得更不靠谱。用户买不买账,接下来的数据会说话。

  • 76名网络安全专家联名抗议:美国政府封禁Anthropic最强模型,是在削弱防御

    76名网络安全专家联名抗议:美国政府封禁Anthropic最强模型,是在削弱防御

    上周,美国政府对Anthropic的Fable和Mythos模型下达了出口管制令,理由是国家安全。Anthropic随即暂停了全球用户对这两款模型的访问。

    事情到这里,看起来又是一个AI监管收紧的故事。但接下来的发展有点出人意料——76名网络安全专家联名写了一封公开信,要求政府撤销这道命令。

    网络安全AI概念图
    网络安全专家联名抗议Anthropic模型出口管制令

    联署名单相当豪华

    这份公开信的签署者里有不少业内重量级人物:前Facebook首席安全官Alex Stamos、漏洞赏金平台Bugcrowd创始人Casey Ellis、著名密码学家兼前苹果安全设计经理Jon Callas、计算机科学家Paul Vixie、前Block应用安全工程负责人Dino Dai Zovi、Luta Security创始人Katie Moussouris,以及安全意识培训公司SocialProof Security的CEO Rachel Tobac。

    他们在信里说得很直接:把最好的模型从网络安全防御者手里拿走,而没有充分的理由,这是”危险的”。

    “当我们的对手在快速进步的时候,把最好的能力从防御者那里拿走,是没有充分理由的危险行为。”

    禁令到底是怎么来的

    Anthropic今年4月推出Mythos预览版时,声称这个模型找安全漏洞的能力太强,所以需要严格限制访问,防止恶意黑客或外国对手拿来在互联网上搞破坏。实际操作里,Anthropic只给了大约50家公司初始访问权限,最近才扩展到15个国家的约150个组织。

    6月9日,Anthropic发布了Fable,这是Mythos的公开版本,但加了严格的护栏,阻止它在生物、化学和网络安全领域的使用,同时也防止别人通过”蒸馏”来复制这个模型。

    问题是,Fable的护栏严格到了许多网络安全专家发现它基本拦掉了任何与网络安全相关的提示词。

    亚马逊的论文:是真越狱还是误报

    据信,白宫的出口管制令可能源于一份亚马逊研究人员的论文,论文展示了一个可以绕过Fable护栏、解锁其Mythos级别能力的方法。

    但联署人之一Katie Moussouris在审阅了这份尚未公开的论文后,给出了完全不同的判断:这根本不是真正的越狱。

    她写道,研究人员只是让Fable去修复含有”故意植入的漏洞”的开源代码——而这正是模型最初拒绝”审查代码安全问题”之后发生的事情。

    “论文里描述的行为没办法被真正修复,任何尝试都只会削弱模型用于防御的能力。”Moussouris写道,”防御者需要能够要求AI修复文件里的bug、解释修复为什么重要、以及编写确认补丁有效的测试。这不是护栏绕过,这是AI模型能为防御性安全做的最有价值的事情:执行防御者每天都在跑的’发现、修复、测试’循环。”

    专家们真正担心的是什么

    公开信里还指出,亚马逊论文里描述的方法,在OpenAI的GPT-5.5上、在Anthropic自己公开可用的Claude Opus 4.8和Sonnet上、”甚至在中国的Kimi 2.7这样的模型上”都能复现。

    也就是说,封掉Fable和Mythos,并没有真正消除这个所谓的”漏洞”——它只是让美国自己的防御者用不上好工具,而对手那边照样能用上类似的能力。

    专家们的要求很明确:他们想要的是由”民主的规则制定程序”产生、基于产业和学术专家科学研究、透明且公平执行的监管,并且”只以最低必要程度使用,以确保美国公众的安全”。

  • 这颗卫星自己学会了找东西,太空AI时代真的来了

    这颗卫星自己学会了找东西,太空AI时代真的来了

    你拍一张照片,先传回地面,等分析师打开电脑看,再决定要不要拍下一张——这是过去几十年卫星工作的样子。数据量巨大,延迟高得离谱,大部分原始影像其实根本没人看。

    今年4月,一颗叫YAM-9的地球观测卫星把这事儿给改了。它在轨道上自己找到了要找的东西,完全没靠地面分析师。这是第一次有地球观测卫星在轨自主完成目标识别。

    卫星AI概念图
    YAM-9卫星搭载Nvidia Jetson Orin AGX GPU运行AI模型 | 图片来源:Loft/NASA JPL

    谷歌DeepMind的模型,跑在了太空中

    YAM-9由太空基础设施公司Loft Orbital制造,上面跑的软件来自NASA喷气推进实验室(JPL)。这个软件包名叫NAVI-Orbital,它把谷歌DeepMind的Gemma 3视觉语言模型搬到了轨道上。

    Gemma 3是专门为边缘设备设计的,能在远离数据中心的限制性硬件上运行。视觉语言模型(VLM)把大语言模型的语境理解能力和图像分析能力结合在一起——研究人员让它去分类”自然环境和人类开发交汇处”的传感器数据,或者识别铁路枢纽周边的基础设施,它都能搞定。

    “这为太空中’永远在线’的巡逻层打开了大门。”Loft的AI负责人Paul Lasserre说,”如果你有VLM,你就可以设定逻辑——比如’帮我监控这段边境,发现可疑情况就通知我’,然后跟卫星来回交互。”

    为什么这事很重要

    短期来看,轨上AI可以让太空传感器有用得多——它先在轨道上做初步数据分拣,减少分析师目前要硬着头皮处理的大量原始数据。

    长期来说,这是在为太空中更大规模的AI基础设施打样。YAM-9上装的是Nvidia Jetson Orin AGX GPU,也是目前太空计算的主流芯片之一。

    Loft的目标是用50到100颗YAM-9这样的卫星组队,实现对地球任意位置的实时覆盖。(Loft目前有12颗卫星在轨。)

    别人也在做

    Planet Labs也在发射搭载Jetson Orin处理器的卫星,目前用来做更简单的物体检测,但发言人表示正在研究包括VLM在内的其他AI应用。

    Kepler Communications运营着太空中最大规模的GPU集群,虽然因为NDA没法透露有没有部署VLM,但提到自今年1月那些卫星发射以来,已经出现了”几个未公开的使用案例”。


    未来:给宇航员的AI助手

    NAVI-Space的想法最初来自JPL研究员Taran Cyriac John,他在想给探索月球或火星的宇航员做数字助手。

    “我们在想,宇航员穿着增压服,肯定没法敲键盘,他们要做的任何事都很复杂。”JPL技术负责人Juan Delfa Victoria说,”所以,我们为什么不提供一个助手呢?就像在电子游戏和电影里看到的那种,可以交互的AI?”

    只不过,千万别叫它HAL 9000。

  • Open-WebUI:自托管AI平台,打造专属的ChatGPT体验

    在本地运行大语言模型(LLM)已经成为越来越多开发者和AI爱好者的选择。但Ollama等工具缺乏友好的Web界面,而Open-WebUI完美解决了这个问题——它提供了一个功能丰富、可自托管的AI交互平台,让你在本地也能享受媲美ChatGPT的使用体验。

    项目简介

    Open-WebUI 是一个可扩展、功能丰富、用户友好的自托管AI平台,支持完全离线运行。它兼容Ollama、OpenAI兼容API等多种LLM运行器,并内置RAG(检索增强生成)推理引擎。目前GitHub Stars已超过105,000+,是本地AI部署的首选界面方案。

    安装要求和过程

    环境要求

    • Python方式:需要 Python 3.11(避免使用其他版本以免兼容性问题)
    • Docker方式:需要安装Docker,建议使用GPU环境以获得更好性能
    • Ollama:如需本地运行模型,需提前安装Ollama
    • 存储空间:至少预留5GB空间用于模型和数据集

    快速安装步骤

    方式一:Python pip安装(最简单)

    # 安装项目
    pip install open-webui
    
    # 启动服务,访问地址:http://localhost:8080
    open-webui serve
    

    方式二:Docker快速部署(推荐)

    # 基础部署(Ollama在本地)
    docker run -d -p 3000:8080   --add-host=host.docker.internal:host-gateway   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:main
    
    # 访问地址:http://localhost:3000
    

    方式三:一体化部署(包含Ollama)

    # 带GPU支持
    docker run -d -p 3000:8080 --gpus=all   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    
    # 仅CPU
    docker run -d -p 3000:8080   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    

    核心功能

    • 多模型兼容:无缝集成Ollama、OpenAI API,支持对接LMStudio、GroqCloud、Mistral、OpenRouter等第三方服务,一个界面管理所有AI模型。
    • 本地RAG能力:内置检索增强生成引擎,支持9种向量数据库(ChromaDB、PGVector、Qdrant、Milvus等),可直接上传文档进行智能问答。
    • 多模态交互:支持语音/视频通话,集成多种语音转文本和文本转语音引擎;支持DALL-E、Gemini、ComfyUI等多种图像生成引擎。
    • 权限管理:细粒度用户角色与权限控制,支持LDAP/AD集成、SSO单点登录,适合团队和企业部署。
    • 插件扩展:支持Pipelines插件框架,可自定义业务逻辑(函数调用、用户限流、实时翻译、内容过滤等)。

    典型使用场景

    场景一:个人本地AI助手

    通过Docker一键部署Open-WebUI + Ollama,在本地运行Llama 3、Mistral等开源模型。所有数据完全离线,保障隐私安全;同时获得与ChatGPT媲美的Web交互体验,支持多轮对话、Markdown渲染、代码高亮等功能。

    场景二:团队协作AI平台

    利用Open-WebUI的权限管理和SSO集成能力,为企业团队搭建内部AI平台。通过RBAC控制不同用户的模型访问权限,对接企业内部知识库实现RAG问答,并监控API使用量和成本。

    场景三:AI应用开发测试

    开发者可使用Open-WebUI快速测试不同LLM模型的效果,通过模型构建器自定义提示词和角色,利用Python函数调用扩展自定义能力,加速AI应用的原型开发和测试验证。

    推荐理由

    Open-WebUI是我试用过的最优秀的本地LLM Web界面,没有之一。它的设计非常贴合实际使用场景:响应式界面适配各种设备,PWA支持让你可以像原生App一样使用,RAG功能让你可以轻松对接个人知识库。

    相比其他类似工具,Open-WebUI的最大优势在于完整性和成熟度:它不仅有精美的界面,还有完整的企业级功能(权限管理、SSO、监控等),同时支持广泛的模型和后端的灵活配置。无论你是个人用户还是企业团队,都能找到适合自己的部署方式。

    特别推荐它的RAG集成能力——上传文档后可以直接在对话中引用,支持多种向量数据库和搜索引擎,真正实现”个人AI知识库”的落地。如果你一直在寻找一个好用的本地LLM界面,Open-WebUI绝对值得一试。

    下载地址

    如果你觉得这个项目有帮助,欢迎到GitHub上点个Star支持开发者!

  • 印度AI独角兽Sarvam获2.34亿美元融资,HCLTech领投1.5亿

    2.34亿美元,估值15亿美元。印度班加罗尔的AI实验室Sarvam周一宣布完成新一轮融资,正式跻身独角兽行列。领投方不是哪家硅谷VC,而是印度本土IT巨头HCLTech——它一个人砸了1.5亿美元。

    印度AI独角兽Sarvam融资
    Sarvam成为印度最新AI独角兽,HCLTech领投1.5亿美元

    全栈AI,这是印度人的打法

    Sarvam的野心不小。它不像有些AI公司只做模型,或者只做应用,而是试图把整条栈都搭起来:从底层的AI模型,到中间的推理基础设施,再到面向企业的应用产品。这种”全栈”思路在印度市场尤其有意义——这里的企业客户喜欢”一站式解决方案”,不想分别找多家供应商拼起来。

    更关键的是语言。Sarvam的模型专门为印度语言设计——印地语、泰米尔语、孟加拉语、 Telugu等等。印度有22种官方语言,真正能把多语言场景跑通的AI公司并不多。Sarvam的两位创始人Vivek Raghavan和Pratyush Kumar之前在IIT马德拉斯的AI4Bharat项目干活,那个项目就是专门研究印度语言的AI,背后有印度”数字化之父”Nandan Nilekani的支持。

    HCLTech为什么舍得砸1.5亿

    HCLTech是印度IT服务业的巨头之一,和TCS、Infosys一个级别。它投Sarvam不是财务投资,是战略卡位。IT服务公司的下一个战场是AI——谁能把AI能力打包进企业服务合同里,谁就能吃掉竞争对手的份额。

    双方的计划很明确:把Sarvam的AI模型和HCLTech的企业客户关系、工程团队、软件资产拼在一起,给企业政府和政府客户做AI产品。HCLTech每年服务几百家全球500强企业,这个渠道价值不是钱能直接买的。

    Anthropic禁令戳中了印度的痛处

    就在上周,美国政府命令Anthropic切断外国公民对Fable 5和Mythos 5的访问权限。印度科技圈一下子慌了——OpenAI和Anthropic都把印度称为”第二大市场”,结果人家的模型说断就断。

    这件事让”AI主权”从一个抽象概念变成了眼前的问题。Sarvam的价值,很大程度上就是它是”印度的”——不管美国政府发什么令,Sarvam的模型印度自己能控制。这种安全感,是OpenAI和Anthropic给不了的。

    数据说话:Sarvam已经在跑

    光有愿景不够,Sarvam的以下几组数据值得一看:

    • 对话AI平台每天处理超过200万次交互
    • 推理平台每天处理约1000万次API调用
    • 语音模型每月转录超过50万小时音频
    • 文档AI系统正在数字化超过3500万页档案

    应用场景也在铺开。Sarvam的多语言语音代理已经为印度农业部收集了1700万农民的数据。一家大型保险公司用它的语音活动支持了4500万保单持有人的续保。还有一家大型金融科技公司,用Sarvam的AI代理平台支撑着一支35万人的销售队伍。


    印度AI的窗口期

    Sarvam不是印度唯一做AI模型的公司,但它可能是目前资金最充裕、落地最扎实的一家。挑战也一样明显:算力成本高、资本获取难,跟美国和中国那些融资动辄几十亿的对手比,Sarvam的资源还是紧的。

    但印度市场的规模是真实的。OpenAI和Anthropic都把印度当第二大市场,这说明需求在那里。Sarvam如果能把自己的模型能力、HCLTech的渠道、以及印度政府对”数字主权”的诉求这三件事拼起来,它不一定需要追上GPT-5,只要在印度市场足够好用,就是一门大生意。

  • Salesforce砸36亿美元买下Fin,AI客服大战打响了

    36亿美元,这不是一笔小收购。Salesforce周一宣布将AI客服平台Fin收入囊中,创下近年来企业服务软件领域最大的AI并购记录。Fin的前身是Intercom——那个你可能在无数网站右下角见过的在线聊天插件。但今天的Fin已经不是当年的Intercom了。

    Salesforce收购Fin AI客服平台
    Salesforce以36亿美元收购AI客服平台Fin,加码Agentforce战略

    从聊天插件到AI代理,Fin走了十年

    Fin的创始人Eoghan McCabe是个有意思的人。他曾经离开自己创立的Intercom,又在2020年杀回来重掌CEO大位。这次收购完成后,他发了一条X(Twitter)帖子,语气很稳——”我还会继续当CEO,Des继续管研发,事实上没什么会改变”。

    但实质上改变已经发生了。Fin最核心的产品是一个AI代理,能同时处理实时聊天、WhatsApp、短信、电话、Slack等多个渠道的客户询问。它不只是回答问题,而是真正”解决”问题——查订单、办退款、改地址,这些以前需要人类客服出面的事,Fin的AI代理现在可以自己搞定。

    Salesforce为什么现在出手

    答案藏在Agentforce里。这是Salesforce去年推出的企业AI代理平台,让企业可以搭建自己的自定义AI代理来自动执行任务。但Agentforce更多是”平台”定位——你得懂怎么用它。Fin的价值在于,它已经把”平台能力”包装成了”开箱即用的客服解决方案”。

    Salesforce CEO Marc Benioff在声明里说:”Fin带来了经过验证的代理技术,对客户成功的深度承诺,以及一个不可思议的AI团队,他们将用强大的服务代理能力来补充Agentforce。”

    说白了,Salesforce买Fin不是为了技术——Fin的技术他们自己也能做。真正买的是Fin已经跑通的客户场景、已经建立的品牌认知,以及那批真正懂AI客服的工程师和产品人。

    36亿值不值

    这个数字让很多人倒吸一口凉气。但换个角度看,企业AI客服市场的盘子正在以每年30%以上的速度扩张。Fin的竞争对手包括Zendesk的AI助手、Ada、甚至Salesforce自己平台上的第三方插件。收购Fin等于直接消灭了一个有威胁的竞争对手,同时把它的客户群一把捞过来。

    交易预计在Salesforce 2027财年第四季度完成——按他们的财报周期算,其实就是2027年初。时间还早,但消息一出,业界已经在猜测:是不是更多AI客服初创公司要被盯上了?


    Fin最近还憋了两个大招

    McCabe在收购声明之外的X帖子裡透露,Fin recently shipped了两个重要产品:一个叫Apex的新模型,还有一个叫Operator的”内部代理”——这个词值得玩味,”internal agent”可能意味着Fin的AI不只是对外服务客户,还可以帮企业内部员工处理工作流程。

    有了Salesforce的资源,这些产品的迭代速度只会更快。对小客户来说可能是好事——大平台的补贴能让先进的AI客服能力降价普及。但对Zendesk、Ada这些独立玩家来说,压力是实实在在的。

  • 把手机举到耳边就能实时翻译:Google把70种语言塞进了你的电话

    把手机举到耳边就能实时翻译:Google把70种语言塞进了你的电话

    Google Translate刚上线的时候,你把一句话敲进去,等两秒,它给你吐出来一段有时候对有时候不对的文字翻译。二十年过去,Google的翻译引擎已经每个月为几十亿用户处理超过一万亿个单词。现在他们想把「实时语音翻译」也做成每个人随手就能用的东西。

    不等你说完就开始翻

    Gemini 3.5 Live Translate是Google最新的语音翻译模型,支持70多种语言。最关键的部分是:它不像老一代翻译App那样等你把一句话说完才开工。它是连续生成的,边听边翻,延迟只有几秒钟,语气和节奏都尽量贴合说话的人。

    Google Gemini 3.5 Live Translate实时翻译概念图
    把手机举到耳边,就像接电话一样听翻译 (图片:AI生成)

    最有趣的功能是Android上的「聆听模式」:你把手机举到耳边,就像接电话一样,翻译好的语音就从听筒里直接出来。不用戴耳机,也不用举着手机让别人看到屏幕。Google说这个功能在你想快速听翻译、又不想让别人听见的时候特别有用——比如在国外旅游听到导游讲解,或者在异国他乡的商店里和店主砍价。

    「只需把手机举到耳边,就像一通普通电话,翻译好的语音就直接流进你的耳朵。」

    从5种语言到70种

    Google Meet也在用这个模型。以前Meet的翻译功能只支持5种语言,而且只能译成英文或者从英文译出。现在换成3.5 Live Translate之后,一口气的70多种语言、2000多种语言组合都能在会议里实时互译。这个功能这个月开始向部分企业Google Workspace客户开放私测。

    Grab也在测试这个模型。他们平台上每个月有超过1000万通语音通话,主要是司机和乘客之间的。两边经常说不同的语言,实时翻译能直接帮上忙。

    所有生成的语音都打了SynthID水印——这是Google开发的一种几乎听不出来的音频水印,用来标记这段内容是AI生成的,防止被人拿来造谣。

    在哪里能用?

    • Google Translate App(Android和iOS)——已全球推送
    • Gemini Live API —— 开发者公测版
    • Google Meet —— 部分企业客户私测中
    • Android「聆听模式」—— 正在逐步推送

    这篇文章其实没什么深奥的道理可讲。就是Google把一样东西做得更好、更顺手了。你要真想知道它翻译得准不准,最好的办法是找个说外语的朋友,面对面试试。


  • AI Agent正在变成员工,这家公司拿了6600万美元帮企业管「数字员工」

    AI Agent正在变成员工,这家公司拿了6600万美元帮企业管「数字员工」

    Goldman Sachs去年把AI编程代理Devin当作新员工来测试,McKinsey今年早些时候说他们已经有25000个AI代理和60000名人类员工一起工作。当AI代理真的变成「员工」,一个没人认真想过的问题就摆在了桌面上:你怎么给一个软件发工牌、管权限、还能在它出错的时候把它「开除」?

    从stealth模式走出来的NewCore

    纽约网络安全创业者Zohar Alon认为,现有的企业身份系统撑不住这个未来。他创办的NewCore今天从stealth模式走出来,拿了6600万美元种子轮融资,估值3亿美元。领投的是专注网络安全的风投Cyberstarts,Index Ventures和Evolution Equity Partners跟投。

    AI Agent身份管理概念图
    AI代理身份管理正成为企业安全新前线 (图片:AI生成)

    Alon不是第一次创业。他之前创办了云安全公司Dome9,后来卖给了Check Point。他说,AI代理的规模和复杂度会把那些用了15到20年的老身份平台「撑爆」。

    「我们很确定,AI代理给那些15年、20年历史的身份平台所增加的规模和复杂度,会把它们搞崩。」Alon对TechCrunch说。

    AI代理也该有「工牌」

    NewCore的平台把人类员工和AI代理放在同一个系统里管理。他们的核心论点是:AI代理应该被当作「一等公民」来对待——有自己的权限、生命周期控制和撤销机制,而不是混在传统的服务账户或机器凭证里蒙混过关。

    他们的「分键」架构把关键身份凭证分成两份,分别存在客户和平台那里。这样做的目的是消灭单一泄露点——就算平台被攻破,攻击者拿到的也只是不完整的一半密钥。

    NewCore还给Claude Code、OpenAI Codex、Cursor这些编程助手提供了「Agentic Skill」集成包,让AI工具以受管理的身份访问企业系统,而不是靠人工分发的凭证来凑合。

    更实用的部分是一个移动App:人类员工可以用它来审批、查看和撤销AI代理的权限。Alon把它叫做「人类监督层」。当公司有几十个甚至几百个AI代理在自主运行的时候,总得有人能随时拔插头。

    AI代理数量会超过人类员工?

    NewCore目前在美国和以色列有50多名员工,平台有不到10个付费客户和10多个设计伙伴。今年夏天开始收费。

    TCS董事长最近说,AI代理的数量最终可能赶上这家印度IT服务公司的人类员工总数。Alon预测,在科技公司里,AI代理在几年内就会超过人类员工的数量。

    「这是不可避免的。问题是我们要不要在来得及的时候把护栏建好。」——Zohar Alon

    Okta和微软的Entra这些老牌身份提供商也在往自己的平台里加AI代理功能。但Alon认为那些都是在为人类员工设计的平台上打补丁,而NewCore是从零开始为「人类+机器+AI代理」混合 workforce 建的。


    • NewCore种子轮6600万美元,估值3亿
    • 平台统一管理人类员工和AI代理身份
    • 「分键」架构防止单一泄露点
    • 移动App让人类监督AI代理权限
    • 今年夏天开始向客户收费