标签: AI

  • 把同事「蒸馏」成AI技能:中国科技工作者的焦虑与反抗

    把同事「蒸馏」成AI技能:中国科技工作者的焦虑与反抗

    一个恶搞项目,戳中了中国程序员的集体焦虑

    上个月,一个叫”Colleague Skill”的GitHub项目在中国的社交媒体上疯传。项目的宣传很离谱——声称可以把同事的技能和性格特质”蒸馏”出来,然后用AI代理复现。虽然创始人后来承认这只是一个恶搞,但它在网上引发的讨论却一点都不好笑。

    项目的操作逻辑很简单:输入同事名字,加点基本信息,它就会自动从飞书、钉钉这些办公软件里导入那个人的聊天记录和文件,然后生成一份”可复用手册”,详细描述这位同事的职责——甚至包括他的一些小怪癖——好让AI代理能够模仿。

    AI同事技能概念图
    一个能把同事”蒸馏”成AI技能的项目,戳中了中国科技工作者的焦虑

    “它甚至捕捉到了那个人用小箭头的习惯”

    上海的一位科技工作者Amber Li(27岁)在社交媒体上看到这个项目后,拿它做了个实验——她用这个项目”重建”了一位前同事。几分钟内,工具就生成了一份文件,详细描述了那个人怎么工作。Li说:”效果出奇地好,它甚至捕捉到了那个人的小怪癖,比如他怎么反应、用什么标点习惯。”

    有了这个”技能”,Li就可以把一个AI代理当作新的”同事”来用——帮她调试代码,而且秒回信息。但她说,这种感觉既诡异又不舒服。

    “它甚至捕捉到了那个人的小怪癖,比如他怎么反应、用什么标点习惯。有了这个技能,我可以把一个AI代理当作新的’同事’来用。但感觉既诡异又不舒服。”

    老板们在推什么?

    自从OpenClaw在国内火了之后,中国的老板们就在推员工去试验AI代理。虽然AI代理能帮你读新闻、回邮件、订餐厅,但一线科技工作者说,这些工具在商业场景里的实用性目前为止还很有限。

    Emory大学助理教授Hancheng Cao(研究AI与工作)认为,公司让员工制作这种”工作蓝图”有充分的理由——除了跟风。他说:”公司不仅能获得工具的内部使用经验,还能更丰富地掌握员工的知识、工作流和决策模式这些数据。这帮公司看清工作的哪些部分可以标准化或编码成系统,哪些仍然依赖人的判断。”

    但对员工来说,制作代理甚至为它们制作蓝图,可能感觉奇怪而又疏离。一位软件工程师(因担心工作安全而匿名)用自己的工作流训练了一个AI(不是Colleague Skill),发现这个过程感觉很简化——就好像把他的工作压平成了模块,让他更容易被替代。

    反抗开始了

    这种”把人简化成技能”的推动也激发了聪明的对策。北京的一位AI产品经理Koki Xu(26岁)被这个想法激怒了,她在4月4日发布了一个”反蒸馏”技能。这个工具她大约花了一小时构建,设计目的是破坏为代理创建工作流的过程。

    用户可以根据老板观察的密切程度,选择轻度、中度或重度破坏模式,然后代理会把材料重写成通用的、不可操作的语句,产生一个没那么有用的AI替代品。Xu发布的项目视频在网上疯传,跨平台获得了500多万个赞。

    Xu告诉MIT Technology Review,她从一开始就关注Colleague Skill的趋势,这让她思考异化、失权以及更广泛的劳工问题。她说:”我本来想写一篇评论文章,但觉得做一个能pushback的东西更有用。”


    上海的那位科技工作者Li说,她公司目前还没找到用AI工具替代真实员工的方法,主要是因为它们仍然不可靠,需要不断监督。她说:”我不觉得我的工作马上就有危险,但我确实觉得我的价值在被廉价化,而且我不知道该怎么办。”

  • 从养老院机器人到”AI和尚”,韩国人为何对AI如此狂热?

    从养老院机器人到”AI和尚”,韩国人为何对AI如此狂热?

    韩国AI热潮
    首尔街头的AI机器人与数字化生活(配图由AI生成)

    从养老院机器人到”AI和尚”,韩国人为何对AI如此狂热?

    上个月,MIT Technology Review的一位记者从旧金山飞了12小时抵达首尔。入关时走的是无人边检通道,机器扫了一下脸和护照,完事。坐地铁进城,即便在地下,5G信号也是满格,车厢里每个人都在低头看手机。出了江南区的地铁站,一个卡通大眼睛的轮式机器人在路口耐心等红灯,它要去给某户人家送晚饭。

    这场景对韩国人来说,没什么好大惊小怪的。


    全世界最拥抱AI的国家

    皮尤研究中心去年在25个国家做了调查,问大家对AI的感受。结果出来,韩国是唯一一个对AI感到兴奋多过担忧的国家——只有16%的韩国人说自己”更担心而非更兴奋”,美国人这个比例是50%。

    韩国人每天都在用AI。政府部门的调查显示,大多数韩国人要么把AI当私人助手,要么在工作中靠它完成任务。这个国家有一种深入骨髓的信念:技术能让国家现代化,能在全球秩序中站稳脚跟。从钢铁、造船到半导体、智能手机,韩国每一次经济飞跃都是靠技术实现的。AI,不过是这段故事的下一章。

    韩国科学技术政策教授Chihyung Jeon说:”韩国政府把AI驱动的第四次工业革命定为国家前进方向,一直在 aggressively 推广和投资。韩国人持续不断地被政府告知,AI有潜力创造一个更美好的未来。”

    从教科书到寺庙,AI无处不在

    韩国人对新技术的街头测试热情,全球少见。AI网络漫画、虚拟K-pop偶像、人形机器人”和尚”——去年5月,韩国佛教曹溪宗寺庙里,一个叫Gabi的人形机器人正式出家,成为全球头条。

    政府部门的动作更快。2025年,韩国政府不顾争议,强行在全国学校推广AI教科书(后来被发现错误百出,不得不暂缓)。福利中心里,AI养老机器人已经上岗,陪老人聊天、监测健康数据。

    首尔江南区今年6月宣布,要把公交站升级成”AI公交站”——加一个信息亭,能用多种语言回答等车人的问题。这个消息在韩国人看来,稀松平常。

    国家意志:把AI当经济引擎

    这股全民AI热,很大程度上是国家级推动的结果。2024年,韩国国会通过了《AI基本法》,是全球最早的一部综合性AI法律,重点是促进AI发展,监管是轻触式的。

    总统李在明上任后承诺,要把韩国带进”全球AI三强”的行列,跟美国和中国并列。他成立了总统国家AI战略委员会,政府出钱帮企业买算力,还搞了一个”主权AI基础模型”项目,专门资助韩国公司开发本土AI模型。

    三星和SK海力士两家 semiconductor 巨头,目前供应全球大部分高带宽内存芯片——也就是英伟达那些训练AI模型用的硬件的核心组件。2026年,两家公司的股价双双突破1万亿美元,把韩国综合股价指数(KOSPI)推到了历史新高。


    盲点:谁在乎工作被取代?

    当然,这种一边倒的AI乐观主义,也有它的盲点。最突出的问题是:没人认真反思AI对社会、政治和伦理层面的广泛影响。

    今年1月,现代汽车宣布要在工厂里部署Atlas人形机器人,现代汽车集团工会立马强烈抗议。”没有劳资协议,一个用新技术的机器人都别想进车间。”工会放话道。

    64%的韩国人担心AI会抢走自己的工作,或者加剧不平等——尽管同时有52%的人认为AI能提高生产力。这种矛盾心态,在年轻人身上尤其明显。

    “算命、炒股、写方案,ChatGPT全包了”

    文章作者讲了一个自己的亲身经历。在一个周五晚上,她和堂兄弟姐妹们去首尔中央市场旁边的大排档吃宵夜,喝着烧酒兑啤酒。其中一个29岁的堂妹——在首尔做保险代理人,正祈祷能找到新工作和男朋友——说她最喜欢用ChatGPT算”saju”(韩国传统算命术)。她把出生日期输进去,让AI给她算命。

    韩国Gallup的调查显示,46%的20多岁的韩国人用聊天机器人算过命。这些年轻人沉迷屏幕,夹在失业和烂工作之间,买不起房也结不起婚——ChatGPT,在他们眼里,是通往更好未来的传送门。

    这位堂妹还说,她用ChatGPT问炒股建议,梦想靠投资账户发一笔。她把工资不停地往投资账户里塞。尽管她那么喜欢这个聊天机器人——把它当萨满和财务顾问——她还是担心自己的工作被AI抢走。但她还是在工作中疯狂用ChatGPT,因为所有同事都在用,怕落后。

    “我有时候害怕AI,但现在嘛,它实在太有用了。”她说。

  • 白宫急着在中期选举前搞定AI监管,手段是把儿童安全法案当”嫁妆”

    白宫急着在中期选举前搞定AI监管,手段是把儿童安全法案当”嫁妆”

    AI监管游说
    白宫与科技巨头的AI监管博弈(配图由AI生成)

    白宫急着在中期选举前搞定AI监管,手段是把儿童安全法案当”嫁妆”

    硅谷的游说团队最近很焦虑。他们追了好几个月的东西叫”联邦 preemptive 法案”——说白了就是一部全国统一的AI法,一旦通过,各州自己搞的那些AI监管条例全部作废。对科技公司来说,这简直是梦寐以求的终极武器。

    但现实很骨感。几个月下来,游说团队碰了一鼻子灰,全国范围内的政治反弹越来越强。更麻烦的是,中期选举就在眼前,一旦国会翻盘,民主党可没兴趣跟他们合作。留给科技巨头的时间,真的不多了。


    儿童安全成了”特洛伊木马”

    本周有消息泄露出来:白宫告诉儿童安全倡导组织和科技巨头们,它打算把参议员Marsha Blackburn(共和党,田纳西州)牵头的《儿童在线安全法案》(KOSA)打包进AI preemptive 一揽子法案里。KOSA这个东西已经折腾好几年了——它要求科技公司对孩子用户负起”注意义务”,AI公司也跑不掉。

    白宫打的算盘是:把儿童安全这个政治正确的议题,跟科技公司最想要的AI统一监管捆绑在一起,这样国会通过的概率就大多了。问题是,这一招搞得所有人都一头雾水。

    据《华盛顿邮报》报道,白宫本周会见了儿童安全团体和科技公司代表,表示将支持以KOSA为核心的一揽子AI立法方案。但消息传出后,众议院共和党人发现自己被蒙在鼓里——他们刚通过自己版本的KOSA。

    更尴尬的是,那些跟Blackburn一起推KOSA的民主党人,也是事后才知道这事儿。参议院版的KOSA在2024年曾经以91比3的压倒性优势通过,但那是”standalone”版本。现在突然要跟AI preemptive 绑在一起,民主党人不干了。

    “四C”条件:保守派的关键先生

    这出戏的关键人物叫Mike Davis。此人是特朗普的盟友,也是”第三条款项目”(Article III Project)的创始人。去年,就是他成功搞掉了参议院里另一个AI监管提案。现在,他在白宫的政策圈子里很有影响力。

    Davis提了一个条件,叫”四C”——儿童(Children)、保守派(Conservatives)、创作者(Creators)、社区(Communities)。他的意思是:任何AI preemptive 法案,必须同时照顾到这四方面的利益,否则免谈。白宫今年3月发布的AI立法框架草案里,已经部分采纳了这些价值,把KOSA塞进去就是为了满足”儿童”这一条。

    但Davis不满足。他直接放话给The Verge:”如果没法同时满足四C,这个法案连万分之一的通过机会都没有。我保证。”


    参众两院的KOSA之争

    就算科技公司愿意接受KOSA,参众两院之间还有一道大鸿沟。参议院版的KOSA要求科技公司承担”注意义务”,这个概念挺重的——意味着如果平台设计了让孩子上瘾的功能,是要负法律责任的。而且这个义务同样适用于AI公司。

    但众议院版呢?去年11月底,在众议院多数党领袖Steve Scalise(共和党,路易斯安那州)的主导下,这个条款被大幅稀释了。儿童安全倡导者当时就炸了。

    现在白宫绕过众议院,直接跟Blackburn的参议院版KOSA绑在一起,众议院共和党人自然很不爽。一位为中等规模科技公司游说的共和党人说得很直白:”没人知道这事儿到底谁在主导。所有人都深表怀疑,因为大家的立场差太远了。众议院不可能通过Blackburn想要的东西。”

    民主党人是绕不过去的坎

    就算特朗普能压住共和党不造反,还有一个更大的麻烦:民主党。参议院KOSA当年是由Blackburn和康涅狄格州民主党参议员Richard Blumenthal联合牵头的,以91比3通过。但那些民主党人现在才发现,自己辛苦推的法案被人拿去当AI preemptive 的”嫁妆”了,而且事先根本没人通知他们。

    一位AI政策倡导者说,如果Blackburn和白宫想推独立法案,那得走参议院程序,需要60票才能通过——这就意味着必须争取民主党人的支持。以目前的政治氛围,这几乎是不可能完成的任务。

    更何况,时间表也不站他们这边。现在是6月中旬,再过六个星期,国会议员就要休会,然后直接进入大选季。剩下的立法窗口,已经被FISA重新授权、移民收紧方案、国防开支增加、加密货币市场监管法案、医保预算等一堆更紧迫的事挤满了。

    “现在是6月中旬。你还有一个半月就要休会,然后就是大选季了。根本没戏。”一位AI政策倡导者这样告诉The Verge。

    Austin Carson——前英伟达政府关系负责人、现为专注于AI普及的非营利组织SeedAI创始人——对此更加不看好。他告诉The Verge:”我想象不出这个法案有任何推进的可能。真的想象不出来。”

  • LightRAG – 轻量级知识图谱RAG框架,微软GraphRAG的高效替代方案

    LightRAG – 轻量级知识图谱RAG框架,微软GraphRAG的高效替代方案

    🔍

    LightRAG

    轻量级知识图谱RAG框架 – 微软GraphRAG的高效替代方案

    🏫 香港大学
    📄 EMNLP 2025
    ⭐ 2.4K+ Stars

    📋 项目简介

    LightRAG 是由香港大学数据科学实验室(HKUDS)开发的轻量级、基于知识图谱的检索增强生成(RAG)框架。作为微软GraphRAG的高效替代方案,LightRAG专为法律、医疗、金融等复杂文档分析场景设计,支持多模态文档处理。其创新的双层级检索架构同时管理知识图谱(KG)和向量嵌入,解决了传统GraphRAG大规模数据处理时的高算力开销、响应慢、增量更新成本高等瓶颈问题。

    ⚙️ 安装要求

    ⚠️ 环境要求

    • Python 3.10 及以上
    • 推荐使用 uv 包管理工具(比 pip 性能更优)
    • 前端构建依赖:bun(如需自行构建WebUI)

    快速安装(三种方式)

    方式一:从PyPI安装(推荐)

    # 安装带API服务的LightRAG
    uv tool install "lightrag-hku[api]"
    
    # 构建前端产物
    cd lightrag_webui
    bun install --frozen-lockfile
    bun run build
    cd ..
    
    # 配置环境变量后启动服务
    cp env.example .env  # 修改.env中的LLM和嵌入模型配置
    lightrag-server

    方式二:从源码安装

    git clone https://github.com/HKUDS/LightRAG.git
    cd LightRAG
    
    # 一键初始化开发环境(自动安装所有依赖+构建前端)
    make dev
    
    source .venv/bin/activate  # Windows用 .venv\Scripts\activate
    
    # 配置环境变量后启动服务
    make env-base  # 生成.env配置文件
    lightrag-server

    方式三:Docker部署

    git clone https://github.com/HKUDS/LightRAG.git
    cd LightRAG
    cp env.example .env  # 修改LLM和嵌入模型配置
    docker compose up

    ✨ 核心功能

    🔍 双层级检索架构

    同时管理知识图谱(KG)和向量嵌入,弥合传统向量RAG和图RAG的技术鸿沟。支持5种查询模式:local(局部上下文)、global(宏观主题)、hybrid(融合模式)、naive(传统向量检索)、mix(默认,最全面)

    ⚡ 增量更新能力

    支持知识库无缝增量更新,新数据通过标准图索引pipeline生成局部图后直接合并到现有图谱,无需重构全局索引。删除文档时可基于构建阶段的LLM缓存快速重建受影响的关系,更新效率极高。

    🎯 多模态文档处理

    v1.5版本起支持多模态文档分析,文档处理管道支持MinerU、Docling、Native等多解析引擎,可高效提取文档中的文本、表格、公式、图像,实现跨模态实体和关系的统一映射与索引。

    💰 成本优势

    无需生成低效的社区报告或多跳推理来处理复杂查询,大幅减少索引和查询阶段的LLM调用次数,降低响应延迟和算力成本。在农业、计算机科学、法律、混合领域四类测试集上,性能均显著优于NaiveRAG、RQ-RAG、HyDE、GraphRAG等基线方法。

    🗄️ 多存储后端支持

    支持4类存储(KV存储、向量存储、图存储、文档状态存储)的灵活配置。生产环境可选择PostgreSQL、MongoDB、OpenSearch等统一后端,也可分别搭配Milvus/Qdrant做向量存储、Neo4j/Memgraph做图存储。

    🎯 典型使用场景

    📄 场景一:垂直领域复杂文档分析

    适用场景:法律合同审查、医疗病历分析、金融研报解读等需要深度上下文理解、逻辑推理的场景。
    优势:LightRAG的图索引能力可捕捉实体间复杂语义依赖,生成质量优于传统RAG。例如在法律领域,其全面性指标达到83.6%,远超NaiveRAG的16.4%。

    🏢 场景二:大规模知识库构建

    适用场景:需要处理海量文档、且知识库需要频繁更新迭代的企业知识库、技术文档站等。
    优势:LightRAG的增量更新能力可大幅降低更新成本,支持30B参数级开源模型也可达到高精度。无需每次都重构全局索引,显著提升运维效率。

    🚀 场景三:生产级RAG系统部署

    适用场景:企业级RAG应用,对高可用、低延迟、安全性有严格要求。
    优势:可通过配置统一存储后端、本地部署嵌入/重排序模型、调整并发参数,满足企业级部署需求。支持引用溯源、文档删除、RAGAS评估集成、Langfuse链路追踪等生产特性。

    💡 推荐理由

    作为一名经常与RAG系统打交道的开发者,我必须说 LightRAG 是我近期见过的最务实的RAG框架创新。它并没有试图颠覆什么,而是精准地解决了GraphRAG在实际落地时的三大痛点:算力开销高、更新成本高、响应速度慢

    最让我印象深刻的是它的增量更新能力。在传统GraphRAG中,每次添加新文档都需要重构整个知识图谱,这在动态知识库场景下几乎是不可接受的。而LightRAG通过局部图合并策略,实现了真正的无缝增量更新,这让它在企业级应用场景中具备了极强的竞争力。

    另外,它的多模态支持也非常实用。在现代文档中,表格、公式、图片的信息同样重要,但传统RAG往往只能处理纯文本。LightRAG v1.5通过集成MinerU、Docling等解析引擎,真正实现了对复杂文档的全面理解。

    当然,它并不是完美的。相比成熟的商业化方案,LightRAG在文档量和用户友好度上还有提升空间。但考虑到它是开源且活跃维护的项目,而且已经有EMNLP 2025论文背书,我相信它会成为RAG领域的一个重要里程碑。

    适用人群:如果你正在构建需要处理复杂文档的RAG系统,或者对GraphRAG的性能和成本不满,LightRAG绝对值得一试。特别是对于法律、医疗、金融等垂直领域的应用,它的知识图谱能力会让你事半功倍。

    ─────────────────── ✨ ✨ ✨ ───────────────────

    LightRAG 为RAG系统提供了一种更高效、更经济的解决方案。无论是构建企业知识库、垂直领域问答系统,还是进行RAG相关研究,它都是一个值得深入探索的优秀工具。

    你是否也在使用RAG技术? 欢迎在评论区分享你的经验和想法!

  • 特朗普封了Anthropic模型,全球「主权AI」大幕拉开

    特朗普封了Anthropic模型,全球「主权AI」大幕拉开

    全球主权AI浪潮
    全球”主权AI”浪潮加速

    特朗普政府一道命令,Anthropic把最新、最强的两个模型Fable 5和Mythos 5全部下线了。理由是国家安全和越狱风险。这件事发生在6月14日,距离这两个模型发布才过去几天。

    Anthropic说它没得选——白宫要求切断所有外国公民的访问权限,连自己的员工也在封禁范围内。这件事传递了一个信号:美国不仅主导了前沿AI,它的政府还可以决定谁能用、谁不能用。

    英国AI与在线安全部长Kanishka Narayan说:”我们以极其严肃的态度对待对主权的一切其他威胁,但我们还没有学会以同样的方式对待这个威胁。”他没有直接点名Anthropic或特朗普,但用这次封禁事件来论证英国必须发展自己的AI能力。

    欧洲:从担心到警惕

    在欧洲,这次封禁让本就存在的”美国技术依赖”焦虑变得更加具体。法国前总理、现任总统候选人Gabriel Attal直接把这件事称为”AI战争”的开始。他把Anthropic撤回模型比作伊朗封锁霍尔木兹海峡——AI访问权现在已经成了一个战略卡点,法国必须为此做好准备。

    Attal这么说不是孤例。《世界报》报道称,法国整个政治光谱都在表达类似的警觉。欧洲议会成员也指出,Mythos和Fable的撤回就是证据,说明欧洲需要把技术主权变成现实——而且要快。

    加拿大也学到了类似的教训。总理Mark Carney说,这种情况凸显了在关键资源(比如AI)上过度依赖单一伙伴的风险。”我们目前共同面临的Mythos和Fable的局面,是过度依赖某些模型时可能发生的事情。没有人在这个局面里做错了什么。但如果我们只是接受这个现状,不吸取教训,不搞多元化,那就是我们的错了。”

    主权AI不等于从头训练大模型

    当然,大多数政府和公司根本无法匹敌美国或中国前沿实验室的规模和资源。但主权AI并不总是意味着要造出最大、最强的工具。

    法国的Mistral和加拿大的Cohere证明了,来自这些国家之外的扎实努力是可能的——即使它们的模型还不能在基准测试上正面对抗。新加坡和阿联酋则专注于更窄但仍然具有战略优先性的方向,比如基础设施,或者更好地支持本地语言的模型。

    还有开源模型这条路。有一天,具有Mythos级别能力的开源模型可能会出现,到那时候,任何单一党派都很难控制访问权。


    特朗普可能把限制Mythos和Fable视为国家安全问题。但这个论点反过来也成立——华盛顿现在在问AI是否对所有人来说都太重要了,不能让所有人都有访问权;而其他国家的政府则在问,他们是否能承受让华盛顿来决定谁有访问权的代价。

    Anthropic可能很快会把Mythos和Fable重新上线。但要让全球对美国AI的信任恢复原状,那就是另一回事了。不管这次封禁持续多久,它都照亮了一个事实:对美国前沿AI模型的访问是多么脆弱。很多政府和公司不喜欢他们看到的情况——而且已经被激发起来,确保这种情况不再发生。

  • Meta给Facebook加了「AI搜索」,答案来自你身边的帖子

    Meta给Facebook加了「AI搜索」,答案来自你身边的帖子

    Meta AI Mode on Facebook
    Meta在Facebook上推出AI搜索新模式

    Meta在AI竞赛里一直像个追赶者,这次它想用Facebook打个翻身仗。6月15日,Meta宣布在Facebook上推出一系列新的AI功能,其中最引人注目的是”AI模式”——一种全新的搜索方式,用Meta AI从平台上的公开帖子里直接给你答案。

    搜索不再翻结果,AI直接给你答案

    说白了,就是你不再需要翻搜索结果了。你用大白话问一个问题,AI帮你把Facebook上所有人讨论这个话题的公开内容汇总成一个答案。它不光搜你的动态,还拉取小组(Groups)和短视频(Reels)里的公开信息。

    这个思路其实上个月就已经露过苗头。Meta悄咪咪上线了一个叫Forum的App,长得像Reddit,里面有个AI”Ask”标签页,让用户提问,然后AI从Facebook小组的讨论里提取答案。现在,这个功能被直接搬到了Facebook主平台。

    Google的AI搜索模式推出后,Reddit上就有用户吐槽说体验还不如普通搜索。Meta的版本面临同样的问题:答案来自普通用户的帖子,可靠性谁来保证?

    不止搜索,还有一堆AI玩法

    除了AI搜索,Facebook这次还加了一堆其他的AI玩法。视频编辑工具升级了,用户可以对视频蒙太奇做拼贴剪裁和转场效果。AI照片预设功能也上线了,你可以换衣服、换发型、加配饰。

    比如体育迷可以虚拟穿上喜欢的球队球衣——只要点一下Stories里的”AI编辑”图标,选”穿上它”就行。或者直接去个人资料图片,选”用AI重新设计头像”和”衣橱”。

    这些功能叠加在一起,看着眼熟吗?对,这就是Snapchat和TikTok玩了好几年的那套。Meta现在把它们搬到Facebook上,时机已经晚了很久。

    Meta的算盘:黏住用户,多赚钱

    把这一切串起来看,Meta的意图其实很清楚:让Facebook的AI工具把用户黏住,让平台更有用,同时开辟更多赚钱的门路。

    配合这些功能推送,Meta最近还推出了Facebook、Instagram和WhatsApp的全局订阅计划,起步价3.99美元/月,解锁额外功能,据说更多AI相关的订阅档位正在路上。

    从2月的动画头像(让你的静态照片”活”过来,加个挥手或者戴个派对帽子),到3月在Marketplace上加的AI自动回复买家消息,再到6月初给创作者推出的AI助手(基于创作者的内容和表现历史给个性化建议),Meta在过去几个月里密集往Facebook里塞AI功能。这次算是把底牌一次性亮出来了。


    AI搜索这件事,Google做了,Perplexity做了,现在Meta也来了。区别是,Meta的答案是从你身边的人那里来的。这让搜索变得更”社交”,但也可能变得更不靠谱。用户买不买账,接下来的数据会说话。

  • 76名网络安全专家联名抗议:美国政府封禁Anthropic最强模型,是在削弱防御

    76名网络安全专家联名抗议:美国政府封禁Anthropic最强模型,是在削弱防御

    上周,美国政府对Anthropic的Fable和Mythos模型下达了出口管制令,理由是国家安全。Anthropic随即暂停了全球用户对这两款模型的访问。

    事情到这里,看起来又是一个AI监管收紧的故事。但接下来的发展有点出人意料——76名网络安全专家联名写了一封公开信,要求政府撤销这道命令。

    网络安全AI概念图
    网络安全专家联名抗议Anthropic模型出口管制令

    联署名单相当豪华

    这份公开信的签署者里有不少业内重量级人物:前Facebook首席安全官Alex Stamos、漏洞赏金平台Bugcrowd创始人Casey Ellis、著名密码学家兼前苹果安全设计经理Jon Callas、计算机科学家Paul Vixie、前Block应用安全工程负责人Dino Dai Zovi、Luta Security创始人Katie Moussouris,以及安全意识培训公司SocialProof Security的CEO Rachel Tobac。

    他们在信里说得很直接:把最好的模型从网络安全防御者手里拿走,而没有充分的理由,这是”危险的”。

    “当我们的对手在快速进步的时候,把最好的能力从防御者那里拿走,是没有充分理由的危险行为。”

    禁令到底是怎么来的

    Anthropic今年4月推出Mythos预览版时,声称这个模型找安全漏洞的能力太强,所以需要严格限制访问,防止恶意黑客或外国对手拿来在互联网上搞破坏。实际操作里,Anthropic只给了大约50家公司初始访问权限,最近才扩展到15个国家的约150个组织。

    6月9日,Anthropic发布了Fable,这是Mythos的公开版本,但加了严格的护栏,阻止它在生物、化学和网络安全领域的使用,同时也防止别人通过”蒸馏”来复制这个模型。

    问题是,Fable的护栏严格到了许多网络安全专家发现它基本拦掉了任何与网络安全相关的提示词。

    亚马逊的论文:是真越狱还是误报

    据信,白宫的出口管制令可能源于一份亚马逊研究人员的论文,论文展示了一个可以绕过Fable护栏、解锁其Mythos级别能力的方法。

    但联署人之一Katie Moussouris在审阅了这份尚未公开的论文后,给出了完全不同的判断:这根本不是真正的越狱。

    她写道,研究人员只是让Fable去修复含有”故意植入的漏洞”的开源代码——而这正是模型最初拒绝”审查代码安全问题”之后发生的事情。

    “论文里描述的行为没办法被真正修复,任何尝试都只会削弱模型用于防御的能力。”Moussouris写道,”防御者需要能够要求AI修复文件里的bug、解释修复为什么重要、以及编写确认补丁有效的测试。这不是护栏绕过,这是AI模型能为防御性安全做的最有价值的事情:执行防御者每天都在跑的’发现、修复、测试’循环。”

    专家们真正担心的是什么

    公开信里还指出,亚马逊论文里描述的方法,在OpenAI的GPT-5.5上、在Anthropic自己公开可用的Claude Opus 4.8和Sonnet上、”甚至在中国的Kimi 2.7这样的模型上”都能复现。

    也就是说,封掉Fable和Mythos,并没有真正消除这个所谓的”漏洞”——它只是让美国自己的防御者用不上好工具,而对手那边照样能用上类似的能力。

    专家们的要求很明确:他们想要的是由”民主的规则制定程序”产生、基于产业和学术专家科学研究、透明且公平执行的监管,并且”只以最低必要程度使用,以确保美国公众的安全”。

  • 这颗卫星自己学会了找东西,太空AI时代真的来了

    这颗卫星自己学会了找东西,太空AI时代真的来了

    你拍一张照片,先传回地面,等分析师打开电脑看,再决定要不要拍下一张——这是过去几十年卫星工作的样子。数据量巨大,延迟高得离谱,大部分原始影像其实根本没人看。

    今年4月,一颗叫YAM-9的地球观测卫星把这事儿给改了。它在轨道上自己找到了要找的东西,完全没靠地面分析师。这是第一次有地球观测卫星在轨自主完成目标识别。

    卫星AI概念图
    YAM-9卫星搭载Nvidia Jetson Orin AGX GPU运行AI模型 | 图片来源:Loft/NASA JPL

    谷歌DeepMind的模型,跑在了太空中

    YAM-9由太空基础设施公司Loft Orbital制造,上面跑的软件来自NASA喷气推进实验室(JPL)。这个软件包名叫NAVI-Orbital,它把谷歌DeepMind的Gemma 3视觉语言模型搬到了轨道上。

    Gemma 3是专门为边缘设备设计的,能在远离数据中心的限制性硬件上运行。视觉语言模型(VLM)把大语言模型的语境理解能力和图像分析能力结合在一起——研究人员让它去分类”自然环境和人类开发交汇处”的传感器数据,或者识别铁路枢纽周边的基础设施,它都能搞定。

    “这为太空中’永远在线’的巡逻层打开了大门。”Loft的AI负责人Paul Lasserre说,”如果你有VLM,你就可以设定逻辑——比如’帮我监控这段边境,发现可疑情况就通知我’,然后跟卫星来回交互。”

    为什么这事很重要

    短期来看,轨上AI可以让太空传感器有用得多——它先在轨道上做初步数据分拣,减少分析师目前要硬着头皮处理的大量原始数据。

    长期来说,这是在为太空中更大规模的AI基础设施打样。YAM-9上装的是Nvidia Jetson Orin AGX GPU,也是目前太空计算的主流芯片之一。

    Loft的目标是用50到100颗YAM-9这样的卫星组队,实现对地球任意位置的实时覆盖。(Loft目前有12颗卫星在轨。)

    别人也在做

    Planet Labs也在发射搭载Jetson Orin处理器的卫星,目前用来做更简单的物体检测,但发言人表示正在研究包括VLM在内的其他AI应用。

    Kepler Communications运营着太空中最大规模的GPU集群,虽然因为NDA没法透露有没有部署VLM,但提到自今年1月那些卫星发射以来,已经出现了”几个未公开的使用案例”。


    未来:给宇航员的AI助手

    NAVI-Space的想法最初来自JPL研究员Taran Cyriac John,他在想给探索月球或火星的宇航员做数字助手。

    “我们在想,宇航员穿着增压服,肯定没法敲键盘,他们要做的任何事都很复杂。”JPL技术负责人Juan Delfa Victoria说,”所以,我们为什么不提供一个助手呢?就像在电子游戏和电影里看到的那种,可以交互的AI?”

    只不过,千万别叫它HAL 9000。

  • Open-WebUI:自托管AI平台,打造专属的ChatGPT体验

    在本地运行大语言模型(LLM)已经成为越来越多开发者和AI爱好者的选择。但Ollama等工具缺乏友好的Web界面,而Open-WebUI完美解决了这个问题——它提供了一个功能丰富、可自托管的AI交互平台,让你在本地也能享受媲美ChatGPT的使用体验。

    项目简介

    Open-WebUI 是一个可扩展、功能丰富、用户友好的自托管AI平台,支持完全离线运行。它兼容Ollama、OpenAI兼容API等多种LLM运行器,并内置RAG(检索增强生成)推理引擎。目前GitHub Stars已超过105,000+,是本地AI部署的首选界面方案。

    安装要求和过程

    环境要求

    • Python方式:需要 Python 3.11(避免使用其他版本以免兼容性问题)
    • Docker方式:需要安装Docker,建议使用GPU环境以获得更好性能
    • Ollama:如需本地运行模型,需提前安装Ollama
    • 存储空间:至少预留5GB空间用于模型和数据集

    快速安装步骤

    方式一:Python pip安装(最简单)

    # 安装项目
    pip install open-webui
    
    # 启动服务,访问地址:http://localhost:8080
    open-webui serve
    

    方式二:Docker快速部署(推荐)

    # 基础部署(Ollama在本地)
    docker run -d -p 3000:8080   --add-host=host.docker.internal:host-gateway   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:main
    
    # 访问地址:http://localhost:3000
    

    方式三:一体化部署(包含Ollama)

    # 带GPU支持
    docker run -d -p 3000:8080 --gpus=all   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    
    # 仅CPU
    docker run -d -p 3000:8080   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    

    核心功能

    • 多模型兼容:无缝集成Ollama、OpenAI API,支持对接LMStudio、GroqCloud、Mistral、OpenRouter等第三方服务,一个界面管理所有AI模型。
    • 本地RAG能力:内置检索增强生成引擎,支持9种向量数据库(ChromaDB、PGVector、Qdrant、Milvus等),可直接上传文档进行智能问答。
    • 多模态交互:支持语音/视频通话,集成多种语音转文本和文本转语音引擎;支持DALL-E、Gemini、ComfyUI等多种图像生成引擎。
    • 权限管理:细粒度用户角色与权限控制,支持LDAP/AD集成、SSO单点登录,适合团队和企业部署。
    • 插件扩展:支持Pipelines插件框架,可自定义业务逻辑(函数调用、用户限流、实时翻译、内容过滤等)。

    典型使用场景

    场景一:个人本地AI助手

    通过Docker一键部署Open-WebUI + Ollama,在本地运行Llama 3、Mistral等开源模型。所有数据完全离线,保障隐私安全;同时获得与ChatGPT媲美的Web交互体验,支持多轮对话、Markdown渲染、代码高亮等功能。

    场景二:团队协作AI平台

    利用Open-WebUI的权限管理和SSO集成能力,为企业团队搭建内部AI平台。通过RBAC控制不同用户的模型访问权限,对接企业内部知识库实现RAG问答,并监控API使用量和成本。

    场景三:AI应用开发测试

    开发者可使用Open-WebUI快速测试不同LLM模型的效果,通过模型构建器自定义提示词和角色,利用Python函数调用扩展自定义能力,加速AI应用的原型开发和测试验证。

    推荐理由

    Open-WebUI是我试用过的最优秀的本地LLM Web界面,没有之一。它的设计非常贴合实际使用场景:响应式界面适配各种设备,PWA支持让你可以像原生App一样使用,RAG功能让你可以轻松对接个人知识库。

    相比其他类似工具,Open-WebUI的最大优势在于完整性和成熟度:它不仅有精美的界面,还有完整的企业级功能(权限管理、SSO、监控等),同时支持广泛的模型和后端的灵活配置。无论你是个人用户还是企业团队,都能找到适合自己的部署方式。

    特别推荐它的RAG集成能力——上传文档后可以直接在对话中引用,支持多种向量数据库和搜索引擎,真正实现”个人AI知识库”的落地。如果你一直在寻找一个好用的本地LLM界面,Open-WebUI绝对值得一试。

    下载地址

    如果你觉得这个项目有帮助,欢迎到GitHub上点个Star支持开发者!

  • 印度AI独角兽Sarvam获2.34亿美元融资,HCLTech领投1.5亿

    2.34亿美元,估值15亿美元。印度班加罗尔的AI实验室Sarvam周一宣布完成新一轮融资,正式跻身独角兽行列。领投方不是哪家硅谷VC,而是印度本土IT巨头HCLTech——它一个人砸了1.5亿美元。

    印度AI独角兽Sarvam融资
    Sarvam成为印度最新AI独角兽,HCLTech领投1.5亿美元

    全栈AI,这是印度人的打法

    Sarvam的野心不小。它不像有些AI公司只做模型,或者只做应用,而是试图把整条栈都搭起来:从底层的AI模型,到中间的推理基础设施,再到面向企业的应用产品。这种”全栈”思路在印度市场尤其有意义——这里的企业客户喜欢”一站式解决方案”,不想分别找多家供应商拼起来。

    更关键的是语言。Sarvam的模型专门为印度语言设计——印地语、泰米尔语、孟加拉语、 Telugu等等。印度有22种官方语言,真正能把多语言场景跑通的AI公司并不多。Sarvam的两位创始人Vivek Raghavan和Pratyush Kumar之前在IIT马德拉斯的AI4Bharat项目干活,那个项目就是专门研究印度语言的AI,背后有印度”数字化之父”Nandan Nilekani的支持。

    HCLTech为什么舍得砸1.5亿

    HCLTech是印度IT服务业的巨头之一,和TCS、Infosys一个级别。它投Sarvam不是财务投资,是战略卡位。IT服务公司的下一个战场是AI——谁能把AI能力打包进企业服务合同里,谁就能吃掉竞争对手的份额。

    双方的计划很明确:把Sarvam的AI模型和HCLTech的企业客户关系、工程团队、软件资产拼在一起,给企业政府和政府客户做AI产品。HCLTech每年服务几百家全球500强企业,这个渠道价值不是钱能直接买的。

    Anthropic禁令戳中了印度的痛处

    就在上周,美国政府命令Anthropic切断外国公民对Fable 5和Mythos 5的访问权限。印度科技圈一下子慌了——OpenAI和Anthropic都把印度称为”第二大市场”,结果人家的模型说断就断。

    这件事让”AI主权”从一个抽象概念变成了眼前的问题。Sarvam的价值,很大程度上就是它是”印度的”——不管美国政府发什么令,Sarvam的模型印度自己能控制。这种安全感,是OpenAI和Anthropic给不了的。

    数据说话:Sarvam已经在跑

    光有愿景不够,Sarvam的以下几组数据值得一看:

    • 对话AI平台每天处理超过200万次交互
    • 推理平台每天处理约1000万次API调用
    • 语音模型每月转录超过50万小时音频
    • 文档AI系统正在数字化超过3500万页档案

    应用场景也在铺开。Sarvam的多语言语音代理已经为印度农业部收集了1700万农民的数据。一家大型保险公司用它的语音活动支持了4500万保单持有人的续保。还有一家大型金融科技公司,用Sarvam的AI代理平台支撑着一支35万人的销售队伍。


    印度AI的窗口期

    Sarvam不是印度唯一做AI模型的公司,但它可能是目前资金最充裕、落地最扎实的一家。挑战也一样明显:算力成本高、资本获取难,跟美国和中国那些融资动辄几十亿的对手比,Sarvam的资源还是紧的。

    但印度市场的规模是真实的。OpenAI和Anthropic都把印度当第二大市场,这说明需求在那里。Sarvam如果能把自己的模型能力、HCLTech的渠道、以及印度政府对”数字主权”的诉求这三件事拼起来,它不一定需要追上GPT-5,只要在印度市场足够好用,就是一门大生意。