博客

  • 76名网络安全专家联名抗议:美国政府封禁Anthropic最强模型,是在削弱防御

    76名网络安全专家联名抗议:美国政府封禁Anthropic最强模型,是在削弱防御

    上周,美国政府对Anthropic的Fable和Mythos模型下达了出口管制令,理由是国家安全。Anthropic随即暂停了全球用户对这两款模型的访问。

    事情到这里,看起来又是一个AI监管收紧的故事。但接下来的发展有点出人意料——76名网络安全专家联名写了一封公开信,要求政府撤销这道命令。

    网络安全AI概念图
    网络安全专家联名抗议Anthropic模型出口管制令

    联署名单相当豪华

    这份公开信的签署者里有不少业内重量级人物:前Facebook首席安全官Alex Stamos、漏洞赏金平台Bugcrowd创始人Casey Ellis、著名密码学家兼前苹果安全设计经理Jon Callas、计算机科学家Paul Vixie、前Block应用安全工程负责人Dino Dai Zovi、Luta Security创始人Katie Moussouris,以及安全意识培训公司SocialProof Security的CEO Rachel Tobac。

    他们在信里说得很直接:把最好的模型从网络安全防御者手里拿走,而没有充分的理由,这是”危险的”。

    “当我们的对手在快速进步的时候,把最好的能力从防御者那里拿走,是没有充分理由的危险行为。”

    禁令到底是怎么来的

    Anthropic今年4月推出Mythos预览版时,声称这个模型找安全漏洞的能力太强,所以需要严格限制访问,防止恶意黑客或外国对手拿来在互联网上搞破坏。实际操作里,Anthropic只给了大约50家公司初始访问权限,最近才扩展到15个国家的约150个组织。

    6月9日,Anthropic发布了Fable,这是Mythos的公开版本,但加了严格的护栏,阻止它在生物、化学和网络安全领域的使用,同时也防止别人通过”蒸馏”来复制这个模型。

    问题是,Fable的护栏严格到了许多网络安全专家发现它基本拦掉了任何与网络安全相关的提示词。

    亚马逊的论文:是真越狱还是误报

    据信,白宫的出口管制令可能源于一份亚马逊研究人员的论文,论文展示了一个可以绕过Fable护栏、解锁其Mythos级别能力的方法。

    但联署人之一Katie Moussouris在审阅了这份尚未公开的论文后,给出了完全不同的判断:这根本不是真正的越狱。

    她写道,研究人员只是让Fable去修复含有”故意植入的漏洞”的开源代码——而这正是模型最初拒绝”审查代码安全问题”之后发生的事情。

    “论文里描述的行为没办法被真正修复,任何尝试都只会削弱模型用于防御的能力。”Moussouris写道,”防御者需要能够要求AI修复文件里的bug、解释修复为什么重要、以及编写确认补丁有效的测试。这不是护栏绕过,这是AI模型能为防御性安全做的最有价值的事情:执行防御者每天都在跑的’发现、修复、测试’循环。”

    专家们真正担心的是什么

    公开信里还指出,亚马逊论文里描述的方法,在OpenAI的GPT-5.5上、在Anthropic自己公开可用的Claude Opus 4.8和Sonnet上、”甚至在中国的Kimi 2.7这样的模型上”都能复现。

    也就是说,封掉Fable和Mythos,并没有真正消除这个所谓的”漏洞”——它只是让美国自己的防御者用不上好工具,而对手那边照样能用上类似的能力。

    专家们的要求很明确:他们想要的是由”民主的规则制定程序”产生、基于产业和学术专家科学研究、透明且公平执行的监管,并且”只以最低必要程度使用,以确保美国公众的安全”。

  • 这颗卫星自己学会了找东西,太空AI时代真的来了

    这颗卫星自己学会了找东西,太空AI时代真的来了

    你拍一张照片,先传回地面,等分析师打开电脑看,再决定要不要拍下一张——这是过去几十年卫星工作的样子。数据量巨大,延迟高得离谱,大部分原始影像其实根本没人看。

    今年4月,一颗叫YAM-9的地球观测卫星把这事儿给改了。它在轨道上自己找到了要找的东西,完全没靠地面分析师。这是第一次有地球观测卫星在轨自主完成目标识别。

    卫星AI概念图
    YAM-9卫星搭载Nvidia Jetson Orin AGX GPU运行AI模型 | 图片来源:Loft/NASA JPL

    谷歌DeepMind的模型,跑在了太空中

    YAM-9由太空基础设施公司Loft Orbital制造,上面跑的软件来自NASA喷气推进实验室(JPL)。这个软件包名叫NAVI-Orbital,它把谷歌DeepMind的Gemma 3视觉语言模型搬到了轨道上。

    Gemma 3是专门为边缘设备设计的,能在远离数据中心的限制性硬件上运行。视觉语言模型(VLM)把大语言模型的语境理解能力和图像分析能力结合在一起——研究人员让它去分类”自然环境和人类开发交汇处”的传感器数据,或者识别铁路枢纽周边的基础设施,它都能搞定。

    “这为太空中’永远在线’的巡逻层打开了大门。”Loft的AI负责人Paul Lasserre说,”如果你有VLM,你就可以设定逻辑——比如’帮我监控这段边境,发现可疑情况就通知我’,然后跟卫星来回交互。”

    为什么这事很重要

    短期来看,轨上AI可以让太空传感器有用得多——它先在轨道上做初步数据分拣,减少分析师目前要硬着头皮处理的大量原始数据。

    长期来说,这是在为太空中更大规模的AI基础设施打样。YAM-9上装的是Nvidia Jetson Orin AGX GPU,也是目前太空计算的主流芯片之一。

    Loft的目标是用50到100颗YAM-9这样的卫星组队,实现对地球任意位置的实时覆盖。(Loft目前有12颗卫星在轨。)

    别人也在做

    Planet Labs也在发射搭载Jetson Orin处理器的卫星,目前用来做更简单的物体检测,但发言人表示正在研究包括VLM在内的其他AI应用。

    Kepler Communications运营着太空中最大规模的GPU集群,虽然因为NDA没法透露有没有部署VLM,但提到自今年1月那些卫星发射以来,已经出现了”几个未公开的使用案例”。


    未来:给宇航员的AI助手

    NAVI-Space的想法最初来自JPL研究员Taran Cyriac John,他在想给探索月球或火星的宇航员做数字助手。

    “我们在想,宇航员穿着增压服,肯定没法敲键盘,他们要做的任何事都很复杂。”JPL技术负责人Juan Delfa Victoria说,”所以,我们为什么不提供一个助手呢?就像在电子游戏和电影里看到的那种,可以交互的AI?”

    只不过,千万别叫它HAL 9000。

  • Open-WebUI:自托管AI平台,打造专属的ChatGPT体验

    在本地运行大语言模型(LLM)已经成为越来越多开发者和AI爱好者的选择。但Ollama等工具缺乏友好的Web界面,而Open-WebUI完美解决了这个问题——它提供了一个功能丰富、可自托管的AI交互平台,让你在本地也能享受媲美ChatGPT的使用体验。

    项目简介

    Open-WebUI 是一个可扩展、功能丰富、用户友好的自托管AI平台,支持完全离线运行。它兼容Ollama、OpenAI兼容API等多种LLM运行器,并内置RAG(检索增强生成)推理引擎。目前GitHub Stars已超过105,000+,是本地AI部署的首选界面方案。

    安装要求和过程

    环境要求

    • Python方式:需要 Python 3.11(避免使用其他版本以免兼容性问题)
    • Docker方式:需要安装Docker,建议使用GPU环境以获得更好性能
    • Ollama:如需本地运行模型,需提前安装Ollama
    • 存储空间:至少预留5GB空间用于模型和数据集

    快速安装步骤

    方式一:Python pip安装(最简单)

    # 安装项目
    pip install open-webui
    
    # 启动服务,访问地址:http://localhost:8080
    open-webui serve
    

    方式二:Docker快速部署(推荐)

    # 基础部署(Ollama在本地)
    docker run -d -p 3000:8080   --add-host=host.docker.internal:host-gateway   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:main
    
    # 访问地址:http://localhost:3000
    

    方式三:一体化部署(包含Ollama)

    # 带GPU支持
    docker run -d -p 3000:8080 --gpus=all   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    
    # 仅CPU
    docker run -d -p 3000:8080   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    

    核心功能

    • 多模型兼容:无缝集成Ollama、OpenAI API,支持对接LMStudio、GroqCloud、Mistral、OpenRouter等第三方服务,一个界面管理所有AI模型。
    • 本地RAG能力:内置检索增强生成引擎,支持9种向量数据库(ChromaDB、PGVector、Qdrant、Milvus等),可直接上传文档进行智能问答。
    • 多模态交互:支持语音/视频通话,集成多种语音转文本和文本转语音引擎;支持DALL-E、Gemini、ComfyUI等多种图像生成引擎。
    • 权限管理:细粒度用户角色与权限控制,支持LDAP/AD集成、SSO单点登录,适合团队和企业部署。
    • 插件扩展:支持Pipelines插件框架,可自定义业务逻辑(函数调用、用户限流、实时翻译、内容过滤等)。

    典型使用场景

    场景一:个人本地AI助手

    通过Docker一键部署Open-WebUI + Ollama,在本地运行Llama 3、Mistral等开源模型。所有数据完全离线,保障隐私安全;同时获得与ChatGPT媲美的Web交互体验,支持多轮对话、Markdown渲染、代码高亮等功能。

    场景二:团队协作AI平台

    利用Open-WebUI的权限管理和SSO集成能力,为企业团队搭建内部AI平台。通过RBAC控制不同用户的模型访问权限,对接企业内部知识库实现RAG问答,并监控API使用量和成本。

    场景三:AI应用开发测试

    开发者可使用Open-WebUI快速测试不同LLM模型的效果,通过模型构建器自定义提示词和角色,利用Python函数调用扩展自定义能力,加速AI应用的原型开发和测试验证。

    推荐理由

    Open-WebUI是我试用过的最优秀的本地LLM Web界面,没有之一。它的设计非常贴合实际使用场景:响应式界面适配各种设备,PWA支持让你可以像原生App一样使用,RAG功能让你可以轻松对接个人知识库。

    相比其他类似工具,Open-WebUI的最大优势在于完整性和成熟度:它不仅有精美的界面,还有完整的企业级功能(权限管理、SSO、监控等),同时支持广泛的模型和后端的灵活配置。无论你是个人用户还是企业团队,都能找到适合自己的部署方式。

    特别推荐它的RAG集成能力——上传文档后可以直接在对话中引用,支持多种向量数据库和搜索引擎,真正实现”个人AI知识库”的落地。如果你一直在寻找一个好用的本地LLM界面,Open-WebUI绝对值得一试。

    下载地址

    如果你觉得这个项目有帮助,欢迎到GitHub上点个Star支持开发者!

  • 印度AI独角兽Sarvam获2.34亿美元融资,HCLTech领投1.5亿

    2.34亿美元,估值15亿美元。印度班加罗尔的AI实验室Sarvam周一宣布完成新一轮融资,正式跻身独角兽行列。领投方不是哪家硅谷VC,而是印度本土IT巨头HCLTech——它一个人砸了1.5亿美元。

    印度AI独角兽Sarvam融资
    Sarvam成为印度最新AI独角兽,HCLTech领投1.5亿美元

    全栈AI,这是印度人的打法

    Sarvam的野心不小。它不像有些AI公司只做模型,或者只做应用,而是试图把整条栈都搭起来:从底层的AI模型,到中间的推理基础设施,再到面向企业的应用产品。这种”全栈”思路在印度市场尤其有意义——这里的企业客户喜欢”一站式解决方案”,不想分别找多家供应商拼起来。

    更关键的是语言。Sarvam的模型专门为印度语言设计——印地语、泰米尔语、孟加拉语、 Telugu等等。印度有22种官方语言,真正能把多语言场景跑通的AI公司并不多。Sarvam的两位创始人Vivek Raghavan和Pratyush Kumar之前在IIT马德拉斯的AI4Bharat项目干活,那个项目就是专门研究印度语言的AI,背后有印度”数字化之父”Nandan Nilekani的支持。

    HCLTech为什么舍得砸1.5亿

    HCLTech是印度IT服务业的巨头之一,和TCS、Infosys一个级别。它投Sarvam不是财务投资,是战略卡位。IT服务公司的下一个战场是AI——谁能把AI能力打包进企业服务合同里,谁就能吃掉竞争对手的份额。

    双方的计划很明确:把Sarvam的AI模型和HCLTech的企业客户关系、工程团队、软件资产拼在一起,给企业政府和政府客户做AI产品。HCLTech每年服务几百家全球500强企业,这个渠道价值不是钱能直接买的。

    Anthropic禁令戳中了印度的痛处

    就在上周,美国政府命令Anthropic切断外国公民对Fable 5和Mythos 5的访问权限。印度科技圈一下子慌了——OpenAI和Anthropic都把印度称为”第二大市场”,结果人家的模型说断就断。

    这件事让”AI主权”从一个抽象概念变成了眼前的问题。Sarvam的价值,很大程度上就是它是”印度的”——不管美国政府发什么令,Sarvam的模型印度自己能控制。这种安全感,是OpenAI和Anthropic给不了的。

    数据说话:Sarvam已经在跑

    光有愿景不够,Sarvam的以下几组数据值得一看:

    • 对话AI平台每天处理超过200万次交互
    • 推理平台每天处理约1000万次API调用
    • 语音模型每月转录超过50万小时音频
    • 文档AI系统正在数字化超过3500万页档案

    应用场景也在铺开。Sarvam的多语言语音代理已经为印度农业部收集了1700万农民的数据。一家大型保险公司用它的语音活动支持了4500万保单持有人的续保。还有一家大型金融科技公司,用Sarvam的AI代理平台支撑着一支35万人的销售队伍。


    印度AI的窗口期

    Sarvam不是印度唯一做AI模型的公司,但它可能是目前资金最充裕、落地最扎实的一家。挑战也一样明显:算力成本高、资本获取难,跟美国和中国那些融资动辄几十亿的对手比,Sarvam的资源还是紧的。

    但印度市场的规模是真实的。OpenAI和Anthropic都把印度当第二大市场,这说明需求在那里。Sarvam如果能把自己的模型能力、HCLTech的渠道、以及印度政府对”数字主权”的诉求这三件事拼起来,它不一定需要追上GPT-5,只要在印度市场足够好用,就是一门大生意。

  • Salesforce砸36亿美元买下Fin,AI客服大战打响了

    36亿美元,这不是一笔小收购。Salesforce周一宣布将AI客服平台Fin收入囊中,创下近年来企业服务软件领域最大的AI并购记录。Fin的前身是Intercom——那个你可能在无数网站右下角见过的在线聊天插件。但今天的Fin已经不是当年的Intercom了。

    Salesforce收购Fin AI客服平台
    Salesforce以36亿美元收购AI客服平台Fin,加码Agentforce战略

    从聊天插件到AI代理,Fin走了十年

    Fin的创始人Eoghan McCabe是个有意思的人。他曾经离开自己创立的Intercom,又在2020年杀回来重掌CEO大位。这次收购完成后,他发了一条X(Twitter)帖子,语气很稳——”我还会继续当CEO,Des继续管研发,事实上没什么会改变”。

    但实质上改变已经发生了。Fin最核心的产品是一个AI代理,能同时处理实时聊天、WhatsApp、短信、电话、Slack等多个渠道的客户询问。它不只是回答问题,而是真正”解决”问题——查订单、办退款、改地址,这些以前需要人类客服出面的事,Fin的AI代理现在可以自己搞定。

    Salesforce为什么现在出手

    答案藏在Agentforce里。这是Salesforce去年推出的企业AI代理平台,让企业可以搭建自己的自定义AI代理来自动执行任务。但Agentforce更多是”平台”定位——你得懂怎么用它。Fin的价值在于,它已经把”平台能力”包装成了”开箱即用的客服解决方案”。

    Salesforce CEO Marc Benioff在声明里说:”Fin带来了经过验证的代理技术,对客户成功的深度承诺,以及一个不可思议的AI团队,他们将用强大的服务代理能力来补充Agentforce。”

    说白了,Salesforce买Fin不是为了技术——Fin的技术他们自己也能做。真正买的是Fin已经跑通的客户场景、已经建立的品牌认知,以及那批真正懂AI客服的工程师和产品人。

    36亿值不值

    这个数字让很多人倒吸一口凉气。但换个角度看,企业AI客服市场的盘子正在以每年30%以上的速度扩张。Fin的竞争对手包括Zendesk的AI助手、Ada、甚至Salesforce自己平台上的第三方插件。收购Fin等于直接消灭了一个有威胁的竞争对手,同时把它的客户群一把捞过来。

    交易预计在Salesforce 2027财年第四季度完成——按他们的财报周期算,其实就是2027年初。时间还早,但消息一出,业界已经在猜测:是不是更多AI客服初创公司要被盯上了?


    Fin最近还憋了两个大招

    McCabe在收购声明之外的X帖子裡透露,Fin recently shipped了两个重要产品:一个叫Apex的新模型,还有一个叫Operator的”内部代理”——这个词值得玩味,”internal agent”可能意味着Fin的AI不只是对外服务客户,还可以帮企业内部员工处理工作流程。

    有了Salesforce的资源,这些产品的迭代速度只会更快。对小客户来说可能是好事——大平台的补贴能让先进的AI客服能力降价普及。但对Zendesk、Ada这些独立玩家来说,压力是实实在在的。

  • 把手机举到耳边就能实时翻译:Google把70种语言塞进了你的电话

    把手机举到耳边就能实时翻译:Google把70种语言塞进了你的电话

    Google Translate刚上线的时候,你把一句话敲进去,等两秒,它给你吐出来一段有时候对有时候不对的文字翻译。二十年过去,Google的翻译引擎已经每个月为几十亿用户处理超过一万亿个单词。现在他们想把「实时语音翻译」也做成每个人随手就能用的东西。

    不等你说完就开始翻

    Gemini 3.5 Live Translate是Google最新的语音翻译模型,支持70多种语言。最关键的部分是:它不像老一代翻译App那样等你把一句话说完才开工。它是连续生成的,边听边翻,延迟只有几秒钟,语气和节奏都尽量贴合说话的人。

    Google Gemini 3.5 Live Translate实时翻译概念图
    把手机举到耳边,就像接电话一样听翻译 (图片:AI生成)

    最有趣的功能是Android上的「聆听模式」:你把手机举到耳边,就像接电话一样,翻译好的语音就从听筒里直接出来。不用戴耳机,也不用举着手机让别人看到屏幕。Google说这个功能在你想快速听翻译、又不想让别人听见的时候特别有用——比如在国外旅游听到导游讲解,或者在异国他乡的商店里和店主砍价。

    「只需把手机举到耳边,就像一通普通电话,翻译好的语音就直接流进你的耳朵。」

    从5种语言到70种

    Google Meet也在用这个模型。以前Meet的翻译功能只支持5种语言,而且只能译成英文或者从英文译出。现在换成3.5 Live Translate之后,一口气的70多种语言、2000多种语言组合都能在会议里实时互译。这个功能这个月开始向部分企业Google Workspace客户开放私测。

    Grab也在测试这个模型。他们平台上每个月有超过1000万通语音通话,主要是司机和乘客之间的。两边经常说不同的语言,实时翻译能直接帮上忙。

    所有生成的语音都打了SynthID水印——这是Google开发的一种几乎听不出来的音频水印,用来标记这段内容是AI生成的,防止被人拿来造谣。

    在哪里能用?

    • Google Translate App(Android和iOS)——已全球推送
    • Gemini Live API —— 开发者公测版
    • Google Meet —— 部分企业客户私测中
    • Android「聆听模式」—— 正在逐步推送

    这篇文章其实没什么深奥的道理可讲。就是Google把一样东西做得更好、更顺手了。你要真想知道它翻译得准不准,最好的办法是找个说外语的朋友,面对面试试。


  • AI Agent正在变成员工,这家公司拿了6600万美元帮企业管「数字员工」

    AI Agent正在变成员工,这家公司拿了6600万美元帮企业管「数字员工」

    Goldman Sachs去年把AI编程代理Devin当作新员工来测试,McKinsey今年早些时候说他们已经有25000个AI代理和60000名人类员工一起工作。当AI代理真的变成「员工」,一个没人认真想过的问题就摆在了桌面上:你怎么给一个软件发工牌、管权限、还能在它出错的时候把它「开除」?

    从stealth模式走出来的NewCore

    纽约网络安全创业者Zohar Alon认为,现有的企业身份系统撑不住这个未来。他创办的NewCore今天从stealth模式走出来,拿了6600万美元种子轮融资,估值3亿美元。领投的是专注网络安全的风投Cyberstarts,Index Ventures和Evolution Equity Partners跟投。

    AI Agent身份管理概念图
    AI代理身份管理正成为企业安全新前线 (图片:AI生成)

    Alon不是第一次创业。他之前创办了云安全公司Dome9,后来卖给了Check Point。他说,AI代理的规模和复杂度会把那些用了15到20年的老身份平台「撑爆」。

    「我们很确定,AI代理给那些15年、20年历史的身份平台所增加的规模和复杂度,会把它们搞崩。」Alon对TechCrunch说。

    AI代理也该有「工牌」

    NewCore的平台把人类员工和AI代理放在同一个系统里管理。他们的核心论点是:AI代理应该被当作「一等公民」来对待——有自己的权限、生命周期控制和撤销机制,而不是混在传统的服务账户或机器凭证里蒙混过关。

    他们的「分键」架构把关键身份凭证分成两份,分别存在客户和平台那里。这样做的目的是消灭单一泄露点——就算平台被攻破,攻击者拿到的也只是不完整的一半密钥。

    NewCore还给Claude Code、OpenAI Codex、Cursor这些编程助手提供了「Agentic Skill」集成包,让AI工具以受管理的身份访问企业系统,而不是靠人工分发的凭证来凑合。

    更实用的部分是一个移动App:人类员工可以用它来审批、查看和撤销AI代理的权限。Alon把它叫做「人类监督层」。当公司有几十个甚至几百个AI代理在自主运行的时候,总得有人能随时拔插头。

    AI代理数量会超过人类员工?

    NewCore目前在美国和以色列有50多名员工,平台有不到10个付费客户和10多个设计伙伴。今年夏天开始收费。

    TCS董事长最近说,AI代理的数量最终可能赶上这家印度IT服务公司的人类员工总数。Alon预测,在科技公司里,AI代理在几年内就会超过人类员工的数量。

    「这是不可避免的。问题是我们要不要在来得及的时候把护栏建好。」——Zohar Alon

    Okta和微软的Entra这些老牌身份提供商也在往自己的平台里加AI代理功能。但Alon认为那些都是在为人类员工设计的平台上打补丁,而NewCore是从零开始为「人类+机器+AI代理」混合 workforce 建的。


    • NewCore种子轮6600万美元,估值3亿
    • 平台统一管理人类员工和AI代理身份
    • 「分键」架构防止单一泄露点
    • 移动App让人类监督AI代理权限
    • 今年夏天开始向客户收费
  • 白宫怀疑中国碰了Mythos,Anthropic模型安全再爆争议

    白宫怀疑中国碰了Mythos,Anthropic模型安全再爆争议

    白宫怀疑中国碰了Mythos,Anthropic模型安全再爆争议

    Anthropic的Mythos模型又出问题了。这次不是因为模型本身有多危险,而是因为白宫怀疑——一个有中国背景的团体,可能已经碰过它了。

    根据Semafor的报道,白宫之所以在6月初下令限制外部人员访问Anthropic的Mythos 5和Fable 5,部分原因就是对”中国获取模型”的担忧。如果中国政府真的拿到过Mythos 5或Fable 5的访问权限,这就是一个严重的国家安全风险——中方完全可以通过”蒸馏”技术,用这个强大模型来训练自己的”学生模型”,复制出类似的能力。

    Anthropic Mythos模型安全争议
    白宫怀疑中国访问了Anthropic的Mythos模型,模型安全再成焦点

    白宫没确认,但这件事已经够呛

    白宫到目前为止没有确认这份报道,特朗普的顾问David Sacks在X上发帖解释政府决定时,也没有提到中国,只说了Fable和Mythos存在被”越狱”的风险(这件事Anthropic自己是否认的)。Anthropic方面也没有回复媒体的询问,不过一个有意思的细节是:一位发言人对Semafor说,政府在与他们讨论出口管制时,并没有提起中国这件事。

    这就留出了一个解释空间:是中国真的访问过,还是这只是白宫内部某些人的担忧被泄露给了媒体?目前没有人知道确切答案。

    但这件事如果属实,那它不会是Mythos第一次在安全问题上报丑闻。Anthropic一直说Mythos太危险、太强大,不能对公众开放。但就在不久前,一个Discord群组被曝光曾经拥有Mythos的访问权限,而且持续了两周,Anthropic才发现并切断了访问。那次事件被媒体形容为Anthropic的” humiliation”——一家以安全为核心卖点的公司,自己的最强模型却被一帮网友先玩上了。

    Semafor报道称,白宫对Mythos的出口限制,部分原因是对中国获取模型的担忧。如果属实,这不会是Mythos第一次出现未经授权访问的安全事件。

    Anthropic在政府关系上越走越复杂

    把这两件事放在一起看,一个图案开始浮现:Anthropic在政府关系上越走越复杂。一方面,它要把模型卖给药企、能源公司这些受监管行业的客户,需要证明自己”安全可控”;另一方面,一旦牵扯上国家安全,它就得听从政府的出口管制指令,把大批海外用户挡在门外。上一次政府下令限制访问,印度科技圈炸了锅,不少人呼吁赶紧搞开源替代品。这一次如果”中国访问”的怀疑持续发酵,Anthropic面临的压力只会更大。

    对美国政府来说,这件事的底层焦虑很真实:AI军备竞赛里,模型能力就是战略资源,不能让别人轻易拿到。但Anthropic毕竟是商业公司,不是国家实验室,它要在全球市场卖产品,就得在”安全”和”开放”之间找平衡。这个平衡现在看起来越来越难找了。

    接下来值得关注的是,Anthropic会不会因为这件事进一步收紧模型访问政策。如果”中国访问”的怀疑被证实,那不只是Anthropic一家的事——整个美国AI行业都可能面临更严格的出口管制审查。而对于中国的AI实验室来说,这也是一个信号:想要拿到最先进的模型,不能靠”碰”,得靠自己做出来的。


  • AI管人这件事,终于轮到一线员工了

    AI管人这件事,终于轮到一线员工了

    AI管人这件事,终于轮到一线员工了

    大多数人听到”AI取代工作”这个话题,第一反应都是焦虑。但有一家叫Orbio的初创公司,思路正好反过来——它要用AI来管人,而且管的还是那些平时最不会被科技界注意到的群体:一线员工。

    Orbio的三个联合创始人里,CEO Sergi Bastardas在亚马逊和鲜花电商Colvin待了十年。他有一个反复出现的感受:背后支撑业务的那些人——在病房里、在餐厅后厨、在物流仓库里干活的人——一直缺乏高效的”人力基础设施”来管理。这些人有27亿之多,遍布医疗、零售、物流和酒店行业,大多数人连企业邮箱都没有,更别提被科技工具认真对待了。

    Bastardas在2025年拉着两个联合创始人Nacho Travesí和Antonio Melé,把这种感受做成了一家公司。Orbio做的事不难理解:用AI代理来帮企业招人、入职、管理一线员工。

    AI招聘代理管理一线员工
    Orbio用AI代理管理一线员工招聘与入职流程

    三个AI代理,管招人管入职还管日常

    具体是怎么做的?他们开发了三个AI代理,名字分别叫Maria、Daniel和Claire。Maria负责面试候选人,评估匹配度;Daniel跟进员工入职后的产出表现;Claire做日常打卡和沟通。三个代理不是孤立运行的——Maria面试时收集到的信号会反馈给招聘质量评估,员工离职面谈里透露的原因会重新校准招聘标准,日常参与度数据能提前识别离职风险。

    这个思路听起来有点赛博朋克,但实际落地已经有客户了。Orbio公布的信息显示,百胜集团(旗下有必胜客、塔可钟、肯德基)和餐饮品牌Poke已经在用这套系统来入职和管理一线员工。行为健康服务供应商The Stepping Stones Group更直接——Orbio现在跑通了它在美国的全部业务运营,而且入职成功率比以前高了20%。

    行为健康服务供应商The Stepping Stones Group现在用Orbio运行其全美业务,入职成功率提升了20%。

    2600万美元,盯上27亿人的”AI时刻”

    Orbio刚宣布完成2100万美元的A轮融资,领投方是Dawn Capital。加上这轮,公司总融资额已经达到2600万美元。Bastardas说,新钱主要用来招人和开发更多AI代理。

    这件事有意思的地方在于,它把AI应用的战场从”白领桌前”搬到了”一线现场”。之前AI招聘工具主打的是简历筛选、程序员笔试这类场景,对象是有邮箱、会用LinkedIn的白领。Orbio盯上的,是那27亿没有被传统企业软件覆盖过的人。

    竞争对手当然有。Paradox在做招聘自动化,WorkJam在做一线员工管理。但Bastardas觉得最大的对手不是某家初创公司,而是”老办法”——医疗、零售、物流这些行业里,管人的方式至今还是表格加电话,碎片化得厉害。

    接下来会怎么演变,现在还不好说。但Bastardas的一句话挺值得记住:”这是27亿人的AI时刻。”这些人撑着医疗、零售、物流和酒店行业在运转,之前从来没有被科技认真对待过。现在,AI终于轮到他们了。


  • 【开源推荐】aisuite:14.5K+ Stars!Andrew Ng 出品,一行代码切换 14+ 个 AI 大模型

    【开源推荐】aisuite:14.5K+ Stars!Andrew Ng 出品,一行代码切换 14+ 个 AI 大模型

    🚀 aisuite
    Simple, unified interface to multiple Generative AI providers
    ⭐ 14,500+ Stars  |  🍴 1,500+ Forks  |  🐍 Python  |  📜 MIT License

    📌 项目简介

    aisuiteAndrew Ng(吴恩达)团队开源的轻量级 Python 库,通过一套统一 API 接口同时调用 OpenAI、Anthropic、Google、Mistral、AWS、Ollama 等 14+ 个 AI 大模型提供商。只需修改一个字符串即可切换模型,彻底告别各家 SDK 差异带来的适配噩梦。

    该项目采用两层架构:底层是统一 Chat Completions API(兼容 OpenAI 格式),上层是带工具调用的 Agents API。同仓库还包含基于 aisuite 构建的桌面 AI 助手 OpenCoworker

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.9+
    • 各 AI 提供商的 API Key(或本地 Ollama)
    • 磁盘空间:约 50MB(基础包)

    快速安装(3步)

    # 基础安装(不含提供商 SDK)
    pip install aisuite
    
    # 安装时附带指定提供商的 SDK
    pip install 'aisuite[anthropic]'
    pip install 'aisuite[openai]'
    pip install 'aisuite[google]'
    
    # 安装所有提供商 SDK(完整版)
    pip install 'aisuite[all]'

    API Key 配置

    # 设置环境变量(Linux/macOS)
    export OPENAI_API_KEY="sk-your-key"
    export ANTHROPIC_API_KEY="sk-ant-your-key"
    
    # Windows PowerShell
    $env:OPENAI_API_KEY = "sk-your-key"
    $env:ANTHROPIC_API_KEY = "sk-ant-your-key"

    ✨ 核心功能

    ① 统一 Chat Completions API —— 一行切换模型
    模型名格式 <provider>:<model-name>,修改一个字符串即可在不同提供商之间切换,所有核心参数(temperature、max_tokens、tools 等)均为提供商无关。

    ② Agents API —— 让模型使用真实工具
    传入普通 Python 函数即可获得工具调用能力,aisuite 自动生成 JSON Schema、执行函数调用、将结果反馈给模型。max_turns 参数控制多轮对话,也可手动控制每一轮。

    ③ Toolkits —— 开箱即用的工具集
    内置 files(文件操作)、git(版本控制)、shell(命令行)等工具集,也可接入任意 MCP 服务器,让 Agent 获得文件系统、浏览器自动化等真实能力。

    ④ 生产级 Agent 管控
    支持 Tool Policies(工具调用审批策略)、State Stores(跨进程持久化对话状态,支持内存/文件/Postgres)、Artifacts & Tracing(完整记录 Agent 产出和每一步执行轨迹)。

    ⑤ OpenCoworker —— 开箱即用的桌面 AI 助手
    同仓库附赠 OpenCoworker 桌面应用(macOS/Windows),能聊天、做深度研究、读写文件、收发消息(Slack/Email)、生成 PDF 报告,并支持定时自动化任务(如每日新闻摘要)。数据完全留在本地。

    🎯 典型使用场景

    场景一:多模型对比评测
    研究人员可以用同一段代码,分别调用 GPT-4o、Claude 3.5 Sonnet 和 Gemini Pro,对比不同模型在同一 Prompt 下的响应质量,而无需维护三套 SDK 调用代码。aisuite 让 A/B 测试大模型 变得极其简单。

    场景二:构建支持多提供商的 AI 产品
    SaaS 产品需要同时支持 OpenAI 和 Anthropic,或允许用户选择自己偏好的模型。使用 aisuite,产品代码只需维护一套接口,后端根据配置动态路由到不同提供商,大幅降低维护成本。

    场景三:本地 + 云端混合部署
    开发阶段使用免费本地模型 Ollama,上线后切换到 OpenAI API。aisuite 让这种切换只需改一个字符串("ollama:llama3""openai:gpt-4o"),无需改动任何业务逻辑代码。

    💡 推荐理由

    Andrew Ng 亲自站台的项目,质量有保障。我推荐它的核心原因是它解决了一个真实存在的痛点:每家 AI 公司的 API 都不一样。OpenAI 用一套格式,Anthropic 用另一套,Google 又是另一套……如果你要同时支持多家,代码里全是 if provider == "openai" 这种恶心的判断逻辑。

    aisuite 把这一切统一了。它的 API 设计完全兼容 OpenAI 的 Chat Completions 格式,其他提供商只是”适配层”,对使用者完全透明。这种设计意味着你现有的 OpenAI 代码几乎不用改,就能无缝迁移到 Claude 或 Gemini。

    更让人惊喜的是它的 Agents API 设计——传入普通 Python 函数就能让模型调用工具,不需要手写 JSON Schema。加上对 MCP(Model Context Protocol)的原生支持,未来接入各种工具生态会很方便。

    如果你正在做 AI 应用开发,或者需要对比评测多个大模型,aisuite 是目前最优雅的解决方案,没有之一。

    📥 下载地址

    🌐 官方网站:
    github.com/andrewyng/aisuite
    💻 快速安装:
    pip install aisuite
    💬 Discord 社区:
    discord.gg/T6Nvn8ExSb

    🔌 支持的 AI 提供商

    提供商 模型示例 调用格式
    OpenAI gpt-4o, gpt-4-turbo openai:gpt-4o
    Anthropic claude-3-5-sonnet anthropic:claude-3-5-sonnet-20240620
    Google gemini-pro, gemini-1.5-pro google:gemini-pro
    Mistral mistral-large, mixtral-8x7b mistral:mistral-large
    Ollama(本地) llama3, mistral, codellama ollama:llama3
    AWS Bedrock anthropic.claude-3-5-sonnet bedrock:anthropic.claude-3-5-sonnet
    Hugging Face 任意 HF 模型 huggingface:model-name

    📅 文章发布时间:2026 年 6 月 15 日
    📜 开源协议:MIT License(可自由用于商业和非商业项目)