标签: AI

  • Open-WebUI:自托管AI平台,打造专属的ChatGPT体验

    在本地运行大语言模型(LLM)已经成为越来越多开发者和AI爱好者的选择。但Ollama等工具缺乏友好的Web界面,而Open-WebUI完美解决了这个问题——它提供了一个功能丰富、可自托管的AI交互平台,让你在本地也能享受媲美ChatGPT的使用体验。

    项目简介

    Open-WebUI 是一个可扩展、功能丰富、用户友好的自托管AI平台,支持完全离线运行。它兼容Ollama、OpenAI兼容API等多种LLM运行器,并内置RAG(检索增强生成)推理引擎。目前GitHub Stars已超过105,000+,是本地AI部署的首选界面方案。

    安装要求和过程

    环境要求

    • Python方式:需要 Python 3.11(避免使用其他版本以免兼容性问题)
    • Docker方式:需要安装Docker,建议使用GPU环境以获得更好性能
    • Ollama:如需本地运行模型,需提前安装Ollama
    • 存储空间:至少预留5GB空间用于模型和数据集

    快速安装步骤

    方式一:Python pip安装(最简单)

    # 安装项目
    pip install open-webui
    
    # 启动服务,访问地址:http://localhost:8080
    open-webui serve
    

    方式二:Docker快速部署(推荐)

    # 基础部署(Ollama在本地)
    docker run -d -p 3000:8080   --add-host=host.docker.internal:host-gateway   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:main
    
    # 访问地址:http://localhost:3000
    

    方式三:一体化部署(包含Ollama)

    # 带GPU支持
    docker run -d -p 3000:8080 --gpus=all   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    
    # 仅CPU
    docker run -d -p 3000:8080   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
    

    核心功能

    • 多模型兼容:无缝集成Ollama、OpenAI API,支持对接LMStudio、GroqCloud、Mistral、OpenRouter等第三方服务,一个界面管理所有AI模型。
    • 本地RAG能力:内置检索增强生成引擎,支持9种向量数据库(ChromaDB、PGVector、Qdrant、Milvus等),可直接上传文档进行智能问答。
    • 多模态交互:支持语音/视频通话,集成多种语音转文本和文本转语音引擎;支持DALL-E、Gemini、ComfyUI等多种图像生成引擎。
    • 权限管理:细粒度用户角色与权限控制,支持LDAP/AD集成、SSO单点登录,适合团队和企业部署。
    • 插件扩展:支持Pipelines插件框架,可自定义业务逻辑(函数调用、用户限流、实时翻译、内容过滤等)。

    典型使用场景

    场景一:个人本地AI助手

    通过Docker一键部署Open-WebUI + Ollama,在本地运行Llama 3、Mistral等开源模型。所有数据完全离线,保障隐私安全;同时获得与ChatGPT媲美的Web交互体验,支持多轮对话、Markdown渲染、代码高亮等功能。

    场景二:团队协作AI平台

    利用Open-WebUI的权限管理和SSO集成能力,为企业团队搭建内部AI平台。通过RBAC控制不同用户的模型访问权限,对接企业内部知识库实现RAG问答,并监控API使用量和成本。

    场景三:AI应用开发测试

    开发者可使用Open-WebUI快速测试不同LLM模型的效果,通过模型构建器自定义提示词和角色,利用Python函数调用扩展自定义能力,加速AI应用的原型开发和测试验证。

    推荐理由

    Open-WebUI是我试用过的最优秀的本地LLM Web界面,没有之一。它的设计非常贴合实际使用场景:响应式界面适配各种设备,PWA支持让你可以像原生App一样使用,RAG功能让你可以轻松对接个人知识库。

    相比其他类似工具,Open-WebUI的最大优势在于完整性和成熟度:它不仅有精美的界面,还有完整的企业级功能(权限管理、SSO、监控等),同时支持广泛的模型和后端的灵活配置。无论你是个人用户还是企业团队,都能找到适合自己的部署方式。

    特别推荐它的RAG集成能力——上传文档后可以直接在对话中引用,支持多种向量数据库和搜索引擎,真正实现”个人AI知识库”的落地。如果你一直在寻找一个好用的本地LLM界面,Open-WebUI绝对值得一试。

    下载地址

    如果你觉得这个项目有帮助,欢迎到GitHub上点个Star支持开发者!

  • 印度AI独角兽Sarvam获2.34亿美元融资,HCLTech领投1.5亿

    2.34亿美元,估值15亿美元。印度班加罗尔的AI实验室Sarvam周一宣布完成新一轮融资,正式跻身独角兽行列。领投方不是哪家硅谷VC,而是印度本土IT巨头HCLTech——它一个人砸了1.5亿美元。

    印度AI独角兽Sarvam融资
    Sarvam成为印度最新AI独角兽,HCLTech领投1.5亿美元

    全栈AI,这是印度人的打法

    Sarvam的野心不小。它不像有些AI公司只做模型,或者只做应用,而是试图把整条栈都搭起来:从底层的AI模型,到中间的推理基础设施,再到面向企业的应用产品。这种”全栈”思路在印度市场尤其有意义——这里的企业客户喜欢”一站式解决方案”,不想分别找多家供应商拼起来。

    更关键的是语言。Sarvam的模型专门为印度语言设计——印地语、泰米尔语、孟加拉语、 Telugu等等。印度有22种官方语言,真正能把多语言场景跑通的AI公司并不多。Sarvam的两位创始人Vivek Raghavan和Pratyush Kumar之前在IIT马德拉斯的AI4Bharat项目干活,那个项目就是专门研究印度语言的AI,背后有印度”数字化之父”Nandan Nilekani的支持。

    HCLTech为什么舍得砸1.5亿

    HCLTech是印度IT服务业的巨头之一,和TCS、Infosys一个级别。它投Sarvam不是财务投资,是战略卡位。IT服务公司的下一个战场是AI——谁能把AI能力打包进企业服务合同里,谁就能吃掉竞争对手的份额。

    双方的计划很明确:把Sarvam的AI模型和HCLTech的企业客户关系、工程团队、软件资产拼在一起,给企业政府和政府客户做AI产品。HCLTech每年服务几百家全球500强企业,这个渠道价值不是钱能直接买的。

    Anthropic禁令戳中了印度的痛处

    就在上周,美国政府命令Anthropic切断外国公民对Fable 5和Mythos 5的访问权限。印度科技圈一下子慌了——OpenAI和Anthropic都把印度称为”第二大市场”,结果人家的模型说断就断。

    这件事让”AI主权”从一个抽象概念变成了眼前的问题。Sarvam的价值,很大程度上就是它是”印度的”——不管美国政府发什么令,Sarvam的模型印度自己能控制。这种安全感,是OpenAI和Anthropic给不了的。

    数据说话:Sarvam已经在跑

    光有愿景不够,Sarvam的以下几组数据值得一看:

    • 对话AI平台每天处理超过200万次交互
    • 推理平台每天处理约1000万次API调用
    • 语音模型每月转录超过50万小时音频
    • 文档AI系统正在数字化超过3500万页档案

    应用场景也在铺开。Sarvam的多语言语音代理已经为印度农业部收集了1700万农民的数据。一家大型保险公司用它的语音活动支持了4500万保单持有人的续保。还有一家大型金融科技公司,用Sarvam的AI代理平台支撑着一支35万人的销售队伍。


    印度AI的窗口期

    Sarvam不是印度唯一做AI模型的公司,但它可能是目前资金最充裕、落地最扎实的一家。挑战也一样明显:算力成本高、资本获取难,跟美国和中国那些融资动辄几十亿的对手比,Sarvam的资源还是紧的。

    但印度市场的规模是真实的。OpenAI和Anthropic都把印度当第二大市场,这说明需求在那里。Sarvam如果能把自己的模型能力、HCLTech的渠道、以及印度政府对”数字主权”的诉求这三件事拼起来,它不一定需要追上GPT-5,只要在印度市场足够好用,就是一门大生意。

  • Salesforce砸36亿美元买下Fin,AI客服大战打响了

    36亿美元,这不是一笔小收购。Salesforce周一宣布将AI客服平台Fin收入囊中,创下近年来企业服务软件领域最大的AI并购记录。Fin的前身是Intercom——那个你可能在无数网站右下角见过的在线聊天插件。但今天的Fin已经不是当年的Intercom了。

    Salesforce收购Fin AI客服平台
    Salesforce以36亿美元收购AI客服平台Fin,加码Agentforce战略

    从聊天插件到AI代理,Fin走了十年

    Fin的创始人Eoghan McCabe是个有意思的人。他曾经离开自己创立的Intercom,又在2020年杀回来重掌CEO大位。这次收购完成后,他发了一条X(Twitter)帖子,语气很稳——”我还会继续当CEO,Des继续管研发,事实上没什么会改变”。

    但实质上改变已经发生了。Fin最核心的产品是一个AI代理,能同时处理实时聊天、WhatsApp、短信、电话、Slack等多个渠道的客户询问。它不只是回答问题,而是真正”解决”问题——查订单、办退款、改地址,这些以前需要人类客服出面的事,Fin的AI代理现在可以自己搞定。

    Salesforce为什么现在出手

    答案藏在Agentforce里。这是Salesforce去年推出的企业AI代理平台,让企业可以搭建自己的自定义AI代理来自动执行任务。但Agentforce更多是”平台”定位——你得懂怎么用它。Fin的价值在于,它已经把”平台能力”包装成了”开箱即用的客服解决方案”。

    Salesforce CEO Marc Benioff在声明里说:”Fin带来了经过验证的代理技术,对客户成功的深度承诺,以及一个不可思议的AI团队,他们将用强大的服务代理能力来补充Agentforce。”

    说白了,Salesforce买Fin不是为了技术——Fin的技术他们自己也能做。真正买的是Fin已经跑通的客户场景、已经建立的品牌认知,以及那批真正懂AI客服的工程师和产品人。

    36亿值不值

    这个数字让很多人倒吸一口凉气。但换个角度看,企业AI客服市场的盘子正在以每年30%以上的速度扩张。Fin的竞争对手包括Zendesk的AI助手、Ada、甚至Salesforce自己平台上的第三方插件。收购Fin等于直接消灭了一个有威胁的竞争对手,同时把它的客户群一把捞过来。

    交易预计在Salesforce 2027财年第四季度完成——按他们的财报周期算,其实就是2027年初。时间还早,但消息一出,业界已经在猜测:是不是更多AI客服初创公司要被盯上了?


    Fin最近还憋了两个大招

    McCabe在收购声明之外的X帖子裡透露,Fin recently shipped了两个重要产品:一个叫Apex的新模型,还有一个叫Operator的”内部代理”——这个词值得玩味,”internal agent”可能意味着Fin的AI不只是对外服务客户,还可以帮企业内部员工处理工作流程。

    有了Salesforce的资源,这些产品的迭代速度只会更快。对小客户来说可能是好事——大平台的补贴能让先进的AI客服能力降价普及。但对Zendesk、Ada这些独立玩家来说,压力是实实在在的。

  • 把手机举到耳边就能实时翻译:Google把70种语言塞进了你的电话

    把手机举到耳边就能实时翻译:Google把70种语言塞进了你的电话

    Google Translate刚上线的时候,你把一句话敲进去,等两秒,它给你吐出来一段有时候对有时候不对的文字翻译。二十年过去,Google的翻译引擎已经每个月为几十亿用户处理超过一万亿个单词。现在他们想把「实时语音翻译」也做成每个人随手就能用的东西。

    不等你说完就开始翻

    Gemini 3.5 Live Translate是Google最新的语音翻译模型,支持70多种语言。最关键的部分是:它不像老一代翻译App那样等你把一句话说完才开工。它是连续生成的,边听边翻,延迟只有几秒钟,语气和节奏都尽量贴合说话的人。

    Google Gemini 3.5 Live Translate实时翻译概念图
    把手机举到耳边,就像接电话一样听翻译 (图片:AI生成)

    最有趣的功能是Android上的「聆听模式」:你把手机举到耳边,就像接电话一样,翻译好的语音就从听筒里直接出来。不用戴耳机,也不用举着手机让别人看到屏幕。Google说这个功能在你想快速听翻译、又不想让别人听见的时候特别有用——比如在国外旅游听到导游讲解,或者在异国他乡的商店里和店主砍价。

    「只需把手机举到耳边,就像一通普通电话,翻译好的语音就直接流进你的耳朵。」

    从5种语言到70种

    Google Meet也在用这个模型。以前Meet的翻译功能只支持5种语言,而且只能译成英文或者从英文译出。现在换成3.5 Live Translate之后,一口气的70多种语言、2000多种语言组合都能在会议里实时互译。这个功能这个月开始向部分企业Google Workspace客户开放私测。

    Grab也在测试这个模型。他们平台上每个月有超过1000万通语音通话,主要是司机和乘客之间的。两边经常说不同的语言,实时翻译能直接帮上忙。

    所有生成的语音都打了SynthID水印——这是Google开发的一种几乎听不出来的音频水印,用来标记这段内容是AI生成的,防止被人拿来造谣。

    在哪里能用?

    • Google Translate App(Android和iOS)——已全球推送
    • Gemini Live API —— 开发者公测版
    • Google Meet —— 部分企业客户私测中
    • Android「聆听模式」—— 正在逐步推送

    这篇文章其实没什么深奥的道理可讲。就是Google把一样东西做得更好、更顺手了。你要真想知道它翻译得准不准,最好的办法是找个说外语的朋友,面对面试试。


  • AI Agent正在变成员工,这家公司拿了6600万美元帮企业管「数字员工」

    AI Agent正在变成员工,这家公司拿了6600万美元帮企业管「数字员工」

    Goldman Sachs去年把AI编程代理Devin当作新员工来测试,McKinsey今年早些时候说他们已经有25000个AI代理和60000名人类员工一起工作。当AI代理真的变成「员工」,一个没人认真想过的问题就摆在了桌面上:你怎么给一个软件发工牌、管权限、还能在它出错的时候把它「开除」?

    从stealth模式走出来的NewCore

    纽约网络安全创业者Zohar Alon认为,现有的企业身份系统撑不住这个未来。他创办的NewCore今天从stealth模式走出来,拿了6600万美元种子轮融资,估值3亿美元。领投的是专注网络安全的风投Cyberstarts,Index Ventures和Evolution Equity Partners跟投。

    AI Agent身份管理概念图
    AI代理身份管理正成为企业安全新前线 (图片:AI生成)

    Alon不是第一次创业。他之前创办了云安全公司Dome9,后来卖给了Check Point。他说,AI代理的规模和复杂度会把那些用了15到20年的老身份平台「撑爆」。

    「我们很确定,AI代理给那些15年、20年历史的身份平台所增加的规模和复杂度,会把它们搞崩。」Alon对TechCrunch说。

    AI代理也该有「工牌」

    NewCore的平台把人类员工和AI代理放在同一个系统里管理。他们的核心论点是:AI代理应该被当作「一等公民」来对待——有自己的权限、生命周期控制和撤销机制,而不是混在传统的服务账户或机器凭证里蒙混过关。

    他们的「分键」架构把关键身份凭证分成两份,分别存在客户和平台那里。这样做的目的是消灭单一泄露点——就算平台被攻破,攻击者拿到的也只是不完整的一半密钥。

    NewCore还给Claude Code、OpenAI Codex、Cursor这些编程助手提供了「Agentic Skill」集成包,让AI工具以受管理的身份访问企业系统,而不是靠人工分发的凭证来凑合。

    更实用的部分是一个移动App:人类员工可以用它来审批、查看和撤销AI代理的权限。Alon把它叫做「人类监督层」。当公司有几十个甚至几百个AI代理在自主运行的时候,总得有人能随时拔插头。

    AI代理数量会超过人类员工?

    NewCore目前在美国和以色列有50多名员工,平台有不到10个付费客户和10多个设计伙伴。今年夏天开始收费。

    TCS董事长最近说,AI代理的数量最终可能赶上这家印度IT服务公司的人类员工总数。Alon预测,在科技公司里,AI代理在几年内就会超过人类员工的数量。

    「这是不可避免的。问题是我们要不要在来得及的时候把护栏建好。」——Zohar Alon

    Okta和微软的Entra这些老牌身份提供商也在往自己的平台里加AI代理功能。但Alon认为那些都是在为人类员工设计的平台上打补丁,而NewCore是从零开始为「人类+机器+AI代理」混合 workforce 建的。


    • NewCore种子轮6600万美元,估值3亿
    • 平台统一管理人类员工和AI代理身份
    • 「分键」架构防止单一泄露点
    • 移动App让人类监督AI代理权限
    • 今年夏天开始向客户收费
  • 白宫怀疑中国碰了Mythos,Anthropic模型安全再爆争议

    白宫怀疑中国碰了Mythos,Anthropic模型安全再爆争议

    白宫怀疑中国碰了Mythos,Anthropic模型安全再爆争议

    Anthropic的Mythos模型又出问题了。这次不是因为模型本身有多危险,而是因为白宫怀疑——一个有中国背景的团体,可能已经碰过它了。

    根据Semafor的报道,白宫之所以在6月初下令限制外部人员访问Anthropic的Mythos 5和Fable 5,部分原因就是对”中国获取模型”的担忧。如果中国政府真的拿到过Mythos 5或Fable 5的访问权限,这就是一个严重的国家安全风险——中方完全可以通过”蒸馏”技术,用这个强大模型来训练自己的”学生模型”,复制出类似的能力。

    Anthropic Mythos模型安全争议
    白宫怀疑中国访问了Anthropic的Mythos模型,模型安全再成焦点

    白宫没确认,但这件事已经够呛

    白宫到目前为止没有确认这份报道,特朗普的顾问David Sacks在X上发帖解释政府决定时,也没有提到中国,只说了Fable和Mythos存在被”越狱”的风险(这件事Anthropic自己是否认的)。Anthropic方面也没有回复媒体的询问,不过一个有意思的细节是:一位发言人对Semafor说,政府在与他们讨论出口管制时,并没有提起中国这件事。

    这就留出了一个解释空间:是中国真的访问过,还是这只是白宫内部某些人的担忧被泄露给了媒体?目前没有人知道确切答案。

    但这件事如果属实,那它不会是Mythos第一次在安全问题上报丑闻。Anthropic一直说Mythos太危险、太强大,不能对公众开放。但就在不久前,一个Discord群组被曝光曾经拥有Mythos的访问权限,而且持续了两周,Anthropic才发现并切断了访问。那次事件被媒体形容为Anthropic的” humiliation”——一家以安全为核心卖点的公司,自己的最强模型却被一帮网友先玩上了。

    Semafor报道称,白宫对Mythos的出口限制,部分原因是对中国获取模型的担忧。如果属实,这不会是Mythos第一次出现未经授权访问的安全事件。

    Anthropic在政府关系上越走越复杂

    把这两件事放在一起看,一个图案开始浮现:Anthropic在政府关系上越走越复杂。一方面,它要把模型卖给药企、能源公司这些受监管行业的客户,需要证明自己”安全可控”;另一方面,一旦牵扯上国家安全,它就得听从政府的出口管制指令,把大批海外用户挡在门外。上一次政府下令限制访问,印度科技圈炸了锅,不少人呼吁赶紧搞开源替代品。这一次如果”中国访问”的怀疑持续发酵,Anthropic面临的压力只会更大。

    对美国政府来说,这件事的底层焦虑很真实:AI军备竞赛里,模型能力就是战略资源,不能让别人轻易拿到。但Anthropic毕竟是商业公司,不是国家实验室,它要在全球市场卖产品,就得在”安全”和”开放”之间找平衡。这个平衡现在看起来越来越难找了。

    接下来值得关注的是,Anthropic会不会因为这件事进一步收紧模型访问政策。如果”中国访问”的怀疑被证实,那不只是Anthropic一家的事——整个美国AI行业都可能面临更严格的出口管制审查。而对于中国的AI实验室来说,这也是一个信号:想要拿到最先进的模型,不能靠”碰”,得靠自己做出来的。


  • AI管人这件事,终于轮到一线员工了

    AI管人这件事,终于轮到一线员工了

    AI管人这件事,终于轮到一线员工了

    大多数人听到”AI取代工作”这个话题,第一反应都是焦虑。但有一家叫Orbio的初创公司,思路正好反过来——它要用AI来管人,而且管的还是那些平时最不会被科技界注意到的群体:一线员工。

    Orbio的三个联合创始人里,CEO Sergi Bastardas在亚马逊和鲜花电商Colvin待了十年。他有一个反复出现的感受:背后支撑业务的那些人——在病房里、在餐厅后厨、在物流仓库里干活的人——一直缺乏高效的”人力基础设施”来管理。这些人有27亿之多,遍布医疗、零售、物流和酒店行业,大多数人连企业邮箱都没有,更别提被科技工具认真对待了。

    Bastardas在2025年拉着两个联合创始人Nacho Travesí和Antonio Melé,把这种感受做成了一家公司。Orbio做的事不难理解:用AI代理来帮企业招人、入职、管理一线员工。

    AI招聘代理管理一线员工
    Orbio用AI代理管理一线员工招聘与入职流程

    三个AI代理,管招人管入职还管日常

    具体是怎么做的?他们开发了三个AI代理,名字分别叫Maria、Daniel和Claire。Maria负责面试候选人,评估匹配度;Daniel跟进员工入职后的产出表现;Claire做日常打卡和沟通。三个代理不是孤立运行的——Maria面试时收集到的信号会反馈给招聘质量评估,员工离职面谈里透露的原因会重新校准招聘标准,日常参与度数据能提前识别离职风险。

    这个思路听起来有点赛博朋克,但实际落地已经有客户了。Orbio公布的信息显示,百胜集团(旗下有必胜客、塔可钟、肯德基)和餐饮品牌Poke已经在用这套系统来入职和管理一线员工。行为健康服务供应商The Stepping Stones Group更直接——Orbio现在跑通了它在美国的全部业务运营,而且入职成功率比以前高了20%。

    行为健康服务供应商The Stepping Stones Group现在用Orbio运行其全美业务,入职成功率提升了20%。

    2600万美元,盯上27亿人的”AI时刻”

    Orbio刚宣布完成2100万美元的A轮融资,领投方是Dawn Capital。加上这轮,公司总融资额已经达到2600万美元。Bastardas说,新钱主要用来招人和开发更多AI代理。

    这件事有意思的地方在于,它把AI应用的战场从”白领桌前”搬到了”一线现场”。之前AI招聘工具主打的是简历筛选、程序员笔试这类场景,对象是有邮箱、会用LinkedIn的白领。Orbio盯上的,是那27亿没有被传统企业软件覆盖过的人。

    竞争对手当然有。Paradox在做招聘自动化,WorkJam在做一线员工管理。但Bastardas觉得最大的对手不是某家初创公司,而是”老办法”——医疗、零售、物流这些行业里,管人的方式至今还是表格加电话,碎片化得厉害。

    接下来会怎么演变,现在还不好说。但Bastardas的一句话挺值得记住:”这是27亿人的AI时刻。”这些人撑着医疗、零售、物流和酒店行业在运转,之前从来没有被科技认真对待过。现在,AI终于轮到他们了。


  • 【开源推荐】aisuite:14.5K+ Stars!Andrew Ng 出品,一行代码切换 14+ 个 AI 大模型

    【开源推荐】aisuite:14.5K+ Stars!Andrew Ng 出品,一行代码切换 14+ 个 AI 大模型

    🚀 aisuite
    Simple, unified interface to multiple Generative AI providers
    ⭐ 14,500+ Stars  |  🍴 1,500+ Forks  |  🐍 Python  |  📜 MIT License

    📌 项目简介

    aisuiteAndrew Ng(吴恩达)团队开源的轻量级 Python 库,通过一套统一 API 接口同时调用 OpenAI、Anthropic、Google、Mistral、AWS、Ollama 等 14+ 个 AI 大模型提供商。只需修改一个字符串即可切换模型,彻底告别各家 SDK 差异带来的适配噩梦。

    该项目采用两层架构:底层是统一 Chat Completions API(兼容 OpenAI 格式),上层是带工具调用的 Agents API。同仓库还包含基于 aisuite 构建的桌面 AI 助手 OpenCoworker

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.9+
    • 各 AI 提供商的 API Key(或本地 Ollama)
    • 磁盘空间:约 50MB(基础包)

    快速安装(3步)

    # 基础安装(不含提供商 SDK)
    pip install aisuite
    
    # 安装时附带指定提供商的 SDK
    pip install 'aisuite[anthropic]'
    pip install 'aisuite[openai]'
    pip install 'aisuite[google]'
    
    # 安装所有提供商 SDK(完整版)
    pip install 'aisuite[all]'

    API Key 配置

    # 设置环境变量(Linux/macOS)
    export OPENAI_API_KEY="sk-your-key"
    export ANTHROPIC_API_KEY="sk-ant-your-key"
    
    # Windows PowerShell
    $env:OPENAI_API_KEY = "sk-your-key"
    $env:ANTHROPIC_API_KEY = "sk-ant-your-key"

    ✨ 核心功能

    ① 统一 Chat Completions API —— 一行切换模型
    模型名格式 <provider>:<model-name>,修改一个字符串即可在不同提供商之间切换,所有核心参数(temperature、max_tokens、tools 等)均为提供商无关。

    ② Agents API —— 让模型使用真实工具
    传入普通 Python 函数即可获得工具调用能力,aisuite 自动生成 JSON Schema、执行函数调用、将结果反馈给模型。max_turns 参数控制多轮对话,也可手动控制每一轮。

    ③ Toolkits —— 开箱即用的工具集
    内置 files(文件操作)、git(版本控制)、shell(命令行)等工具集,也可接入任意 MCP 服务器,让 Agent 获得文件系统、浏览器自动化等真实能力。

    ④ 生产级 Agent 管控
    支持 Tool Policies(工具调用审批策略)、State Stores(跨进程持久化对话状态,支持内存/文件/Postgres)、Artifacts & Tracing(完整记录 Agent 产出和每一步执行轨迹)。

    ⑤ OpenCoworker —— 开箱即用的桌面 AI 助手
    同仓库附赠 OpenCoworker 桌面应用(macOS/Windows),能聊天、做深度研究、读写文件、收发消息(Slack/Email)、生成 PDF 报告,并支持定时自动化任务(如每日新闻摘要)。数据完全留在本地。

    🎯 典型使用场景

    场景一:多模型对比评测
    研究人员可以用同一段代码,分别调用 GPT-4o、Claude 3.5 Sonnet 和 Gemini Pro,对比不同模型在同一 Prompt 下的响应质量,而无需维护三套 SDK 调用代码。aisuite 让 A/B 测试大模型 变得极其简单。

    场景二:构建支持多提供商的 AI 产品
    SaaS 产品需要同时支持 OpenAI 和 Anthropic,或允许用户选择自己偏好的模型。使用 aisuite,产品代码只需维护一套接口,后端根据配置动态路由到不同提供商,大幅降低维护成本。

    场景三:本地 + 云端混合部署
    开发阶段使用免费本地模型 Ollama,上线后切换到 OpenAI API。aisuite 让这种切换只需改一个字符串("ollama:llama3""openai:gpt-4o"),无需改动任何业务逻辑代码。

    💡 推荐理由

    Andrew Ng 亲自站台的项目,质量有保障。我推荐它的核心原因是它解决了一个真实存在的痛点:每家 AI 公司的 API 都不一样。OpenAI 用一套格式,Anthropic 用另一套,Google 又是另一套……如果你要同时支持多家,代码里全是 if provider == "openai" 这种恶心的判断逻辑。

    aisuite 把这一切统一了。它的 API 设计完全兼容 OpenAI 的 Chat Completions 格式,其他提供商只是”适配层”,对使用者完全透明。这种设计意味着你现有的 OpenAI 代码几乎不用改,就能无缝迁移到 Claude 或 Gemini。

    更让人惊喜的是它的 Agents API 设计——传入普通 Python 函数就能让模型调用工具,不需要手写 JSON Schema。加上对 MCP(Model Context Protocol)的原生支持,未来接入各种工具生态会很方便。

    如果你正在做 AI 应用开发,或者需要对比评测多个大模型,aisuite 是目前最优雅的解决方案,没有之一。

    📥 下载地址

    🌐 官方网站:
    github.com/andrewyng/aisuite
    💻 快速安装:
    pip install aisuite
    💬 Discord 社区:
    discord.gg/T6Nvn8ExSb

    🔌 支持的 AI 提供商

    提供商 模型示例 调用格式
    OpenAI gpt-4o, gpt-4-turbo openai:gpt-4o
    Anthropic claude-3-5-sonnet anthropic:claude-3-5-sonnet-20240620
    Google gemini-pro, gemini-1.5-pro google:gemini-pro
    Mistral mistral-large, mixtral-8x7b mistral:mistral-large
    Ollama(本地) llama3, mistral, codellama ollama:llama3
    AWS Bedrock anthropic.claude-3-5-sonnet bedrock:anthropic.claude-3-5-sonnet
    Hugging Face 任意 HF 模型 huggingface:model-name

    📅 文章发布时间:2026 年 6 月 15 日
    📜 开源协议:MIT License(可自由用于商业和非商业项目)

  • 六月AI大模型”挤爆了”:GPT、Claude、Gemini、Grok扎堆发布

    六月AI大模型发布潮
    2026年6月,AI大模型迎来史上最密集的发布潮

    2026年6月,AI圈有点挤。往常一家头部公司发新模型,行业得消化好一阵;这个月倒好,OpenAI、Anthropic、Google、xAI四家差不多同时亮剑,GPT-5.6、Claude Sonnet 4.8、Gemini 3.5 Pro、Grok 5扎堆亮相,上下文窗口一口气推到150万Token。有人开玩笑说,AI圈的六月像双十一预售——不约而同,就怕自己晚一步。

    意外曝光的”后台日志”

    这一波发布潮,最早是从”泄露”开始的。今年4月下旬,有开发者发现OpenAI Codex的后台日志里短暂出现了一个陌生代号——GPT-5.6。没过几天,Claude Code的源码里也被人扒出了Claude Sonnet 4.8和另一个叫Jupiter V1的内部模型代号。

    两家公司都没官宣,但开发者社区已经炸了。评论区最高的赞只有一句话:”When launch?” 从GPT-5.5发布到5.6现身,中间只隔了一个多月。大模型迭代周期从”数月”缩短到”数天”,AI军备竞赛的节奏已经完全不一样了。

    四家同时亮剑,打的什么算盘?

    Google的Gemini 3.5 Pro走的是”长上下文”路线,150万Token的窗口意味着你可以把一整本书丢进去,还能接着对话。这个方向很Google——他们有搜索基础设施的底子,处理超长文本本来就是强项。

    Anthropic的Claude Sonnet 4.8继续在”安全”和”可控”上做文章,面向企业用户的味道很浓。OpenAI的GPT-5.6则更像在补全5.5没做完的事——据泄露出来的信息,5.6在代码能力和多模态理解上有明显提升。

    马斯克的Grok 5是最难预测的。xAI的数据中心折腾了好几个月(SpaceX的Colossus 1因为延迟问题租给了Anthropic和Google),但Grok 5如果准时出来,打的就是”实时信息”这张牌——毕竟Grok直接接Twitter/X的 firehose,这是其他家都没有的数据优势。

    国产阵营也没闲着。Qwen3.6、GLM-5.1、Kimi也在6月前后密集更新,而且走的是开源路线。国际市场打性能,国内市场打价格+开源,两边都在抢时间窗口。

    模型越强,商业越难

    密集发布背后有一个不那么显见的问题:模型能力越来越强,但怎么赚钱反而越来越难。Gemini 3.5 Pro的150万Token上下文听起来很厉害,但每次推理的计算成本也跟着涨。GPT-5.6能力更强,但不降价就没人用,降价就亏本——这是所有头部玩家都在面对的困局。

    一个正常的月份里,一家发新模型就够行业消化一阵了。但2026年6月,我们迎来的是四家同时发布。这不是巧合——大家都在抢同一个时间窗口,抢同一批企业客户,抢同一批开发者的注意力。挤就挤吧,用户倒是有的挑了。


    📎 相关信息:GPT-5.6与Claude Sonnet 4.8泄露分析、June 2026 AI Model Release Tracker
  • 科技公司利润创纪录却在裁人,AI成了最好的借口

    科技公司里正在发生一件很诡异的事情。一边是财报上的数字节节攀升,利润、营收接连创纪录;另一边却是成千上万的人被请出门,而官方理由清一色写着”AI”。

    求职平台TrueUp的数据很直观:今年以来科技公司已经发生了363起裁员,受影响的人接近15万,相当于每天近千人失去工作,速度比去年同期快了44%。上个月的单月裁员数更是创了两年来新高,接近4万人,而AI已经是全行业被提及最多的裁员理由,连续三个月都是如此。

    AI是真相还是遮羞布?

    越来越多的质疑声在问:AI真的就是那个原因吗?还是说,它只是一个特别好用的借口?

    支付公司Block的CEO Jack Dorsey今年早些时候裁掉了将近一半员工,随后被骂上热搜。他的解释是AI工具正在改变公司运作方式,但转眼又被网友翻出他在疫情期间过度招聘的证据——说白了,Block就是招多了,AI只是个好用的遮羞布。

    知名VC Marc Andreessen最近也忍不住说了大实话。他在播客里直言,几乎所有大公司都人满为患,至少多招了25%,有些甚至多了75%。以前没有办法,现在好了,有了AI这个”银弹借口”,裁人变得理直气壮。

    Uber本月初的小动作也很说明问题。他们裁掉了HR和招聘部门约23%的人,公司发言人赶紧出来澄清:这跟AI没关系。但就在一个月前,Uber的CTO还在内部会议上承认,公司2026年的AI编程预算在四个月内就烧光了,不得不给每个工程师设消费上限。你猜大家信哪个版本?

    造富与裁员的双重叙事

    这边厢大裁员,那边厢AI圈的钱却在以难以想象的速度聚集。

    Cerebras上个月上市,首日股价暴涨68%,两位联合创始人直接跻身亿万富翁行列。SpaceX上周五上市,市值站上2.1万亿美元,马斯克成了全球首位”纸面万亿富翁”,估计还造出了4400位百万富翁。Anthropic和OpenAI也在排队IPO,估值各自奔着1万亿美元去。

    扎克伯格今年3月花1.7亿美元在迈阿密”亿万富翁地堡”买了一栋豪宅,创下当地史上最贵房屋交易纪录。两个月后,Meta宣布裁员8000人,约占全部员工的10%。

    但这些极端财富故事出现的时候,普通美国人正在经历多年来最紧的日子。今年雇主医保保费涨了6-7%,是通胀速度的两倍多;私人医保费用自2008年以来翻了一倍;房价自2020年初涨了28%,房贷利率也翻了近一番。最新民调显示,76%的美国人把”生活成本”列为最担心的经济问题。

    这次跟2008年不一样

    这种贫富分化的剧本,上一次这么清晰还是2008年。那一次,华尔街搞出来的金融危机,最后结果是银行拿了救助,几百万人丢了工作和房子,愤怒在三年后凝结成”占领华尔街”运动。

    但如果眼下的趋势继续,2008年可能还算温和的。占领华尔街至少有个危机可以指——银行搞砸了,大家看得很清楚。这一回,没有崩盘可以怪。公司们在赚钱,AI本身在造富,裁员照样发生,理由就是AI。

    2008年的叙事是”我们救助搞砸经济的人,你却丢了工作”;这一回的叙事可能是”我们靠用来取代你的这项技术,赚到了前所未有的钱”。后者的火药味,显然要浓得多。

    很多公司——Block、Atlassian、Cloudflare——在提到AI时股价都会涨,所以这个策略能理解。但还是值得想一想:当你用AI当理由裁掉一批人时,你对外发出的信号到底是什么?