标签： AI

Open-WebUI：自托管AI平台，打造专属的ChatGPT体验
在本地运行大语言模型（LLM）已经成为越来越多开发者和AI爱好者的选择。但Ollama等工具缺乏友好的Web界面，而Open-WebUI完美解决了这个问题——它提供了一个功能丰富、可自托管的AI交互平台，让你在本地也能享受媲美ChatGPT的使用体验。

项目简介

Open-WebUI 是一个可扩展、功能丰富、用户友好的自托管AI平台，支持完全离线运行。它兼容Ollama、OpenAI兼容API等多种LLM运行器，并内置RAG（检索增强生成）推理引擎。目前GitHub Stars已超过105,000+，是本地AI部署的首选界面方案。

安装要求和过程

环境要求
- Python方式：需要 Python 3.11（避免使用其他版本以免兼容性问题）
- Docker方式：需要安装Docker，建议使用GPU环境以获得更好性能
- Ollama：如需本地运行模型，需提前安装Ollama
- 存储空间：至少预留5GB空间用于模型和数据集
快速安装步骤

方式一：Python pip安装（最简单）
```
# 安装项目
pip install open-webui

# 启动服务，访问地址：http://localhost:8080
open-webui serve
```
方式二：Docker快速部署（推荐）
```
# 基础部署（Ollama在本地）
docker run -d -p 3000:8080   --add-host=host.docker.internal:host-gateway   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:main

# 访问地址：http://localhost:3000
```
方式三：一体化部署（包含Ollama）
```
# 带GPU支持
docker run -d -p 3000:8080 --gpus=all   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama

# 仅CPU
docker run -d -p 3000:8080   -v ollama:/root/.ollama   -v open-webui:/app/backend/data   --name open-webui --restart always   ghcr.io/open-webui/open-webui:ollama
```
核心功能
- 多模型兼容：无缝集成Ollama、OpenAI API，支持对接LMStudio、GroqCloud、Mistral、OpenRouter等第三方服务，一个界面管理所有AI模型。
- 本地RAG能力：内置检索增强生成引擎，支持9种向量数据库（ChromaDB、PGVector、Qdrant、Milvus等），可直接上传文档进行智能问答。
- 多模态交互：支持语音/视频通话，集成多种语音转文本和文本转语音引擎；支持DALL-E、Gemini、ComfyUI等多种图像生成引擎。
- 权限管理：细粒度用户角色与权限控制，支持LDAP/AD集成、SSO单点登录，适合团队和企业部署。
- 插件扩展：支持Pipelines插件框架，可自定义业务逻辑（函数调用、用户限流、实时翻译、内容过滤等）。
典型使用场景

场景一：个人本地AI助手

通过Docker一键部署Open-WebUI + Ollama，在本地运行Llama 3、Mistral等开源模型。所有数据完全离线，保障隐私安全；同时获得与ChatGPT媲美的Web交互体验，支持多轮对话、Markdown渲染、代码高亮等功能。

场景二：团队协作AI平台

利用Open-WebUI的权限管理和SSO集成能力，为企业团队搭建内部AI平台。通过RBAC控制不同用户的模型访问权限，对接企业内部知识库实现RAG问答，并监控API使用量和成本。

场景三：AI应用开发测试

开发者可使用Open-WebUI快速测试不同LLM模型的效果，通过模型构建器自定义提示词和角色，利用Python函数调用扩展自定义能力，加速AI应用的原型开发和测试验证。

推荐理由

Open-WebUI是我试用过的最优秀的本地LLM Web界面，没有之一。它的设计非常贴合实际使用场景：响应式界面适配各种设备，PWA支持让你可以像原生App一样使用，RAG功能让你可以轻松对接个人知识库。

相比其他类似工具，Open-WebUI的最大优势在于完整性和成熟度：它不仅有精美的界面，还有完整的企业级功能（权限管理、SSO、监控等），同时支持广泛的模型和后端的灵活配置。无论你是个人用户还是企业团队，都能找到适合自己的部署方式。

特别推荐它的RAG集成能力——上传文档后可以直接在对话中引用，支持多种向量数据库和搜索引擎，真正实现”个人AI知识库”的落地。如果你一直在寻找一个好用的本地LLM界面，Open-WebUI绝对值得一试。

下载地址
- GitHub仓库：https://github.com/open-webui/open-webui（105K+ Stars）
- 官方文档：https://docs.openwebui.com/
- 在线Demo：https://openwebui.com/
- Discord社区：https://discord.gg/5rJgQTnV4s
如果你觉得这个项目有帮助，欢迎到GitHub上点个Star支持开发者！
2026年6月16日
印度AI独角兽Sarvam获2.34亿美元融资，HCLTech领投1.5亿
2.34亿美元，估值15亿美元。印度班加罗尔的AI实验室Sarvam周一宣布完成新一轮融资，正式跻身独角兽行列。领投方不是哪家硅谷VC，而是印度本土IT巨头HCLTech——它一个人砸了1.5亿美元。

Sarvam成为印度最新AI独角兽，HCLTech领投1.5亿美元

全栈AI，这是印度人的打法

Sarvam的野心不小。它不像有些AI公司只做模型，或者只做应用，而是试图把整条栈都搭起来：从底层的AI模型，到中间的推理基础设施，再到面向企业的应用产品。这种”全栈”思路在印度市场尤其有意义——这里的企业客户喜欢”一站式解决方案”，不想分别找多家供应商拼起来。

更关键的是语言。Sarvam的模型专门为印度语言设计——印地语、泰米尔语、孟加拉语、 Telugu等等。印度有22种官方语言，真正能把多语言场景跑通的AI公司并不多。Sarvam的两位创始人Vivek Raghavan和Pratyush Kumar之前在IIT马德拉斯的AI4Bharat项目干活，那个项目就是专门研究印度语言的AI，背后有印度”数字化之父”Nandan Nilekani的支持。

HCLTech为什么舍得砸1.5亿

HCLTech是印度IT服务业的巨头之一，和TCS、Infosys一个级别。它投Sarvam不是财务投资，是战略卡位。IT服务公司的下一个战场是AI——谁能把AI能力打包进企业服务合同里，谁就能吃掉竞争对手的份额。

双方的计划很明确：把Sarvam的AI模型和HCLTech的企业客户关系、工程团队、软件资产拼在一起，给企业政府和政府客户做AI产品。HCLTech每年服务几百家全球500强企业，这个渠道价值不是钱能直接买的。

Anthropic禁令戳中了印度的痛处

就在上周，美国政府命令Anthropic切断外国公民对Fable 5和Mythos 5的访问权限。印度科技圈一下子慌了——OpenAI和Anthropic都把印度称为”第二大市场”，结果人家的模型说断就断。

这件事让”AI主权”从一个抽象概念变成了眼前的问题。Sarvam的价值，很大程度上就是它是”印度的”——不管美国政府发什么令，Sarvam的模型印度自己能控制。这种安全感，是OpenAI和Anthropic给不了的。

数据说话：Sarvam已经在跑

光有愿景不够，Sarvam的以下几组数据值得一看：
- 对话AI平台每天处理超过200万次交互
- 推理平台每天处理约1000万次API调用
- 语音模型每月转录超过50万小时音频
- 文档AI系统正在数字化超过3500万页档案
应用场景也在铺开。Sarvam的多语言语音代理已经为印度农业部收集了1700万农民的数据。一家大型保险公司用它的语音活动支持了4500万保单持有人的续保。还有一家大型金融科技公司，用Sarvam的AI代理平台支撑着一支35万人的销售队伍。

印度AI的窗口期

Sarvam不是印度唯一做AI模型的公司，但它可能是目前资金最充裕、落地最扎实的一家。挑战也一样明显：算力成本高、资本获取难，跟美国和中国那些融资动辄几十亿的对手比，Sarvam的资源还是紧的。

但印度市场的规模是真实的。OpenAI和Anthropic都把印度当第二大市场，这说明需求在那里。Sarvam如果能把自己的模型能力、HCLTech的渠道、以及印度政府对”数字主权”的诉求这三件事拼起来，它不一定需要追上GPT-5，只要在印度市场足够好用，就是一门大生意。

📎 原文来源：TechCrunch – Sarvam becomes India’s newest AI unicorn with 34 million funding round led by HCLTech
2026年6月15日
Salesforce砸36亿美元买下Fin，AI客服大战打响了

36亿美元，这不是一笔小收购。Salesforce周一宣布将AI客服平台Fin收入囊中，创下近年来企业服务软件领域最大的AI并购记录。Fin的前身是Intercom——那个你可能在无数网站右下角见过的在线聊天插件。但今天的Fin已经不是当年的Intercom了。

Salesforce以36亿美元收购AI客服平台Fin，加码Agentforce战略

从聊天插件到AI代理，Fin走了十年

Fin的创始人Eoghan McCabe是个有意思的人。他曾经离开自己创立的Intercom，又在2020年杀回来重掌CEO大位。这次收购完成后，他发了一条X（Twitter）帖子，语气很稳——”我还会继续当CEO，Des继续管研发，事实上没什么会改变”。

但实质上改变已经发生了。Fin最核心的产品是一个AI代理，能同时处理实时聊天、WhatsApp、短信、电话、Slack等多个渠道的客户询问。它不只是回答问题，而是真正”解决”问题——查订单、办退款、改地址，这些以前需要人类客服出面的事，Fin的AI代理现在可以自己搞定。

Salesforce为什么现在出手

答案藏在Agentforce里。这是Salesforce去年推出的企业AI代理平台，让企业可以搭建自己的自定义AI代理来自动执行任务。但Agentforce更多是”平台”定位——你得懂怎么用它。Fin的价值在于，它已经把”平台能力”包装成了”开箱即用的客服解决方案”。

Salesforce CEO Marc Benioff在声明里说：”Fin带来了经过验证的代理技术，对客户成功的深度承诺，以及一个不可思议的AI团队，他们将用强大的服务代理能力来补充Agentforce。”

说白了，Salesforce买Fin不是为了技术——Fin的技术他们自己也能做。真正买的是Fin已经跑通的客户场景、已经建立的品牌认知，以及那批真正懂AI客服的工程师和产品人。

36亿值不值

这个数字让很多人倒吸一口凉气。但换个角度看，企业AI客服市场的盘子正在以每年30%以上的速度扩张。Fin的竞争对手包括Zendesk的AI助手、Ada、甚至Salesforce自己平台上的第三方插件。收购Fin等于直接消灭了一个有威胁的竞争对手，同时把它的客户群一把捞过来。

交易预计在Salesforce 2027财年第四季度完成——按他们的财报周期算，其实就是2027年初。时间还早，但消息一出，业界已经在猜测：是不是更多AI客服初创公司要被盯上了？

Fin最近还憋了两个大招

McCabe在收购声明之外的X帖子裡透露，Fin recently shipped了两个重要产品：一个叫Apex的新模型，还有一个叫Operator的”内部代理”——这个词值得玩味，”internal agent”可能意味着Fin的AI不只是对外服务客户，还可以帮企业内部员工处理工作流程。

有了Salesforce的资源，这些产品的迭代速度只会更快。对小客户来说可能是好事——大平台的补贴能让先进的AI客服能力降价普及。但对Zendesk、Ada这些独立玩家来说，压力是实实在在的。

📎 原文来源：TechCrunch – Salesforce acquires AI customer service platform Fin for .6 billion

2026年6月15日
把手机举到耳边就能实时翻译：Google把70种语言塞进了你的电话
Google Translate刚上线的时候，你把一句话敲进去，等两秒，它给你吐出来一段有时候对有时候不对的文字翻译。二十年过去，Google的翻译引擎已经每个月为几十亿用户处理超过一万亿个单词。现在他们想把「实时语音翻译」也做成每个人随手就能用的东西。

不等你说完就开始翻

Gemini 3.5 Live Translate是Google最新的语音翻译模型，支持70多种语言。最关键的部分是：它不像老一代翻译App那样等你把一句话说完才开工。它是连续生成的，边听边翻，延迟只有几秒钟，语气和节奏都尽量贴合说话的人。

把手机举到耳边，就像接电话一样听翻译 (图片：AI生成)

最有趣的功能是Android上的「聆听模式」：你把手机举到耳边，就像接电话一样，翻译好的语音就从听筒里直接出来。不用戴耳机，也不用举着手机让别人看到屏幕。Google说这个功能在你想快速听翻译、又不想让别人听见的时候特别有用——比如在国外旅游听到导游讲解，或者在异国他乡的商店里和店主砍价。

「只需把手机举到耳边，就像一通普通电话，翻译好的语音就直接流进你的耳朵。」

从5种语言到70种

Google Meet也在用这个模型。以前Meet的翻译功能只支持5种语言，而且只能译成英文或者从英文译出。现在换成3.5 Live Translate之后，一口气的70多种语言、2000多种语言组合都能在会议里实时互译。这个功能这个月开始向部分企业Google Workspace客户开放私测。

Grab也在测试这个模型。他们平台上每个月有超过1000万通语音通话，主要是司机和乘客之间的。两边经常说不同的语言，实时翻译能直接帮上忙。

所有生成的语音都打了SynthID水印——这是Google开发的一种几乎听不出来的音频水印，用来标记这段内容是AI生成的，防止被人拿来造谣。

在哪里能用？
- Google Translate App（Android和iOS）——已全球推送
- Gemini Live API —— 开发者公测版
- Google Meet —— 部分企业客户私测中
- Android「聆听模式」—— 正在逐步推送
这篇文章其实没什么深奥的道理可讲。就是Google把一样东西做得更好、更顺手了。你要真想知道它翻译得准不准，最好的办法是找个说外语的朋友，面对面试试。

📎 原文来源：Google Blog – Gemini 3.5 Live Translate is here | The Verge 报道
2026年6月15日
AI Agent正在变成员工，这家公司拿了6600万美元帮企业管「数字员工」
Goldman Sachs去年把AI编程代理Devin当作新员工来测试，McKinsey今年早些时候说他们已经有25000个AI代理和60000名人类员工一起工作。当AI代理真的变成「员工」，一个没人认真想过的问题就摆在了桌面上：你怎么给一个软件发工牌、管权限、还能在它出错的时候把它「开除」？

从stealth模式走出来的NewCore

纽约网络安全创业者Zohar Alon认为，现有的企业身份系统撑不住这个未来。他创办的NewCore今天从stealth模式走出来，拿了6600万美元种子轮融资，估值3亿美元。领投的是专注网络安全的风投Cyberstarts，Index Ventures和Evolution Equity Partners跟投。

AI代理身份管理正成为企业安全新前线 (图片：AI生成)

Alon不是第一次创业。他之前创办了云安全公司Dome9，后来卖给了Check Point。他说，AI代理的规模和复杂度会把那些用了15到20年的老身份平台「撑爆」。

「我们很确定，AI代理给那些15年、20年历史的身份平台所增加的规模和复杂度，会把它们搞崩。」Alon对TechCrunch说。

AI代理也该有「工牌」

NewCore的平台把人类员工和AI代理放在同一个系统里管理。他们的核心论点是：AI代理应该被当作「一等公民」来对待——有自己的权限、生命周期控制和撤销机制，而不是混在传统的服务账户或机器凭证里蒙混过关。

他们的「分键」架构把关键身份凭证分成两份，分别存在客户和平台那里。这样做的目的是消灭单一泄露点——就算平台被攻破，攻击者拿到的也只是不完整的一半密钥。

NewCore还给Claude Code、OpenAI Codex、Cursor这些编程助手提供了「Agentic Skill」集成包，让AI工具以受管理的身份访问企业系统，而不是靠人工分发的凭证来凑合。

更实用的部分是一个移动App：人类员工可以用它来审批、查看和撤销AI代理的权限。Alon把它叫做「人类监督层」。当公司有几十个甚至几百个AI代理在自主运行的时候，总得有人能随时拔插头。

AI代理数量会超过人类员工？

NewCore目前在美国和以色列有50多名员工，平台有不到10个付费客户和10多个设计伙伴。今年夏天开始收费。

TCS董事长最近说，AI代理的数量最终可能赶上这家印度IT服务公司的人类员工总数。Alon预测，在科技公司里，AI代理在几年内就会超过人类员工的数量。

「这是不可避免的。问题是我们要不要在来得及的时候把护栏建好。」——Zohar Alon

Okta和微软的Entra这些老牌身份提供商也在往自己的平台里加AI代理功能。但Alon认为那些都是在为人类员工设计的平台上打补丁，而NewCore是从零开始为「人类+机器+AI代理」混合 workforce 建的。
- NewCore种子轮6600万美元，估值3亿
- 平台统一管理人类员工和AI代理身份
- 「分键」架构防止单一泄露点
- 移动App让人类监督AI代理权限
- 今年夏天开始向客户收费
📎 原文来源：TechCrunch – As AI agents become employees, NewCore emerges with $66M to give them identities
2026年6月15日
白宫怀疑中国碰了Mythos，Anthropic模型安全再爆争议

白宫怀疑中国碰了Mythos，Anthropic模型安全再爆争议

Anthropic的Mythos模型又出问题了。这次不是因为模型本身有多危险，而是因为白宫怀疑——一个有中国背景的团体，可能已经碰过它了。

根据Semafor的报道，白宫之所以在6月初下令限制外部人员访问Anthropic的Mythos 5和Fable 5，部分原因就是对”中国获取模型”的担忧。如果中国政府真的拿到过Mythos 5或Fable 5的访问权限，这就是一个严重的国家安全风险——中方完全可以通过”蒸馏”技术，用这个强大模型来训练自己的”学生模型”，复制出类似的能力。

白宫怀疑中国访问了Anthropic的Mythos模型，模型安全再成焦点

白宫没确认，但这件事已经够呛

白宫到目前为止没有确认这份报道，特朗普的顾问David Sacks在X上发帖解释政府决定时，也没有提到中国，只说了Fable和Mythos存在被”越狱”的风险（这件事Anthropic自己是否认的）。Anthropic方面也没有回复媒体的询问，不过一个有意思的细节是：一位发言人对Semafor说，政府在与他们讨论出口管制时，并没有提起中国这件事。

这就留出了一个解释空间：是中国真的访问过，还是这只是白宫内部某些人的担忧被泄露给了媒体？目前没有人知道确切答案。

但这件事如果属实，那它不会是Mythos第一次在安全问题上报丑闻。Anthropic一直说Mythos太危险、太强大，不能对公众开放。但就在不久前，一个Discord群组被曝光曾经拥有Mythos的访问权限，而且持续了两周，Anthropic才发现并切断了访问。那次事件被媒体形容为Anthropic的” humiliation”——一家以安全为核心卖点的公司，自己的最强模型却被一帮网友先玩上了。

Semafor报道称，白宫对Mythos的出口限制，部分原因是对中国获取模型的担忧。如果属实，这不会是Mythos第一次出现未经授权访问的安全事件。

Anthropic在政府关系上越走越复杂

把这两件事放在一起看，一个图案开始浮现：Anthropic在政府关系上越走越复杂。一方面，它要把模型卖给药企、能源公司这些受监管行业的客户，需要证明自己”安全可控”；另一方面，一旦牵扯上国家安全，它就得听从政府的出口管制指令，把大批海外用户挡在门外。上一次政府下令限制访问，印度科技圈炸了锅，不少人呼吁赶紧搞开源替代品。这一次如果”中国访问”的怀疑持续发酵，Anthropic面临的压力只会更大。

对美国政府来说，这件事的底层焦虑很真实：AI军备竞赛里，模型能力就是战略资源，不能让别人轻易拿到。但Anthropic毕竟是商业公司，不是国家实验室，它要在全球市场卖产品，就得在”安全”和”开放”之间找平衡。这个平衡现在看起来越来越难找了。

接下来值得关注的是，Anthropic会不会因为这件事进一步收紧模型访问政策。如果”中国访问”的怀疑被证实，那不只是Anthropic一家的事——整个美国AI行业都可能面临更严格的出口管制审查。而对于中国的AI实验室来说，这也是一个信号：想要拿到最先进的模型，不能靠”碰”，得靠自己做出来的。

📎 原文来源：China may have accessed Mythos | The Verge

2026年6月15日
AI管人这件事，终于轮到一线员工了

AI管人这件事，终于轮到一线员工了

大多数人听到”AI取代工作”这个话题，第一反应都是焦虑。但有一家叫Orbio的初创公司，思路正好反过来——它要用AI来管人，而且管的还是那些平时最不会被科技界注意到的群体：一线员工。

Orbio的三个联合创始人里，CEO Sergi Bastardas在亚马逊和鲜花电商Colvin待了十年。他有一个反复出现的感受：背后支撑业务的那些人——在病房里、在餐厅后厨、在物流仓库里干活的人——一直缺乏高效的”人力基础设施”来管理。这些人有27亿之多，遍布医疗、零售、物流和酒店行业，大多数人连企业邮箱都没有，更别提被科技工具认真对待了。

Bastardas在2025年拉着两个联合创始人Nacho Travesí和Antonio Melé，把这种感受做成了一家公司。Orbio做的事不难理解：用AI代理来帮企业招人、入职、管理一线员工。

Orbio用AI代理管理一线员工招聘与入职流程

三个AI代理，管招人管入职还管日常

具体是怎么做的？他们开发了三个AI代理，名字分别叫Maria、Daniel和Claire。Maria负责面试候选人，评估匹配度；Daniel跟进员工入职后的产出表现；Claire做日常打卡和沟通。三个代理不是孤立运行的——Maria面试时收集到的信号会反馈给招聘质量评估，员工离职面谈里透露的原因会重新校准招聘标准，日常参与度数据能提前识别离职风险。

这个思路听起来有点赛博朋克，但实际落地已经有客户了。Orbio公布的信息显示，百胜集团（旗下有必胜客、塔可钟、肯德基）和餐饮品牌Poke已经在用这套系统来入职和管理一线员工。行为健康服务供应商The Stepping Stones Group更直接——Orbio现在跑通了它在美国的全部业务运营，而且入职成功率比以前高了20%。

行为健康服务供应商The Stepping Stones Group现在用Orbio运行其全美业务，入职成功率提升了20%。

2600万美元，盯上27亿人的”AI时刻”

Orbio刚宣布完成2100万美元的A轮融资，领投方是Dawn Capital。加上这轮，公司总融资额已经达到2600万美元。Bastardas说，新钱主要用来招人和开发更多AI代理。

这件事有意思的地方在于，它把AI应用的战场从”白领桌前”搬到了”一线现场”。之前AI招聘工具主打的是简历筛选、程序员笔试这类场景，对象是有邮箱、会用LinkedIn的白领。Orbio盯上的，是那27亿没有被传统企业软件覆盖过的人。

竞争对手当然有。Paradox在做招聘自动化，WorkJam在做一线员工管理。但Bastardas觉得最大的对手不是某家初创公司，而是”老办法”——医疗、零售、物流这些行业里，管人的方式至今还是表格加电话，碎片化得厉害。

接下来会怎么演变，现在还不好说。但Bastardas的一句话挺值得记住：”这是27亿人的AI时刻。”这些人撑着医疗、零售、物流和酒店行业在运转，之前从来没有被科技认真对待过。现在，AI终于轮到他们了。

📎 原文来源：Orbio raises $21 million to automate hiring and onboarding for frontline workers | TechCrunch

2026年6月15日

【开源推荐】aisuite：14.5K+ Stars！Andrew Ng 出品，一行代码切换 14+ 个 AI 大模型

🚀 aisuite

Simple, unified interface to multiple Generative AI providers

⭐ 14,500+ Stars | 🍴 1,500+ Forks | 🐍 Python | 📜 MIT License

📌 项目简介

aisuite 是 Andrew Ng（吴恩达）团队开源的轻量级 Python 库，通过一套统一 API 接口同时调用 OpenAI、Anthropic、Google、Mistral、AWS、Ollama 等 14+ 个 AI 大模型提供商。只需修改一个字符串即可切换模型，彻底告别各家 SDK 差异带来的适配噩梦。

该项目采用两层架构：底层是统一 Chat Completions API（兼容 OpenAI 格式），上层是带工具调用的 Agents API。同仓库还包含基于 aisuite 构建的桌面 AI 助手 OpenCoworker。

⚙️ 安装要求和过程

环境要求

Python 3.9+
各 AI 提供商的 API Key（或本地 Ollama）
磁盘空间：约 50MB（基础包）

快速安装（3步）

# 基础安装（不含提供商 SDK）
pip install aisuite

# 安装时附带指定提供商的 SDK
pip install 'aisuite[anthropic]'
pip install 'aisuite[openai]'
pip install 'aisuite[google]'

# 安装所有提供商 SDK（完整版）
pip install 'aisuite[all]'

API Key 配置

# 设置环境变量（Linux/macOS）
export OPENAI_API_KEY="sk-your-key"
export ANTHROPIC_API_KEY="sk-ant-your-key"

# Windows PowerShell
$env:OPENAI_API_KEY = "sk-your-key"
$env:ANTHROPIC_API_KEY = "sk-ant-your-key"

✨ 核心功能

① 统一 Chat Completions API —— 一行切换模型

模型名格式 <provider>:<model-name>，修改一个字符串即可在不同提供商之间切换，所有核心参数（temperature、max_tokens、tools 等）均为提供商无关。

② Agents API —— 让模型使用真实工具

传入普通 Python 函数即可获得工具调用能力，aisuite 自动生成 JSON Schema、执行函数调用、将结果反馈给模型。max_turns 参数控制多轮对话，也可手动控制每一轮。

③ Toolkits —— 开箱即用的工具集

内置 files（文件操作）、git（版本控制）、shell（命令行）等工具集，也可接入任意 MCP 服务器，让 Agent 获得文件系统、浏览器自动化等真实能力。

④ 生产级 Agent 管控

支持 Tool Policies（工具调用审批策略）、State Stores（跨进程持久化对话状态，支持内存/文件/Postgres）、Artifacts & Tracing（完整记录 Agent 产出和每一步执行轨迹）。

⑤ OpenCoworker —— 开箱即用的桌面 AI 助手

同仓库附赠 OpenCoworker 桌面应用（macOS/Windows），能聊天、做深度研究、读写文件、收发消息（Slack/Email）、生成 PDF 报告，并支持定时自动化任务（如每日新闻摘要）。数据完全留在本地。

🎯 典型使用场景

场景一：多模型对比评测

研究人员可以用同一段代码，分别调用 GPT-4o、Claude 3.5 Sonnet 和 Gemini Pro，对比不同模型在同一 Prompt 下的响应质量，而无需维护三套 SDK 调用代码。aisuite 让 A/B 测试大模型 变得极其简单。

场景二：构建支持多提供商的 AI 产品

SaaS 产品需要同时支持 OpenAI 和 Anthropic，或允许用户选择自己偏好的模型。使用 aisuite，产品代码只需维护一套接口，后端根据配置动态路由到不同提供商，大幅降低维护成本。

场景三：本地 + 云端混合部署

开发阶段使用免费本地模型 Ollama，上线后切换到 OpenAI API。aisuite 让这种切换只需改一个字符串（"ollama:llama3" → "openai:gpt-4o"），无需改动任何业务逻辑代码。

💡 推荐理由

Andrew Ng 亲自站台的项目，质量有保障。我推荐它的核心原因是它解决了一个真实存在的痛点：每家 AI 公司的 API 都不一样。OpenAI 用一套格式，Anthropic 用另一套，Google 又是另一套……如果你要同时支持多家，代码里全是 if provider == "openai" 这种恶心的判断逻辑。

aisuite 把这一切统一了。它的 API 设计完全兼容 OpenAI 的 Chat Completions 格式，其他提供商只是”适配层”，对使用者完全透明。这种设计意味着你现有的 OpenAI 代码几乎不用改，就能无缝迁移到 Claude 或 Gemini。

更让人惊喜的是它的 Agents API 设计——传入普通 Python 函数就能让模型调用工具，不需要手写 JSON Schema。加上对 MCP（Model Context Protocol）的原生支持，未来接入各种工具生态会很方便。

如果你正在做 AI 应用开发，或者需要对比评测多个大模型，aisuite 是目前最优雅的解决方案，没有之一。

📥 下载地址

🌐 官方网站：
github.com/andrewyng/aisuite

📦 PyPI：
pypi.org/project/aisuite

💻 快速安装：
pip install aisuite

📚 文档：
github.com/andrewyng/aisuite/docs

💬 Discord 社区：
discord.gg/T6Nvn8ExSb

🔌 支持的 AI 提供商

提供商	模型示例	调用格式
OpenAI	`gpt-4o, gpt-4-turbo`	`openai:gpt-4o`
Anthropic	`claude-3-5-sonnet`	`anthropic:claude-3-5-sonnet-20240620`
Google	`gemini-pro, gemini-1.5-pro`	`google:gemini-pro`
Mistral	`mistral-large, mixtral-8x7b`	`mistral:mistral-large`
Ollama（本地）	`llama3, mistral, codellama`	`ollama:llama3`
AWS Bedrock	`anthropic.claude-3-5-sonnet`	`bedrock:anthropic.claude-3-5-sonnet`
Hugging Face	`任意 HF 模型`	`huggingface:model-name`

📅 文章发布时间：2026 年 6 月 15 日

⭐ GitHub：github.com/andrewyng/aisuite

📜 开源协议：MIT License（可自由用于商业和非商业项目）

2026年6月15日

六月AI大模型”挤爆了”：GPT、Claude、Gemini、Grok扎堆发布

2026年6月，AI大模型迎来史上最密集的发布潮

2026年6月，AI圈有点挤。往常一家头部公司发新模型，行业得消化好一阵；这个月倒好，OpenAI、Anthropic、Google、xAI四家差不多同时亮剑，GPT-5.6、Claude Sonnet 4.8、Gemini 3.5 Pro、Grok 5扎堆亮相，上下文窗口一口气推到150万Token。有人开玩笑说，AI圈的六月像双十一预售——不约而同，就怕自己晚一步。

意外曝光的”后台日志”

这一波发布潮，最早是从”泄露”开始的。今年4月下旬，有开发者发现OpenAI Codex的后台日志里短暂出现了一个陌生代号——GPT-5.6。没过几天，Claude Code的源码里也被人扒出了Claude Sonnet 4.8和另一个叫Jupiter V1的内部模型代号。

两家公司都没官宣，但开发者社区已经炸了。评论区最高的赞只有一句话：”When launch？” 从GPT-5.5发布到5.6现身，中间只隔了一个多月。大模型迭代周期从”数月”缩短到”数天”，AI军备竞赛的节奏已经完全不一样了。

四家同时亮剑，打的什么算盘？

Google的Gemini 3.5 Pro走的是”长上下文”路线，150万Token的窗口意味着你可以把一整本书丢进去，还能接着对话。这个方向很Google——他们有搜索基础设施的底子，处理超长文本本来就是强项。

Anthropic的Claude Sonnet 4.8继续在”安全”和”可控”上做文章，面向企业用户的味道很浓。OpenAI的GPT-5.6则更像在补全5.5没做完的事——据泄露出来的信息，5.6在代码能力和多模态理解上有明显提升。

马斯克的Grok 5是最难预测的。xAI的数据中心折腾了好几个月（SpaceX的Colossus 1因为延迟问题租给了Anthropic和Google），但Grok 5如果准时出来，打的就是”实时信息”这张牌——毕竟Grok直接接Twitter/X的 firehose，这是其他家都没有的数据优势。

国产阵营也没闲着。Qwen3.6、GLM-5.1、Kimi也在6月前后密集更新，而且走的是开源路线。国际市场打性能，国内市场打价格+开源，两边都在抢时间窗口。

模型越强，商业越难

密集发布背后有一个不那么显见的问题：模型能力越来越强，但怎么赚钱反而越来越难。Gemini 3.5 Pro的150万Token上下文听起来很厉害，但每次推理的计算成本也跟着涨。GPT-5.6能力更强，但不降价就没人用，降价就亏本——这是所有头部玩家都在面对的困局。

一个正常的月份里，一家发新模型就够行业消化一阵了。但2026年6月，我们迎来的是四家同时发布。这不是巧合——大家都在抢同一个时间窗口，抢同一批企业客户，抢同一批开发者的注意力。挤就挤吧，用户倒是有的挑了。

📎 相关信息：GPT-5.6与Claude Sonnet 4.8泄露分析、June 2026 AI Model Release Tracker

2026年6月15日
科技公司利润创纪录却在裁人，AI成了最好的借口

科技公司里正在发生一件很诡异的事情。一边是财报上的数字节节攀升，利润、营收接连创纪录；另一边却是成千上万的人被请出门，而官方理由清一色写着”AI”。

求职平台TrueUp的数据很直观：今年以来科技公司已经发生了363起裁员，受影响的人接近15万，相当于每天近千人失去工作，速度比去年同期快了44%。上个月的单月裁员数更是创了两年来新高，接近4万人，而AI已经是全行业被提及最多的裁员理由，连续三个月都是如此。

AI是真相还是遮羞布？

越来越多的质疑声在问：AI真的就是那个原因吗？还是说，它只是一个特别好用的借口？

支付公司Block的CEO Jack Dorsey今年早些时候裁掉了将近一半员工，随后被骂上热搜。他的解释是AI工具正在改变公司运作方式，但转眼又被网友翻出他在疫情期间过度招聘的证据——说白了，Block就是招多了，AI只是个好用的遮羞布。

知名VC Marc Andreessen最近也忍不住说了大实话。他在播客里直言，几乎所有大公司都人满为患，至少多招了25%，有些甚至多了75%。以前没有办法，现在好了，有了AI这个”银弹借口”，裁人变得理直气壮。

Uber本月初的小动作也很说明问题。他们裁掉了HR和招聘部门约23%的人，公司发言人赶紧出来澄清：这跟AI没关系。但就在一个月前，Uber的CTO还在内部会议上承认，公司2026年的AI编程预算在四个月内就烧光了，不得不给每个工程师设消费上限。你猜大家信哪个版本？

造富与裁员的双重叙事

这边厢大裁员，那边厢AI圈的钱却在以难以想象的速度聚集。

Cerebras上个月上市，首日股价暴涨68%，两位联合创始人直接跻身亿万富翁行列。SpaceX上周五上市，市值站上2.1万亿美元，马斯克成了全球首位”纸面万亿富翁”，估计还造出了4400位百万富翁。Anthropic和OpenAI也在排队IPO，估值各自奔着1万亿美元去。

扎克伯格今年3月花1.7亿美元在迈阿密”亿万富翁地堡”买了一栋豪宅，创下当地史上最贵房屋交易纪录。两个月后，Meta宣布裁员8000人，约占全部员工的10%。

但这些极端财富故事出现的时候，普通美国人正在经历多年来最紧的日子。今年雇主医保保费涨了6-7%，是通胀速度的两倍多；私人医保费用自2008年以来翻了一倍；房价自2020年初涨了28%，房贷利率也翻了近一番。最新民调显示，76%的美国人把”生活成本”列为最担心的经济问题。

这次跟2008年不一样

这种贫富分化的剧本，上一次这么清晰还是2008年。那一次，华尔街搞出来的金融危机，最后结果是银行拿了救助，几百万人丢了工作和房子，愤怒在三年后凝结成”占领华尔街”运动。

但如果眼下的趋势继续，2008年可能还算温和的。占领华尔街至少有个危机可以指——银行搞砸了，大家看得很清楚。这一回，没有崩盘可以怪。公司们在赚钱，AI本身在造富，裁员照样发生，理由就是AI。

2008年的叙事是”我们救助搞砸经济的人，你却丢了工作”；这一回的叙事可能是”我们靠用来取代你的这项技术，赚到了前所未有的钱”。后者的火药味，显然要浓得多。

很多公司——Block、Atlassian、Cloudflare——在提到AI时股价都会涨，所以这个策略能理解。但还是值得想一想：当你用AI当理由裁掉一批人时，你对外发出的信号到底是什么？

📎 原文来源：The AI layoff wave is becoming a powder keg — TechCrunch

2026年6月15日

标签： AI

项目简介

安装要求和过程

环境要求

快速安装步骤

核心功能

典型使用场景

场景一：个人本地AI助手

场景二：团队协作AI平台

场景三：AI应用开发测试

推荐理由

下载地址

全栈AI，这是印度人的打法

HCLTech为什么舍得砸1.5亿

Anthropic禁令戳中了印度的痛处

数据说话：Sarvam已经在跑

印度AI的窗口期

从聊天插件到AI代理，Fin走了十年

Salesforce为什么现在出手

36亿值不值

Fin最近还憋了两个大招

不等你说完就开始翻

从5种语言到70种

在哪里能用？

从stealth模式走出来的NewCore

AI代理也该有「工牌」

AI代理数量会超过人类员工？

白宫怀疑中国碰了Mythos，Anthropic模型安全再爆争议

白宫没确认，但这件事已经够呛

Anthropic在政府关系上越走越复杂

AI管人这件事，终于轮到一线员工了

三个AI代理，管招人管入职还管日常

2600万美元，盯上27亿人的”AI时刻”

📌 项目简介

⚙️ 安装要求和过程

环境要求

快速安装（3步）

API Key 配置

✨ 核心功能

🎯 典型使用场景

💡 推荐理由

📥 下载地址

🔌 支持的 AI 提供商

意外曝光的”后台日志”

四家同时亮剑，打的什么算盘？

模型越强，商业越难

AI是真相还是遮羞布？

造富与裁员的双重叙事

这次跟2008年不一样