作者: hiyoho

  • 【开源推荐】Open WebUI:142K+ Stars!自托管 AI 聊天界面,隐私优先的本地大模型前端

    【开源推荐】Open WebUI:142K+ Stars!自托管 AI 聊天界面,隐私优先的本地大模型前端

    Open WebUI

    Open WebUI – 自托管 AI 聊天界面

    📦 项目简介

    Open WebUI 是一个用户友好的自托管 AI 界面,支持 Ollama、OpenAI API 等多种 LLM 服务,可完全离线运行。它提供了类似 ChatGPT 的优雅聊天体验,同时保障数据隐私,是企业和个人部署本地 AI 能力的首选前端方案。

    ⭐ 142K+ Stars
    🍴 20.3K+ Forks
    🐍 Python + Svelte
    📦 Docker 一键部署

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.11(pip 安装方式必须使用此版本)
    • Docker(推荐,最简单)
    • Ollama(如需本地模型,可选)
    • 磁盘空间:至少 2GB(含依赖和模型)

    方式一:Docker 安装(推荐)

    # 基础安装(Ollama 在本地)

    docker run -d -p 3000:8080 \
      –add-host=host.docker.internal:host-gateway \
      -v open-webui:/app/backend/data \
      –name open-webui –restart always \
      ghcr.io/open-webui/open-webui:main

    # 内置 Ollama(CPU)

    docker run -d -p 3000:8080 \
      -v ollama:/root/.ollama \
      -v open-webui:/app/backend/data \
      –name open-webui –restart always \
      ghcr.io/open-webui/open-webui:ollama

    方式二:Python pip 安装

    pip install open-webui
    open-webui serve

    ⚠️ 注意:必须使用 Python 3.11,避免兼容性问题!

    安装完成后访问 http://localhost:8080 即可使用。

    ✨ 核心功能

    🤖 1. 多模型兼容

    原生支持 Ollama、OpenAI 兼容 API,可对接 LMStudio、GroqCloud、Mistral、OpenRouter 等第三方服务。支持同时调用多个模型,获取最优输出结果。

    📚 2. RAG 检索增强生成

    支持 9 种向量数据库(ChromaDB、PGVector、Qdrant 等),多种内容提取引擎。可上传文档到知识库,通过 # 命令快速调用文档内容,打造私人知识助手。

    🔍 3. 联网搜索能力

    支持 15+ 搜索引擎(SearXNG、Google PSE、Brave Search 等)的 RAG 联网搜索,可直接输入 URL 引用网页内容到对话中,让 AI 获取实时信息。

    🎨 4. 多模态交互

    支持语音/视频通话,集成多种语音转文字、文字转语音引擎。支持图像生成与编辑,可对接 DALL-E、Gemini、ComfyUI、AUTOMATIC1111 等引擎。

    🔧 5. 企业级管理能力

    支持基于角色的访问控制(RBAC)、LDAP/AD 认证集成、SSO 单点登录。数据库支持 SQLite 和 PostgreSQL,存储可对接 S3、Azure Blob,支持水平扩展。

    🚀 典型使用场景

    场景一:个人本地 AI 助手

    搭配 Ollama 使用,在本地运行 Llama 3、Mistral、Gemma 等开源模型。所有对话数据完全离线,保障隐私安全。无需联网,随时随地使用 AI 助手。

    场景二:企业内网 AI 中台

    通过 Open WebUI 搭建企业内部 AI 平台,对接公司私有 LLM API 或本地部署的开源模型。支持用户权限管理、对话历史保存、知识库共享,让团队成员安全高效地使用 AI。

    场景三:RAG 知识库问答

    上传公司文档、技术手册、FAQ 到 Open WebUI 知识库,即可通过对话快速检索相关内容。支持 PDF、Word、Markdown 等多种格式,结合 RAG 技术实现精准问答。

    💡 推荐理由

    Open WebUI 是我见过最优雅的自托管 AI 界面。如果你在本地用 Ollama 跑模型,或者想给企业搭一个私有的 AI 聊天平台,Open WebUI 几乎是不二之选

    它的体验非常接近 ChatGPT——响应式界面、Markdown 渲染、代码高亮、多会话管理,一应俱全。但更重要的是数据主权:你可以让所有 AI 交互发生在自己的服务器上,不用担心对话记录被第三方留存。

    另外,它的 RAG 知识库联网搜索功能非常实用,让本地模型也能获取实时信息和私有文档内容。如果你关心 AI 隐私和数据安全,Open WebUI 值得一试。

  • 智谱GLM-5.2发布:MIT协议全面开源,跑分对标Opus 4.5

    从5.0到5.2,智谱只用了四个月

    智谱GLM-5.2开源AI模型
    开源AI模型正在快速追赶闭源商业模型

    2026年2月,智谱发布GLM-5,当时打出的旗号是”从Vibe Coding到Agentic Engineering”,代码和工程上下文能力被放到了最前面。不到三个月,5.1来了,主打智能体。又过了一个多月,5.2在6月13日凌晨推送,这次的亮点不是能力升级这么简单——是所有用户免费、API接口开放、模型权重以MIT协议全面开源。

    MIT协议意味着什么?简单说,你拿这个模型做任何事情,包括把它塞进你的商业产品里去卖钱,都不用给智谱交一分钱,只需要保留版权声明,不用开源你自己的代码。这是开源协议里最宽松的一种。

    智谱选择MIT协议开源GLM-5.2,等于把这个模型的使用权交给了所有人。开发者没有使用限制,可以用任何方式部署。

    跑分到底怎么样?

    消息发布几个小时后,已经有用户在社交平台上反馈:”跑分和Opus 4.5差不多,速度也够。”Opus 4.5是Anthropic的旗舰模型,能做到”跑分差不多”这个水平,加上MIT协议开源,这件事的意义不只是智谱又发了一个新模型。

    它意味着开源生态正在缩小与闭源商业模型之间的差距,而且缩小的速度比很多人预期的要快。几个月前,大家还在讨论开源模型能不能追上GPT-4级别的能力;现在,GLM-5.2已经把目标对准了Opus 4.5。

    开源之后的玩法变了

    智谱不是第一家把大模型开源的公司,但它是少数几家既做得出有竞争力的模型、又愿意用最宽松的协议开源的公司之一。Meta的Llama系列也是开源的,但Meta的开源带着自己的算盘——通过开源建立生态,巩固自己的地位。智谱的MIT协议,没有这些附加条件。

    这对开发者来说是个好消息。以前要用上Opus级别的能力,每月至少要掏几十美元订阅Claude;现在,懂一点部署的人可以把GLM-5.2跑在自己的服务器上,成本只是显卡和电费。

    当然,开源不等于每个人都能用上。部署一个大模型需要不少算力和技术门槛,这不是普通用户点个按钮就能搞定的事。但门槛在降低,这是确定的。智谱同时发布了ZCode 3.0,每天给300万token的免费额度,就是为了让更多人能直接体验到GLM-5.2的能力。

    从2月的5.0到6月的5.2,智谱的迭代节奏很快。这种速度能不能持续,模型能力能不能稳定地往上走,还需要更多时间验证。但至少现在,开源AI的版图里,又多了一个不能忽视的名字。


  • 前a16z合伙人发飙:硅谷富豪正在用钱堵住AI监管的嘴

    一个风投老人的”反水”

    AI监管讨论
    AI监管走向,谁说了算?

    约翰·奥法雷尔在安德森·霍洛维茨(a16z)干了七年,今年1月离开的时候,大概率没想到自己会在《纽约时报》上公开骂老东家。

    他写的那篇专栏,核心意思很直接——他的前同事们正在用巨额财富压制关于人工智能监管的公开讨论。”人工智能不只是另一种技术,”他写道,”它可能把生产力推到新高度,也可能让数百万人的工作被自动化取代;它可能找到癌症的治愈方法,也可能加速我们还没准备好应对的生物风险;它可能改变孩子的学习方式,也可能让他们分不清真假;它还可能以让’镀金时代’都相形见绌的方式,把经济权力集中到极少数人手里。”

    “我们需要一场严肃的公共讨论:如何让AI造福所有人,而不是仅为少数富人服务。但眼下,这场讨论正被有钱人的噪音盖住。”

    钱是怎么堵住嘴的

    奥法雷尔没有直接点名所有目标,但字里行间指向的,是那些正在用政治捐款、游说和法律手段把AI监管挡在门外的人。a16z本身就是AI领域最活跃的投资机构之一,它的合伙人本就是这场游戏里的核心玩家。一个前合伙人跳出来批评,多少有点”盗号”的意思——但也正因如此,他的话才值得听。

    这话出来的时机也值得玩味。眼下正是AI监管在全球范围内最关键的时间窗口——欧盟的AI法案已经开始落地,美国的监管方向却因为政治周期而充满变数。硅谷的科技巨头们很清楚,现在如果不把监管的口子堵住,等舆论和立法跟上来,就晚了。

    良心觉醒,还是另一次自我营销?

    奥法雷尔没有在这篇文章里给出具体的监管方案,他的目的更像是在敲警钟:别让几个人的财富决定了所有人的未来。这话从一个刚从硅谷核心投资机构出来的人口里说出来,分量不一样。

    当然,也会有人质疑他的动机。离开a16z之后,他是不是在借攻击老东家来建立自己的公众形象?这很难说。但不管动机如何,他提出的核心问题——AI的走向到底由谁决定——是真实存在的。

    这篇文章在《纽约时报》发表之后,科技圈的讨论并不算多。可能是因为周末,也可能是因为大家不知道该怎么接这个话。一个前a16z合伙人的批评,到底是良心的觉醒,还是另一次的自我营销,可能只有他自己知道。但可以肯定的是,AI监管这个话题,不会因为他这篇文章就变得简单。


  • 苹果AI照片编辑工具:好用,但让人困惑什么叫照片

    WWDC 2026上苹果给了iPhone用户三件新玩具:AI清理、AI扩展画幅、还有个听起来很玄乎的”空间重新构图”。官方演示看得人心痒,但实际用起来怎么样?我花了一周时间折腾iOS 27开发者测试版,说说真实感受。

    苹果AI照片编辑工具演示
    iOS 27 的 AI 照片编辑工具,好用,但也有点让人不安(图源:The Verge)

    清理工具终于能用了

    先说最实用的——清理工具。这个东西其实去年就有了,但去年的版本说难听点就是个摆设。它只在设备端跑模型,算力有限,移除一个路人之后,补出来的背景经常怪得离谱,有时候干脆留一块马赛克一样的色块。我当时试了几次就放弃了。

    今年苹果做了个关键升级:清理工具现在可以调用云端更强的模型了。这个打法其实谷歌Pixel很早就在用,人家Magic Editor一直比苹果能打,核心原因就是云端算力和设备端算力的差距。苹果终于想通了。

    实测下来,清理2.0确实能打了。孩子鼻子上沾了东西?修掉。背景里有个路人抢镜?去掉。处理完你看不出明显破绽,这就够了。这个功能我估计会是iOS 27里使用率最高的AI特性,没有之一。

    扩展画幅,比想象中克制

    第二个功能是”扩展”——你可以把它理解成反向裁剪。拍的照片构图太紧,主体快贴边了,以前只能裁小,现在可以用AI往外”撑”一点,让画面松快些。

    苹果在这个功能上出奇地克制。它不会像三星早期那样疯狂脑补画面外的内容,而是找对称性、延续纹理,能不加就不加。我试了几次,它会在边桌上”脑补”出一盆植物,看起来挺像那么回事,但我知道那张桌子原来没有盆栽。

    克制是好事。但如果我把这张照片发到朋友圈,我自己知道那是AI补的,别人不知道——这个问题,苹果也没给出答案。


    最野心也最让人困惑的:空间重新构图

    第三个功能叫”空间重新构图”,是我觉得最有意思也最”危险”的一个。它利用了照片中的深度信息,让你像移动相机一样,微调拍摄视角。比如你拍的时候站得偏了,主体被挡了一点,现在可以”虚拟移动”一下,换个角度看看能不能救回来。

    想法很好,但执行起来问题不少。AI需要脑补你没拍到的部分——就像你拍了一张侧面的合影,AI要帮你”猜”被挡住的那个人长什么样。离原拍摄位置越远,AI需要脑补的内容就越多,画面就越容易进入”恐怖谷”。

    我试了一张自拍,用空间重新构图微调角度,结果我自己的脸看起来有点歪,说不上来哪里不对,就是”不像真的”。这种感觉很微妙——照片里的人是你,但又不完全是你。

    有一个细节值得说:用这些AI工具编辑过的照片,会被打上一个”Synth ID”标签,标明这张照片被AI动过。但这个信息藏得很深,要在Instagram里点开照片的”AI信息”菜单才能看到。而且,大多数人刷朋友圈的时候,不会去点那个菜单。

    我们在失去什么

    iOS 27的这些AI编辑工具,单看每个都挺好用。但把它们放在一起看,有一个更大的问题浮出来了:我们以前默认”手机拍的照片是真的”,这个默认信任,正在被一点点吃掉。

    苹果不是最大胆的玩家,谷歌和三星走得更快。但苹果的用户基数太大了,一旦这些功能随着iPhone普及开来,”照片可以被AI随意改写”这件事,就会从”少数人的玩具”变成”所有人的日常”。到那时候,我们再看别人发的照片,第一反应会是”这是真的还是AI修过的”?

    这个问题没有简单答案。但至少,苹果给了你一个工具——那个藏得很深的”AI信息”标签。用不用,怎么用,是你自己的选择。

  • Anthropic一纸禁令,把印度AI圈打醒了

    Anthropic上周五突然宣布,按照美国政府的要求,暂停旗下最新两款模型Fable 5和Mythos 5的所有外籍用户访问权限。消息一出,印度科技圈炸了锅。

    事情有点讽刺。就在这份声明发布前几天,Anthropic刚高调宣布和印度IT服务巨头塔塔咨询服务(TCS)达成合作,要在印度大规模推企业级AI。结果话音刚落,政府一道指令下来,最新模型的外籍访问直接被切了。印度这边刚准备大干一场,发现自己连”入场券”都被别人攥在手里。

    印度真的是第二大市场,但话语权为零

    Anthropic和OpenAI都公开说过,印度是它们仅次于美国的第二大市场。这个数字不是随便说说的——印度有几百万开发者、几十万家初创企业,企业数字化意愿又强,确实是AI公司眼里的肥肉。

    但这次事件把一个问题摆到了台面上:肥肉归肥肉,命脉捏在别人手里。华盛顿一句话,印度用户就用不上最新的模型了。而且有报道说,这次是亚马逊CEO安迪·贾西先向政府”打了小报告”,理由是安全担忧。白宫私下还指责Anthropic自己对越狱漏洞的处理一塌糊涂。Anthropic当然不服气,但服不服气不重要,指令已经下了。

    印度AI创业平台Activate的创始人Aakrit Vaish说得很直白:”这彻底改变了现状。”他周六早上看到声明的时候,又震惊又困惑。改变在于,印度的初创企业需要认真想一想了——依赖别人的模型,这条路到底还能走多远?

    不是钱的问题,是”能不能做出来”的问题

    有人说了,那印度自己做大模型不就行了?钱到位不就好了?

    前Infosys高管、投资人Mohandas Pai在X上发文,呼吁政府每年拿出5000亿卢比(约50亿美元)搞AI和深度技术,再加2万亿卢比的信贷担保支持云基础设施和半导体。这个规模比印度现有的”印度AI使命”大了好几倍——后者五年总投入才120亿美元。

    但光速创投的合伙人Hemant Mohapatra直接泼了冷水:做前沿大模型,最大的瓶颈不是钱,是人才、算力和执行力。训练一个前沿模型,少则几亿美元,多则几十亿美元,而且要有能把这些钱变成实际能力的团队。印度目前在这方面的积累,说实话还不够看。

    眼下印度真正在做基础大模型的初创企业屈指可数。Sarvam算是其中一个,今年早些时候开源了模型。另一家曾经高调亮相的Krutrim,后来悄悄转型去做云和AI基础设施服务了——做大模型太烧钱,不如做基础设施来得实在。


    更多人开始认真看开源

    Zoho的创始人Sridhar Vembu的表态很典型。他在X上写:”技术就是终极武器。”他呼吁印度机构更多采用小型开源模型,包括印度本土的,也包括中国的开源模型。

    这个说法一周前可能还会有人质疑,现在质疑的人少了很多。Anthropic事件之后,不少印度创业者开始重新评估自己对少数几家美国前沿模型供应商的依赖程度。Atomicwork的CEO Vijay Rayapati说得更直接:如果你的AI团队不是全由美国公民组成,你在竞争上就是劣势。因为别人能用的最新模型,你可能用不上。

    这件事还牵出了另一个讨论。本周,美国房产科技公司Opendoor在落地印度不到两年后就关了印度办公室,CEO说要把运营团队搬到离美国客户更近的地方,同时转向更小、更AI化的团队。这件事在印度科技圈引发了不少讨论——AI到底是在创造机会,还是在重构全球分工的逻辑?印度作为”世界后台”的地位,还能稳住吗?

    新德里的科技政策专家Prasanto Roy说了一句话,在印度朋友圈里传得很广:”就算这件事后来被纠正或者逆转,它也已经说明了一个问题——不存在地缘政治中立的外国大语言模型。美国的AI模型,绑的就是美国的地缘政治。”

  • 2026世界杯用上AI裁判,越位判罚快了不止一点

    足球里的科技含量,比你想的多得多

    2026年世界杯这周就在美国开了,这届比赛有个跟以往完全不同的地方——AI技术渗透进了比赛的几乎每个环节。从球员踢出那一脚的精确毫秒,到越位线该画在哪里,再到你坐在沙发上看到的裁判第一视角画面,背后都有AI在跑。

    先说那个最显眼的变化:比赛用球。阿迪达斯这届的官方用球叫Trionda,里面塞了一个惯性测量单元(IMU)传感器,每秒采集500次运动数据。这个传感器的唯一任务,就是记录”球到底是什么时候被踢出去的”——精确到毫秒。

    为什么要这么精确?因为越位判罚的关键时刻,就是球离开脚的那一瞬间。以前的系统靠视频帧来估算,误差可能有一两帧,现在有了500Hz的传感器,这个时刻可以精确到单帧以内。有个有趣的副作用:这届世界杯的比赛用球,历史上第一次需要在开赛前充电。

    FIFA World Cup 2026 AI Technology
    2026世界杯首次大规模部署AI裁判辅助系统,覆盖越位判罚、球员追踪等多个环节丨来源:TechTimes

    越位判罚快了多少

    跟上一届(2022年卡塔尔世界杯)比,这届的半自动越位系统升级了不少。16座球场每座都装了大约12台专用高速摄像头,AI同时追踪场上每位球员的29个身体特征点——包括四肢、膝盖、脚趾——每秒扫50次。

    把足球传感器的触球时间戳,和这29个点的骨骼追踪数据叠在一起,系统就能自动画出越位线,几秒钟内给出判罚建议。2022年版的系统只能识别超出越位线50厘米以上的情况,这届能识别到10厘米。

    但有个很重要的界限:AI只负责”量位置”,不负责”判主观”。也就是说,系统能告诉你某个球员在触球瞬间是不是站在越位位置上,但这个球员有没有”实际参与比赛”——这是裁判的主观判断——AI不管。最终吹不吹越位,还是人说了算。

    这届世界杯的AI部署逻辑很清晰:客观、可量化的环节交给机器,主观判断的环节仍然留给人类。这是”半自动”这个词真正的含义。

    裁判的第一视角,你看得到

    另一个第一次是:这届所有104场比赛,裁判都佩戴了随身摄像头。你能在转播里看到裁判的第一视角画面——球滚到脚边那一刻,裁判眼里看到的是什么。

    原始的头戴画面其实抖得看不了,所以FIFA用AI稳定算法对视频做了实时平滑处理。这个功能的初衷是提高判罚透明度——有争议的时候,大家能看到裁判当时到底看到了什么,而不是只能听解说员猜。

    球员赛前还全部做了3D扫描,系统用这些数据生成逼真的虚拟形象,用来在球场大屏和电视转播里还原越位判罚过程。你看世界杯的时候看到那些动画越位线解释,就是这么来的。

    科技公司也没闲着

    谷歌和联想把这届世界杯当成了AI能力的展示舞台。谷歌把Gemini AI嵌进了球迷体验里,你可以在手机锁屏页面拿到实时比分和AI生成的赛事可视化内容。联想给16座球场都搭了数字孪生模型,用来做人群和安全管理,还给了48支参赛球队一套叫”Football AI Pro”的分析工具,基于2000多个足球专项指标训练出来的。

    这届世界杯也许是AI在体育赛事里最大规模的一次实地测试。技术能不能经得起全球几十亿双眼睛的检验,几周后就能看到。球迷关心的可能只是判罚公不公平,但背后那些数据——球员的3D扫描、每秒50次的追踪、每一次触球记录——归谁所有、怎么用,这些问题可能比越位线难画多了。


    • Trionda智能足球内置500Hz传感器,精确记录触球时刻,需赛前充电
    • 16座球场各部署约12台高速摄像头,AI追踪球员29个身体特征点
    • 越位判罚灵敏度从50厘米提升至10厘米,判罚建议直接推送到助理裁判耳麦
    • 首次在全部104场比赛中启用裁判随身摄像头,AI实时稳定第一视角画面
    • 谷歌Gemini、联想Football AI Pro同步亮相,AI全面进入球迷体验和球队分析
  • 英特尔拿下谷歌300万颗AI芯片大单,股价一天涨了14%

    台积电的”铁王座”出现裂缝

    这周半导体圈最大的消息,是谷歌据报向英特尔下单了超过300万颗TPU芯片,交货期定在2028年。消息还没官宣,英特尔股价已经先涨为敬——单日最高涨了14%,市值凭空多了几百亿美元。

    要说这事有多大,得先搞清楚TPU是什么。TPU是谷歌自研的AI芯片,专门用来跑自家的搜索、广告、YouTube推荐和Gemini大模型。以前这些芯片基本上都是台积电代工的,现在谷歌找上了英特尔,等于在台积电一家独大的格局里塞进了一个变量。

    据The Information的报道,谷歌其实已经”验货”验了好几个月,重点考察英特尔的先进封装能力。AI芯片不是把晶体管刻得越小就越厉害,现在的瓶颈更多在封装——怎么把多个小芯片和高带宽内存整到同一个模块里。英特尔的EMIB封装技术良率已经爬到接近90%,这个数字足以让谷歌认真考虑把订单给它。

    这三百万颗订单如果坐实,差不多占谷歌2028年TPU总产量的一半。对英特尔代工业务来说,这是它成立以来最大的一笔外单。

    摩根大通泼了一盆冷水

    不过华尔街也不是一边倒地看好。摩根大通的分析师直接说,别兴奋太早——这批TPU的核心制造可能还是台积电在做,英特尔拿到的或许只是封装订单。封装重要,但跟全套制造比起来,分量还是差了不少。

    这种质疑不是没有道理。英特尔的18A制程(相当于1.8纳米级别)技术上确实已经量产了——它自己的至强服务器CPU就在用——但能不能稳定地给外部客户大规模出货,这是两回事。台积电的优势不只是技术,更是几十年积累下来的良率和交付可靠性。

    英伟达那边也有类似的风声,说在评估英特尔的18A制程,用来做2028年左右发布的Feynman架构GPU。但目前还停留在”试流片”阶段,连正式订单的影子都没有。试流片花不了多少钱,离真正量产还隔着十万八千里。

    TSMC芯片制造
    台积电长期垄断先进AI芯片制造,谷歌英特尔合作是供应链多元化的信号丨来源:TechTimes

    为什么大家想逃离台积电

    话又说回来,谷歌和英伟达”脚踩两条船”这件事本身,比订单最终花落谁家更有意思。台积电现在基本上吃下了全球所有先进AI芯片的制造,产能早就拉满了,先进封装环节更是紧到客户要排队。台积电自己都公开说过,AI芯片的短缺会持续好几年。

    更要命的是地缘政治。全世界的AI基础设施都押在台积电一家身上,而台积电的工厂基本上都在中国台湾地区。这种单点风险,谷歌、英伟达、苹果谁都受不了。所以你会看到苹果也在悄悄找英特尔代工部分芯片,特斯拉已经成了英特尔14A制程的首个主要客户。

    英特尔在这个时间点确实有它的优势。它是西方世界唯一一个还有希望追上先进制程的芯片制造商,美国政府也很乐意看到它成功——这不只是一家公司的生意,背后有整个供应链安全的逻辑。

    悬念还在

    目前这笔订单最大的问题就是:它还没有被官方确认。谷歌和英特尔都没有出来认领这件事。所以现在市场上炒得火热,本质上是在用”可能性”定价。如果最后证实英特尔只拿到封装订单,股价可能会回吐一部分涨幅;如果证实真的拿到了整颗芯片的制造订单,那才是真正的地震。

    对于普通观察者来说,这件事的意义不在于英特尔能不能马上取代台积电——这短期内不可能发生——而在于AI芯片的供应链正在从”台积电一家独大”走向”多极分布”。这个趋势一旦启动,就不会停下来。


    • 谷歌据报向英特尔下达超300万颗TPU订单,2028年前交付
    • 消息传出后英特尔股价单日最高涨14%
    • 摩根大通质疑:英特尔或仅负责封装,核心制造仍归台积电
    • 英伟达同时评估英特尔18A制程,用于2028年Feynman架构GPU
    • AI芯片供应链多元化已成大势,台积电垄断格局开始出现裂缝
  • 【开源推荐】LangChain:139K+ Stars!AI Agent 工程平台,构建 LLM 应用的标准框架

    【开源推荐】LangChain:139K+ Stars!AI Agent 工程平台,构建 LLM 应用的标准框架

    LangChain

    ⭐ GitHub 139K+ Stars

    LangChain

    AI Agent 工程平台 – 构建 LLM 应用的标准框架

    📝 项目简介

    LangChain 是一个强大的 AI Agent 工程平台,为构建 LLM 驱动的应用提供完整的框架和工具链。它提供模块化的组件、丰富的集成库和灵活的抽象层,让开发者能够快速原型设计、轻松集成外部数据源,并将应用规模化部署到生产环境。无论是简单的聊天机器人还是复杂的多 Agent 系统,LangChain 都能提供最佳实践和技术支撑。

    139K+
    GitHub Stars

    23.1K+
    Forks

    MIT
    开源协议

    Python
    主要语言

    ⚙️ 安装要求

    环境要求

    • Python 3.9+ (推荐 3.10 或更高版本)
    • pip 或 uv 包管理器
    • LLM API Key(OpenAI / Anthropic / Google 等)
    • 可选:向量数据库(Chroma / Pinecone / Qdrant 等)

    快速安装

    Bash
    # 使用 uv 安装(推荐)
    uv add langchain
    
    # 或使用 pip
    pip install langchain
    
    # 安装特定集成(例如 OpenAI)
    pip install langchain-openai
    
    # 安装社区集成(例如 Hugging Face)
    pip install langchain-community

    核心功能

    🔗 模块化组件架构

    提供 LLM、Chat Models、Prompt Templates、Chains、Agents、Tools、Memory、Retrievers 等标准化模块,每个组件都可独立使用和组合,支持快速搭建复杂 AI 应用。

    🔌 丰富的集成生态

    支持 100+ 模型提供商(OpenAI、Anthropic、Google、Hugging Face 等)、50+ 向量存储(Chroma、Pinecone、Qdrant、FAISS 等)、30+ 工具集成,开箱即用。

    🤖 强大的 Agent 框架

    内置多种 Agent 类型(ReAct、Plan-and-Execute、OpenAI Tools 等),支持工具调用、记忆管理、多轮对话,可构建具有推理和行动能力的智能 Agent。

    📚 RAG 完整支持

    提供从文档加载、文本分割、向量化到检索的完整 RAG 管道,支持多种文档格式(PDF、HTML、Markdown 等)和检索策略(相似度搜索、MMR、Hybrid 等)。

    🚀 生产就绪工具链

    与 LangSmith 深度集成,提供追踪、评估、调试、监控能力;支持流式输出、异步调用、批量处理,满足高并发生产场景需求。

    💡 典型使用场景

    场景 1

    📊 企业知识库问答系统

    使用 LangChain 的 RAG 能力,将企业文档(PDF、Word、HTML)向量化存储,构建能够准确引用来源的智能问答系统。支持多轮对话、上下文记忆和来源追溯。

    from langchain_community.vectorstores import Chroma
    from langchain_openai import OpenAIEmbeddings
    from langchain.chains import create_retrieval_chain
    
    # 加载文档并构建向量库
    embeddings = OpenAIEmbeddings()
    vectorstore = Chroma.from_documents(docs, embeddings)
    
    # 创建检索问答链
    retriever = vectorstore.as_retriever()
    qa_chain = create_retrieval_chain(retriever, ...)

    场景 2

    🤖 智能客服 Agent

    利用 LangChain 的 Agent 和 Tools 机制,让 AI 能够调用订单查询、物流追踪、退款处理等 API,自动完成复杂的客户服务流程,支持多步骤推理和错误处理。

    from langchain.agents import create_tool_calling_agent
    from langchain.tools import Tool
    
    tools = [
        Tool(name="订单查询", func=query_order, ...),
        Tool(name="退款处理", func=process_refund, ...)
    ]
    
    agent = create_tool_calling_agent(llm, tools, prompt)

    场景 3

    ✍️ 内容生成与摘要

    结合 Prompt Templates 和 Chains,构建自动化的内容生成流水线,支持博客文章、产品描述、会议纪要摘要等场景,可集成到现有 CMS 或自动化工作流中。

    from langchain.chains import LLMChain
    from langchain.prompts import PromptTemplate
    
    template = "根据以下要点生成博客文章:\n{points}\n文章风格:{style}"
    
    chain = LLMChain(llm=llm, prompt=PromptTemplate.from_template(template))
    result = chain.invoke({"points": "...", "style": "专业且易懂"})

    💝 推荐理由

    LangChain 是我接触过的最成熟的 LLM 应用开发框架,没有之一。它不仅仅是一个库,更是一个完整的 AI Agent 工程平台

    生态极其丰富: 无论你想接入哪个模型、哪个向量库、哪个数据源,几乎都能找到现成的集成,省去了大量重复造轮子的时间。

    抽象设计优秀: 从底层的 LLM 调用到高层的 Agent 编排,LangChain 提供了多层次的抽象,既能快速 prototyping,也能精细控制每个环节。

    社区活跃度高: 139K+ Stars 不是虚的,GitHub 上每天都有新的讨论、PR 和案例分享,遇到问题几乎都能找到答案。

    生产工具完善: LangSmith 的集成让调试和监控变得异常简单,这是很多同类框架做不到的。

    如果你正在考虑用哪个框架来构建 AI 应用,LangChain 绝对是首选。它已经成为了这个领域的”标准”,学习它永远不会错 🚀

    ···

    Tags
    #LangChain
    #AI Agent
    #LLM
    #Python
    #RAG
    #Agent工程

  • 余承东放话:盘古大模型要做世界第一,华为把底牌全亮出来了

    余承东放话:盘古大模型要做世界第一,华为把底牌全亮出来了

    6月12日,华为开发者大会2026(HDC 2026)在东莞开幕。余承东站上台,扔下了一句话:”在我余承东的字典里只有第一,没有第二。”

    这次他宣布的事情是:盘古大模型2.0(openPangu 2.0)正式发布,开源体系全面升级。从6月30日起,华为计划陆续开源上线7大组件,其中包括之前没有开源过的预训练代码、后训练代码和训练算子。

    华为盘古大模型2.0发布
    余承东在HDC 2026上发布盘古大模型2.0(图源:南方都市报)

    余承东说这话是有背景的。他透露,去年国庆节前夕,公司让他来负责大模型业务。”我会带领团队一路赶超,从中国第一,走向将来的世界第一。”

    他还补了一句:2021年4月,华为发布了全国、全世界第一个大模型——盘古大模型。那时候大家还不知道大模型是什么,华为已经发布了,算是行业先驱者。但后来没做好,不应该。

    “在AI领域,算法、算力、数据三样缺一不可,需要强大的工程能力来支撑和保障。而华为有强大的工程能力,且凝聚了一批优秀的人才,相信不断地创新,就能做好。”

    开源7大组件,这次动真格了?

    openPangu 2.0的开源计划是这套发布的核心。7大组件从6月30日起陆续上线,其中预训练代码、后训练代码和训练算子是新增开源的部分。

    把训练代码开源,意味着华为在向开发者示好:你可以用我的模型,还可以看我是怎么训练的。这在国产大模型里算是比较激进的打法——通常厂商更愿意把训练细节捂在自己手里。

    华为的算盘可能是这样:开源能拉更多开发者进来,生态做大了,盘古的地位就稳了。余承东说要”从中国第一走向世界第一”,没有开发者生态,这句话就是空头支票。

    绕不开的抄袭争议

    盘古大模型不是第一次站在聚光灯下,但上一次的热度来自一场争议。

    2025年7月,GitHub上有人发了一项研究,称华为盘古大模型与阿里通义千问在模型参数结构上存在”惊人一致”。一时间,”华为抄袭阿里”的质疑声四起。同期,网上还流传了一篇署名为内部员工的文章,标题很抓马:《盘古之殇:华为诺亚盘古大模型研发历程的心酸与黑暗》。

    华为诺亚方舟实验室后来发了澄清声明,说法是:盘古Pro MoE开源模型部分基础组件的代码实现参考了业界开源实践,涉及其他开源大模型的部分开源代码,且严格遵循开源许可证要求,在代码中清晰标注了版权声明。

    这份声明的潜台词是:我们用了开源代码,但合规,标注了,符合开源社区规则。这个解释能不能平息质疑,见仁见智。开源社区对”参考”和”抄袭”的界限本来就有不同看法。

    这次盘古2.0大张旗鼓地开源7大组件,多少也有点”用行动回应质疑”的意思。代码摊在阳光下,是不是自己写的,技术圈自会有判断。


    余承东说”只有第一,没有第二”,这话很有他的风格。但大模型这场仗,比手机战场复杂得多。算法、算力、数据、开发者生态、应用落地——每一个都是硬骨头。盘古2.0开源能不能拉起一波开发者,6月30日之后见分晓。

  • 华纳音乐出手了,它买下了一家专门”抓AI盗用”的初创公司

    华纳音乐出手了,它买下了一家专门”抓AI盗用”的初创公司

    6月10日,华纳音乐集团(WMG)正式宣布收购AI归因初创公司Sureel AI。这笔交易的金额没有披露,但信号很明确:大型音乐集团正在把AI版权保护当成核心战略来押注。

    Sureel AI做的事听起来有点技术宅——它为每首歌创建一套”AI DNA”,把歌曲拆解成组成元素,然后追踪这些元素有没有被AI模型在训练或生成时偷偷用了。简单来说,就是帮权利人看清:我的作品到底有没有被AI”学”了、怎么被用的。

    Warner Music acquires Sureel AI
    华纳音乐集团收购Sureel AI,强化AI时代版权保护能力(图源:TechCrunch)

    这套技术已经拿到了专利。Sureel的”AI DNA”可以追踪的范围包括语音克隆、AI生成虚拟形象、风格复刻等场景——基本上覆盖了现在AI音乐最容易被滥用的几个方向。

    华纳音乐CEO Robert Kyncl在声明里说得很直白:”将Sureel纳入华纳音乐大家庭,将增强我们的保护、控制和变现能力,确保创作群体始终掌控其知识产权、姓名、形象、肖像和声音。”

    收购完成后,Sureel AI会继续作为独立平台运营,不光服务华纳,还要服务整个音乐和娱乐生态。这说明华纳的算盘不只是”自己用好”,而是要把这套归因技术变成行业基础设施。

    从”告AI”到”和AI做生意”

    华纳对AI的态度转变挺有意思。2024年的时候,华纳还站在对抗阵营,直接起诉了AI音乐生成初创公司Suno,指控大规模版权侵权。

    但到了2025年11月,华纳和Suno和解了,还签了授权协议。当时华纳的表态是:艺术家和词曲作者将完全控制其作品是否、以及如何被用于AI生成音乐。紧接着,华纳又和另一家AI音乐公司Udio达成了类似的和解加授权协议。

    这套”先打后和”的操作,本质上是在AI浪潮里重新界定规则:我不阻止你用我的内容,但你得让我知道、让我同意、让我分到钱。

    对比一下同行:索尼音乐和环球音乐到现在还在向Suno提起大规模版权侵权索赔,没有和解的意思。华纳反而跑在了前面,先通过收购把归因技术握在手里,相当于在谈判桌上多了一张底牌。

    为什么是现在?

    生成式AI爆发之后,音乐版权的归属和补偿问题一直是一笔糊涂账。一首歌被喂进了多少个模型、生成的内容里有多少”借鉴”了原曲的风格和旋律——这些事以前查不清楚,现在Sureel说它能查清楚。

    Sureel创始人兼CEO Tamay Aykut的表态也值得玩味:”权利持有者有权了解AI如何与其作品互动,并公平分享AI创造的价值。Sureel的创立就是为了把这件事变成可能。”

    这句话翻译过来就是:AI用了你的作品,你得有知情权,还得有分成权。这其实是整个创意行业对AI浪潮的核心诉求——不是要阻止AI,而是要在这波技术变革里保住自己的利益。


    华纳这步棋下得挺准。归因技术一旦成为行业标准,谁握有最精准的归因数据,谁就在AI音乐价值链里占据了有利位置。对其他音乐公司来说,这恐怕是个不能忽视的信号。