标签: AI Agent

  • AI五月风暴:模型军备竞赛、Agent落地与电力危机

    四月刚过,AI圈没有丝毫放缓的迹象。GPT-5.5-Cyber开始推送,Claude Mythos在约50家合作伙伴中只有受限预览,DeepSeek V4带着开源权重和低价策略强势入场——模型竞赛正在进入一个新阶段:不再比谁的模型最通用,而是比谁更专业、更便宜、更能落地。

    专业模型来了,通用模型不香了?

    GPT-5.5-Cyber的发布释放了一个清晰信号:厂商开始针对特定高价值场景推出专业模型,而不再只靠一个通用大模型打天下。网络安全、漏洞发现、防御分析——这些场景正在成为前沿AI厂商的必争之地。

    Claude Mythos的神秘感更是拉满。现在只有约50家机构能用到它,传言说它在高级推理、编码和漏洞发现上有巨大飞跃。Anthropic这种”限量供应”的打法,摆明了要把下一个阶段的AI变成门槛更高、管控更严的游戏。

    DeepSeek V4则是另一条路——它把前沿级别的性能直接拉到低价+开源的组合上。对企业来说,成本改变 adoption 曲线,成本改变哪些应用场景变得经济可行。

    Agent从概念到落地,2026是分水岭

    Gartner有个预测被反复引用:到2026年底,40%的企业应用将嵌入AI Agent,而2025年这个数字还不到5%。先不管这个预测准不准,它反映出的行业共识是真实的——Agent正在从demo走向生产环境。

    开发者社区里的讨论也在变。大家不再争论Agent有没有用,而是开始认真讨论:用什么框架?CrewAI还是LangGraph?MCP协议怎么接入?怎么防止Agent乱跑把事情搞砸?这些是非常实操的问题,说明这个品类真的在进入落地阶段。


    电力危机:6500亿美元也买不来的瓶颈

    最有意思的矛盾来了:大型科技公司今年在AI基础设施上的资本开支合计超过6500亿美元,但约一半的美国数据中心项目却因为电力基础设施短缺而被推迟或取消。钱不是问题,电才是问题。

    AI数据中心 campus 动辄需要几百兆瓦的电力容量,变电站、变压器、电网接入——这些现实世界的物理约束,比发布一个大模型要慢得多。Gartner还预测,到2027年,电力短缺将限制约40%的AI数据中心。这意味着,AI的下一个瓶颈不是芯片,不是模型,而是现实世界的部署能力。

  • Anthropic产品负责人:AI的下一站,是在你开口前就猜到你要什么

    Anthropic最近风头正劲。估值940亿美元、企业客户数超越OpenAI、ARR突破440亿美元——这家公司正在AI领域快速崛起。而它的产品负责人Cat Wu最近在Code with Claude大会上分享了一个观点,我觉得挺有意思:AI的下一件大事,是”主动性”。

    从”有问必答”到”未问先答”

    Cat Wu在采访中回顾了AI助手的演进路径:去年是”同步开发”时代,人问AI答;现在是”自动化流程”时代,比如自动回复客服工单。而下一步,AI要理解你的工作内容,主动帮你搭建自动化流程。

    “The next big thing is proactivity. Claude will understand what you work on, and just sets up some of these automations for you.” —— Cat Wu,Anthropic产品负责人

    换句话说,未来的AI不会等你提问,它会预判你的需求,在你意识到之前就把事情做好。这个画面有点像有个特别懂你的助手,总是提前一步想到你接下来要做什么。

    管好Agent,其实和管理员工差不多

    有意思的是,Cat Wu还回应了一个很多人关心的问题:AI Agent会不会取代人类工作?她的观点是:不会完全取代,但会改变工作方式。

    她说,管理AI Agent其实和管理员工很像——你得是那个领域的专家。当Agent犯错时,你得能debug,得知道是指令没说清楚还是需求描述不够具体。这是一种新技能,但本质上是管理能力的延伸。

    Cat Wu在Code with Claude大会
    Cat Wu在Anthropic年度Code with Claude大会上分享AI未来趋势

    不追竞品,只追前沿

    Cat Wu还透露了Anthropic的产品哲学:从不根据竞品动态来规划路线图。她说,如果总是盯着竞争对手,团队的执行速度永远会落后两周到一个月。Anthropic的策略是专注于技术前沿,让产品自己说话。

    这种思路从他们最近的”Glasswing”项目也能看出端倪。Glasswing是一个网络安全AI模型,可以扫描代码库查找漏洞。Anthropic没有公开发布它,而是只给了亚马逊、苹果、微软等合作伙伴早期访问权限——因为他们认为这个模型”太强大”了,不想让它落入坏人之手。

    AI的价值:把人从繁琐中解放出来

    聊到AI对工作的影响,Cat Wu举了自己的例子:她最讨厌的事情是回邮件。AI的价值不在于取代她的工作,而在于接手那些重复繁琐的部分,让她有时间去做”真正想做的事情”。

    “The idea is that everyone can get a lot more done. I think that, for everyone’s job, there’s always this percentage of it that’s really tedious.”

    这个观点挺实在的。AI的目标不是让人失业,而是提升每个人的产出效率——用更少的时间做更多有价值的事。


  • Notion转型AI Agent中心:200万团队已入局,企业工作流正在被重塑

    Notion最近搞了个大动作——他们刚刚发布了全新的开发者平台,直接把自己从”协作文档工具”升级成了”AI Agent调度中心”。说实话,这个转变比我预想的来得更快。

    从笔记软件到AgentHub

    事情的起因是Notion在2月份推出的Custom Agents功能。当时很多团队用上了,但局限性也很明显——这些Agent没法连接外部数据、没法运行自定义逻辑、也没法和第三方AI Agent联动。说白了,就是个”加强版自动回复”。

    新平台一口气解决了这些问题。它带来了四个核心能力:

    • Notion Workers:云端安全沙盒环境,团队可以直接部署自定义代码,不用依赖外部基础设施
    • Database Sync:实时同步外部数据源,包括Salesforce、Zendesk、Postgres等,直接拉进Notion数据库
    • 外部Agent集成:直接在Notion里和Claude Code、Cursor、Codex这些第三方Agent聊天、派任务、看进度
    • 开发者工具:Notion CLI现在全平台免费使用

    “Any data, any tool, any agent — that’s the big picture for the Notion Developer Platform.” —— Notion联合创始人兼CEO Ivan Zhao

    数据很吓人

    从2月推出Custom Agents到现在,Notion用户已经构建了超过100万个自定义Agent。这个数字很能说明问题——市场需求是真实存在的。

    Notion还宣布了一个福利:Workers在2026年8月之前免费给开发者试用。这显然是借鉴了云厂商早期的”先用后付费”策略,先培养生态再说。

    Notion开发者平台
    Notion开发者平台将工作空间打造为AI Agent枢纽

    这意味着什么

    我觉得这代表了SaaS工具的一种演进方向——从”人用工具”变成”人指挥AI用工具”。Notion不再只是一个写文档的地方,它正在变成企业AI工作流的”操作系统”。

    当然,这也意味着Notion要和n8n、Zapier这些老牌自动化平台正面竞争了。能不能打过,还得看实际体验。但有一点可以确定——AI Agent的风口,每个玩家都想抓住。


  • Open WebUI:127k Stars!为Ollama打造的终极Web界面

    Open WebUI Banner

    如果你在用 Ollama 运行本地大模型,肯定知道自带的命令行事先张扬地”反人类”。每次想切换模型、调参数、看历史记录,都要折腾一堆命令行操作。Open WebUI 就是来解决这个问题的——给你一个漂漂亮亮的 Web 界面,把 Ollama 的能力全部释放出来。


    🚀 项目简介

    Open WebUI 是一个功能强大、可高度自定义的自托管 AI 交互界面,GitHub 已获得 127k+ Stars。它最初是 Ollama 的 Web UI,现在已经发展成支持 Ollama、OpenAI API、Claude 等多种后端的通用 AI 界面平台。核心理念是让每个人都能轻松地与本地或云端大模型交互,完全离线运行,数据自主可控。

    Open WebUI 演示界面


    ⚙️ 安装要求

    硬件要求

    • CPU:支持 AVX 指令集的现代处理器
    • 内存:取决于使用的模型(建议 8GB+)
    • 磁盘:10GB+(用于存储应用和数据)

    软件依赖

    • Docker(推荐)
    • 或 Python 3.11+
    • 浏览器(Chrome / Edge / Firefox)

    快速安装(Docker 方式,最简单)

    docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

    启动后访问 http://localhost:3000

    快速安装(pip 方式)

    pip install open-webui
    open-webui serve

    启动后访问 http://localhost:8080


    💡 核心功能

    • 🤖 多后端支持:支持 Ollama、OpenAI API、Claude、vLLM 等多种模型后端,一个界面管理所有模型
    • 📚 RAG 知识库:内置 RAG 功能,可以上传文档构建私有知识库,让 AI 基于自有资料回答问题
    • 🧩 插件系统:支持插件扩展,可按需安装功能插件,满足个性化需求
    • 🔧 工具调用:支持 Tool Calling,可以调用外部工具完成复杂任务
    • 📝 上下文管理:智能管理对话上下文,优化长对话体验,支持对话历史管理和标签分类

    📦 典型使用场景

    🎯 场景一:本地 Ollama 模型可视化交互

    安装 Ollama 后拉取任意模型(Llama 3、Qwen、Mistral 等),通过 Open WebUI 的友好界面进行对话、切换模型、调整参数。完全本地运行,隐私无忧。

    🎯 场景二:企业私有知识库问答

    上传公司内部文档到 RAG 系统,构建专属知识库。员工通过对话形式查询制度、文档、数据,AI 精准基于自有资料回答,无需接触外部服务。

    🎯 场景三:团队共享 AI 助手

    部署在内网服务器上,团队成员通过浏览器访问同一个 AI 界面。可以连接多个模型后端,按需切换,适合开发和测试场景。


    ⭐ 推荐理由

    我之前一直用命令行跑 Ollama,每次调模型都要记一堆参数。用上 Open WebUI 之后,体验直接提升了好几个档次。界面简洁好看,功能也很全面,RAG、插件、多后端支持这些都用得上。

    最关键的是完全开源、可以自托管,数据不离开自己的服务器。对于企业用户来说,这个优势很明显——既能用上 AI 能力,又不用担心数据泄露问题。

    如果你在用 Ollama 或者想搭建本地 AI 界面,Open WebUI 绝对值得一试。


    📧 下载地址

  • Notion把workspace变成了AI智能体指挥中心

    Notion开发者平台
    Notion推出开发者平台,变身AI智能体指挥中心(图片来源:Notion/TechCrunch)

    Notion这次真的放大招了。5月13日,这家以笔记协作出名的公司搞了一场直播发布会,推出的东西让我眼前一亮——他们把自己的workspace直接变成了AI智能体的指挥中心。

    说实话,我一开始也没太当回事。Notion加个AI功能不是啥新鲜事,市面上类似的工具多的是。但这次不一样,他们搞的是一个完整的开发者平台,能让你自己写代码、接入外部智能体、还能搞自动化工作流,把数据库里的数据随便拉出来用。

    从100万智能体到开发者平台

    先说说背景。今年2月份Notion第一次推出”Custom Agents”的时候,我就试过。那时候能做的事情挺基础的——回答常见问题、整理状态更新、跑一些简单的工作流。说实话,有点鸡肋。但你猜怎么着?用户们硬是捏出了超过100万个智能体。这数据让我意识到,需求是真的存在,只是工具还不够强大。

    这次更新的核心叫”Workers”。简单说,就是Notion给了你一个云端沙盒环境,你能把自己的代码扔进去跑。不需要搞自己的服务器,不需要折腾第三方自动化平台,直接在这个隔离环境里写逻辑、同步数据、设置webhook触发。我试了一下,说实话比想象中顺手。

    Notion的联合创始人Ivan Zhao在直播里挺坦诚地说了:”说实话,Notion历史上确实不是个对开发者友好的平台。但事情正在起变化。”这话我信,因为这整套开发者平台的设计确实是在认真考虑开发者的需求。

    数据库同步是关键

    最让我感兴趣的是数据库同步这个功能。通过Workers,你能把任何有API的数据库(Salesforce、Zendesk、Postgres随便你)直接拉进Notion,还能保持实时更新。Notion的CEO Ivan Zhao说了一句话我觉得挺有意思:”你可以把Notion数据库当成一块纯粹的画布,用来驱动你的工作流和智能体。”这话听起来有点抽象,但实际用起来确实那个感觉——终于不用在各种工具之间跳来跳去了。

    然后还有一个挺实用的功能:你可以直接在Notion里跟外部AI智能体聊天,分配任务,追踪进度,就像它们是Notion自家的智能体一样。目前支持Claude Code、Cursor、Codex和Decagon,后面还会加更多。

    几个值得关注的亮点

    • 自定义代码沙盒:不用自己搞服务器,直接在Notion的隔离环境跑代码
    • 数据库同步:任何有API的数据库都能实时拉进Notion
    • 外部智能体接入:Claude Code、Cursor、Codex直接当Notion智能体用
    • 8月前免费:明显是在抢开发者生态

    我觉得这步棋下得挺聪明的。现在各家AI公司都在从”聊天机器人”往”能干活智能体”这个方向转,Notion把自己定位成”智能体协作中心”,而不是直接跟人家拼模型能力。毕竟,大多数企业用户要的不是更聪明的AI,而是一个能把现有工具串联起来、让AI真正融入工作流的东西。

    Ivan Zhao总结了一句话:”任何数据,任何工具,任何智能体——这是Notion开发者平台的大图景。”听起来挺霸气的,但我觉得方向是对的。AI工具如果真的要在企业里落地,这种”连接器”的角色可能比”最强模型”更实用。

  • AI智能体不能再”自由发挥”了:三部门联合发文划定决策边界

    AI智能体以后不能想干嘛就干嘛了。前脚AI Agent赛道火得一塌糊涂,后脚监管就来了——国家网信办、国家发展改革委、工业和信息化部三部门联合印发了《智能体规范应用与创新发展实施意见》,给AI智能体的发展套上了”笼子”。

    智能体是什么?说白了就是能自己干活儿的AI

    官方给智能体下了个定义:具备自主感知、记忆、决策、交互与执行能力的智能系统。翻译成人话就是——它能自己看、自己想、自己做决定、自己干活。随着大模型技术成熟,智能体正在加速跟网络空间、物理世界深度融合,这玩意儿要是不管一管,确实容易出事儿。

    智能体决策权限划分为三个层级:仅限用户本人决策、需由用户授权决策、智能体自主决策——明确划定各种决策方式的合理边界及所需权限

    安全可控是底线,创新驱动是方向

    《意见》提出了四大基本原则:安全可控、规范有序、创新驱动、应用牵引。具体举措主要围绕四个方面:夯实技术底座和标准协议、守牢安全底线和防范风险、强化19个典型应用场景牵引、建设创新生态促进产业合作。

    19个场景定了哪些方向?

    应用场景覆盖五大方向:科学研究、产业发展、提振消费、民生福祉、社会治理。《意见》还提出了一个量化目标:新一代智能终端、智能体等应用普及率要超70%。说实话,这个覆盖率目标挺激进的,意味着三年内智能体要从”尝鲜”变成”标配”。

    我觉得这次监管来得挺及时的。之前看到各种AI Agent产品一个比一个激进,各种”全自动”、”自主执行”吹得天花乱坠,普通用户根本搞不清楚这些AI到底能自己做什么主。现在好了,官方给你划清楚——哪些必须人拍板、哪些可以授权、哪些AI能自己定。这有点像给AI立了个”交规”,接下来就看执行力度了。