标签: AI Agent

  • OpenAI给Codex加了6个新岗位插件,白领的AI同事上线了

    OpenAI周一扔出一个不小的更新:Codex不再只是程序员的玩具,他们给这款AI智能体一口气加了6个岗位插件,直接把触角伸进了数据分析、销售、产品设计这些典型的白领工作场景。

    背后的数据挺能说明问题。OpenAI在同步发布的一份内部报告里透露,Codex现在的周活跃用户已经突破500万,比2月份桌面应用刚上线时涨了6倍多。更有意思的是用户结构——开发者仍然是最庞大的群体,但知识型工作者的占比已经到了20%,而且这个群体的增速是其他群体的3倍以上。

    Codex的周活跃用户超过500万,知识型工作者目前约占用户总数的20%,且增长速度比其他群体快3倍以上。

    6个新插件,瞄准具体岗位

    这次推出的插件覆盖了6个岗位:数据分析、创意制作、销售、产品设计、股权投资、投行。每个插件都整合了对应的集成接口、操作说明和场景上下文,让Codex能够模拟特定岗位的工作方式。用OpenAI的话说,这些插件开箱就能用,当然你自定义得越多,它干得越顺手。

    这个打法看着眼熟——Anthropic今年2月就推过面向企业的智能体插件项目,5月又专门针对金融服务推出更细分的智能体。OpenAI传统上更偏消费者市场,拉企业客户的速度慢了半拍,直到3月才给Codex引入插件支持。这次算是追了上来,而且声势更大。


    不只是插件,还有两个新功能

    除了插件,OpenAI还顺手发了两个新功能。一个是Sites,让Codex把工作成果直接输出成可交互的托管网站,不再只是一堆本地文件。为了支撑这个功能,OpenAI拉了一帮合作伙伴进来,包括Wix、Base44、Replit、Lovable、Figma和Emergent,而且明确表示还要继续扩这个生态。

    另一个是Annotations(注释),用户可以指定Codex中某个文档或文件的特定部分,让AI在那段上下文里执行更精准的指令。这个设计挺实用的,尤其是处理长文档的时候。


    更大的一盘棋

    这次更新发布的三周前,OpenAI刚为了企业客户推出了一家新的合资企业,叫”OpenAI Deployment Company”,拿到了全球投资机构超过40亿美元的资金支持。这个公司的目标很明确:把OpenAI的工具更深地嵌进全球企业的运营里。

    OpenAI首席营收官丹妮丝·德莱瑟在声明里说了一句话,挺能代表他们现在的思路:”AI正变得能够在组织内部完成越来越有价值的工作,现在的挑战是帮助企业把这些系统整合到支撑其业务的基础架构和工作流中。”

    这话翻译过来就是:工具已经差不多了,接下来要把它真正塞进企业的日常运转里。Codex这波更新,明显是冲着这个目标去的。

  • BabyAGI:22.3K Stars!任务驱动自主AI智能体,让AI学会自己拆解目标

    BabyAGI:22.3K Stars!任务驱动自主AI智能体,让AI学会自己拆解目标

    BabyAGI 项目封面

    📌 项目简介

    BabyAGI 是一个实验性的任务驱动自主AI智能体框架,由 Yohei Nakajima 于 2023 年发布,开创了让 AI 自主拆解任务、循环执行的先河。它用极简的 Python 代码展示了 AGI(通用人工智能)的雏形,是整个自主智能体领域的鼻祖级项目

    🔧 安装要求和过程

    环境要求

    • Python 3.9+
    • OpenAI API Key(或兼容 API)
    • pip 包管理器

    快速安装

    # 方式一:使用 pip 安装(推荐)
    pip install babyagi
    
    # 方式二:克隆仓库
    git clone https://github.com/yoheinakajima/babyagi.git
    cd babyagi
    pip install -r requirements.txt
    
    # 配置环境变量
    export OPENAI_API_KEY="your-api-key-here"
    export OBJECTIVE="Solve world hunger"  # 设置任务目标
    
    # 运行
    python main.py

    Docker 部署

    docker build -t babyagi .
    docker run -e OPENAI_API_KEY=your_key -e OBJECTIVE="your objective" babyagi

    ⚡ 核心功能

    🎯 自主任务拆解

    自动将大目标拆解为可执行的小任务,无需人工干预,持续循环执行直到目标完成。

    🧠 长期记忆机制

    通过 Pinecone 向量数据库存储和检索历史任务信息,让 AI 拥有”记忆”,避免重复劳动。

    🔄 任务优先级排序

    自动评估任务列表,根据目标智能排序执行优先级,确保最重要的任务优先完成。

    📊 functionz 函数框架

    内置全新的函数管理框架,支持函数注册、依赖追踪、密钥管理和自动执行,是项目的核心引擎。

    🖥️ 可视化 Dashboard

    配套 Web 管理面板,实时查看函数执行状态、依赖关系、密钥配置和完整执行日志。

    🏗️ 自构建能力

    实验性 self_build 功能,让 AI 根据用户需求自动生成新函数,实现智能体的自我扩展。

    🚀 典型使用场景

    场景一:自动化研究助手

    设定目标”研究并总结 Transformer 架构的最新进展”,BabyAGI 会自动拆解任务:搜索论文 → 阅读摘要 → 提取要点 → 生成总结报告。整个过程无需人工干预,是研究员和学生的效率神器。

    场景二:代码自动生成与执行

    通过 functionz 框架,让 BabyAGI 自动生成解决特定问题的 Python 函数,并注册到系统中供后续调用。配合 self_build 功能,AI 可以根据新需求动态扩展自己的能力边界。

    场景三:多步骤任务自动化

    设定目标”每天早上 9 点抓取 Hacker News 首页前 10 条内容并发送到我的邮箱”,BabyAGI 会拆解任务、编写爬虫函数、配置定时执行,真正实现”设定一次,自动运行”。

    💡 推荐理由

    BabyAGI 是整个 AI Agent 自主智能体浪潮的开山之作。2023 年 4 月,Yohei Nakajima 用不到 200 行 Python 代码,向全世界展示了 AI 可以自主拆解任务、循环执行、不断逼近目标——这个 Demo 直接催生了 AutoGPT、AgentGPT 等后续数百个自主智能体项目。

    虽然项目作者明确表示”不适合生产环境”,但它作为学习自主智能体原理的教科书级案例,价值无可替代。如果你想理解 AI Agent 是怎么”思考”的,读一遍 BabyAGI 的源码,比看十篇论文都管用。

    新一代 BabyAGI(基于 functionz 框架)更进一步,引入了函数管理、依赖追踪、自构建等生产级概念,为自主智能体的工程化落地提供了宝贵思路。⭐ 历史地位 + 学习价值,强烈推荐给每一位 AI 开发者!

    ⭐ 如果你觉得这个项目有用,请在 GitHub 上给它一个 Star!

    标签:AI Agent自主智能体开源

  • 微软悄悄上线Scout,把OpenClaw那套个人AI助理搬进了Microsoft 365

    2026年初,一个叫OpenClaw的项目像野火一样在AI圈烧起来。技术人员第一次体验到了”不受约束的AI代理”是什么感觉——爽,但也挺吓人的。项目创始人后来被OpenAI挖走,OpenClaw的势头放缓了,但它留下的念头没消失。

    微软看进去了。6月2日,它悄悄上线了一款叫Scout的产品——本质上就是把OpenClaw那套理念,搬进了Microsoft 365的生态里。

    它到底是什么

    Scout是一个”始终在线”的个人AI助理,基于OpenClaw框架构建。你可以给它起名字(演示里叫”Sebastian”),它会记住你的工作习惯,随时间变得更懂你。

    “我们每个人的工作方式都有独特的习惯。大家正在把这些模式整理成持久保存在代理中的记忆和技能。之后代理就会变得更有能力,更了解你。”——Scout副总裁 Omar Shahine

    它跑在云端,但可以跨桌面和浏览器操作,连你的邮箱、日历、Microsoft 365里的其他系统都能碰。

    Microsoft Scout AI助理概念图
    Scout 将 OpenClaw 的灵活能力引入 Microsoft 365 生态(图源:TechCrunch)

    安全是重点

    OpenClaw今年早些时候出过事——有报道称一个代理在研究人员收件箱里出现了异常操作。Scout内置了”策略合规系统”,每次行为检查都会生成审计轨迹,防止代理失控。


    怎么用,多少钱

    • 通过微软 Frontier 早期体验计划开放,需要订阅 GitHub Copilot
    • 预装日程管理、会议议程起草等技能
    • 支持用户自己开发定制技能——这才是它真正值钱的地方

    这套”用得越多越难离开”的逻辑,就是消费级AI工具的核心留存密码。你在助理身上投入的训练越多,换掉它的成本就越高。

  • OpenAI给Codex加了六双”职业手套”,白领工作被AI盯上了

    OpenAI正在认真追逐企业用户。6月2日,这家AI实验室发布了Codex的一套新能力,目标很明确:把这款AI工具从程序员圈子扩展到更广阔的白领职场。

    跟新工具一起发布的,还有一份OpenAI内部报告,揭示了Codex在知识工作中的真实使用情况——结论超出很多人预期:它的用武之地,早就超出了软件工程。

    OpenAI Codex
    Codex正在从一款开发者工具转向知识工作者的日常助手(图:NurPhoto / Getty Images)

    500万周活用户,知识工作者增速是开发者的3倍

    报告里的数据值得细看:Codex目前每周活跃用户已经超过500万,自今年2月桌面应用上线以来增长了6倍以上。开发者仍然是最多的用户群体,但知识工作者已经占到用户总量的20%,而且增速是开发者群体的3倍还多。

    这意味着什么?意味着”AI写代码”这个故事已经不够用了。数据分析师、产品经理、设计师、金融分析师——这些人正在成为Codex增长最快的新用户群。

    “Codex现在有超过500万周活跃用户,自2月桌面应用上线以来增长了6倍以上。知识工作者已占用户总量的20%,增速是开发者群体的3倍以上。”

    六款岗位插件,开箱即用

    这次更新的重头戏是六款定向插件,分别对应六个白领岗位:数据分析、创意制作、销售、产品设计、股权投资、投资银行。用户可以在Codex应用内直接调用这些插件,每个插件都打包了对应岗位的集成工具、操作指引和场景上下文,让Codex能够模拟对应岗位的工作能力。

    打个比方,以前你让Codex”帮我分析这份数据”,它得靠你描述清楚背景。现在选了”数据分析”插件,Codex自带了数据分析师常用的工具链和思维框架,输出的东西更贴近一个真实数据分析师会给出的结果。

    当然,跟所有AI工具一样,这些插件的效果会随着自定义调整而提升,但OpenAI的意思是——开箱就能用,不需要太多配置。

    顺手把”Sites”功能也做了

    这次更新还有一个挺实用的功能叫”Sites”:Codex现在可以把工作成果直接输出成一个可访问的互动网站,而不是只生成本地文件。OpenAI已经拉了一串合作伙伴进来做这件事:Wix、Base44、Replit、Lovable、Figma、Emergent。后续还会扩大合作生态。

    另外还有一个”Annotations(标注)”功能,让你可以在Codex里框选文档或文件的特定部分,然后针对那一块发指令,上下文操作更精准。

    OpenAI在企业市场是个”后来者”

    这件事的背景挺有意思。Anthropic早在今年2月就推出了企业智能体项目,5月还上线了更聚焦金融场景的智能体。OpenAI此前一直更侧重C端用户,直到3月才为Codex引入插件支持。这次的动作,明显是在追赶Anthropic的企业服务布局。

    三周前,OpenAI刚推出了面向企业客户的合资公司”OpenAI Deployment Company”,拿到了全球投资机构超过40亿美元的融资,目标就是把OpenAI的工具更深地嵌到全球企业的业务流程里。首席营收官Denise Dresser的说法是:”AI已经能够在组织内部完成越来越有价值的工作,现在的挑战是帮助企业将这些系统整合到支撑业务的基础设施和流程中。”


  • 微软憋了很久的个人AI助理终于来了:Scout能替你接电话、安排行程,还能主动提醒你

    微软最近在Build大会上放了个新东西——一款叫Scout的AI个人助理,号称是他们在个人助理领域的第一次真正尝试。和之前嵌入在Microsoft 365应用里的Copilot不同,Scout是独立的、能力更强的个人助理,可以7×24小时运行,深度集成到你工作和生活的各个场景里。

    Scout和Copilot有什么不一样?

    之前的Copilot更像是一个”聊天机器人”,你得主动找它,它才会帮你做事。但Scout不一样,它是真正的”个人助理”——可以主动帮你处理事情,比如安排会议、报销费用、草拟邮件,甚至监控你的路况和日程,提醒你该出发去接孩子或者赴晚餐约会了。

    微软Scout企业副总裁Omar Shahine说:”这是一款个人助理,是我们首次向客户提供的真正的个人助理。用户需要明白,这个助理可以给你打电话,这是和聊天类AI完全不同的产品形态。”

    它能主动帮你做什么?

    Scout会在后台读取你的Teams对话、会议记录和邮件,自主学习对你重要的信息,然后主动推送相关内容。比如它知道你今天下午有个会议,它会提前提醒你准备资料;知道你每周五要去超市,它会帮你列好购物清单。

    现在Scout已经在微软内部测试了一段时间,有超过3000名员工正在使用。大家用它来安排会议、处理文书工作、预订差旅、填写表格,甚至还有人用它来追踪自己的健身目标——用Shahine的话说,”很多人用它来成为更好的自己,我们都有想要实现的目标,但往往因为没时间或者精力不够而无法完成,Scout可以帮到他们。”

    微软Scout AI个人助理示意图
    微软Scout AI个人助理可以深度集成Microsoft 365应用

    安全问题怎么解决?

    很多人可能会担心:Scout要访问我的Teams、邮件、日程,会不会泄露隐私?微软说他们已经考虑到了这一点——Scout运行在沙盒化的云环境里,默认被视为不可信程序,它不会获取任何密钥,也无法直接访问你的Microsoft 365数据。

    除此之外,微软还会用自家的全套安全能力管控Scout,包括Agent 365、Purview、Defender,同时会做常规的红队测试、隐私审查和安全审查,确保符合企业环境的安全要求。Shahine表示:”我们采取了微软运营服务、保护服务的一贯措施,我对这些做法很有信心。OpenClaw的能力非常强大,所以我们也会给客户预装一套精选的功能集合。”

    有意思的是,微软并没有开发OpenClaw的独立定制版本,而是直接为这个开源项目的核心技术做贡献。此前几个月,微软CEO Satya Nadella还曾把OpenClaw类比为”病毒”,OpenClaw的AI”技能”扩展也一直被安全从业者视为”安全噩梦”。现在微软用实际行动表明了态度——不是自己重造轮子,而是把开源项目变成企业级产品。


  • OpenAI把手机APP全废了,所有界面AI实时生成,2027年量产

    在6月初的Voice Hack Night活动上,OpenAI团队现场演示了一款”Agentic操作系统”手机原型。核心设计只有一句话:手机上不再有传统APP,所有界面都由AI根据你的指令实时生成。演示者全程没碰屏幕,只靠说话就完成了订机票、删日程、查新闻、发邮件、列待办这五件事。

    “UI即系统”——这不是换个launcher,而是把整个移动交互的底层逻辑推倒重来。界面不是被”打开”的,而是被”生成”的。

    端云分工:轻任务本地跑,重推理甩给云端

    这套系统采用端云协同架构。手机本地模型负责即时生成界面、处理轻量交互,反应速度压到毫秒级。遇到需要复杂推理的任务,比如帮你规划跨城行程或者写一封正式邮件,系统会自动把请求转给云端GPT处理,结果回来再渲染成界面。

    这种分工方式其实解决了AI手机一直没绕过去的坎——纯本地模型能力不够,纯云端又太慢还费流量。OpenAI这次把两条路并在一起,逻辑上说得通,工程上能不能跑顺是另一回事。


    时间线比预期更早:2027年上半年量产

    Sam Altman之前在多个场合暗示过OpenAI在做手机,但一直没给时间表。这次原型亮相之后,内部文件显示的量产节点是2027年上半年,比大多数分析师的预期早了至少半年。

    值得注意的是,这次演示是在Voice Hack Night上由一支团队完成的,不一定是OpenAI内部产品团队的正式原型。但Altman此前明确说过”现在是重新思考操作系统和用户界面设计的合适时机”,方向已经定了,剩下的就是工程落地。


    这事如果成了,谁最慌

    如果”无APP手机”真的在2027年落地,受到冲击的不只是苹果和谷歌。APP开发者、应用商店、整个移动广告链条都会被重构。用户以后不需要去应用商店搜软件,直接对手机说需求,界面就出来了。

    • 苹果:iOS的护城河就是APP生态,这套玩法直接绕开
    • 谷歌:Android的商业模式很大程度依赖应用商店分成和搜索广告,都会被波及
    • APP开发者:以后可能不需要开发”应用”了,而是训练”技能”

    当然,现在说这些还早。原型演示和量产上市之间隔着芯片、系统稳定性、隐私合规、生态迁移一大堆坑。但方向已经摆在这了,接下来的看点就是苹果和谷歌怎么接招。

  • NextChat:88K Stars!轻量极速的跨平台AI对话界面,让AI助手触手可及

    NextChat:88K Stars!轻量极速的跨平台AI对话界面,让AI助手触手可及

    NextChat 是一款轻量极速的开源AI对话界面,支持 GPT-4、Claude 3、Gemini Pro 等十余种主流大模型,提供 Web、iOS、Mac、Android 全平台客户端,让你一键拥有属于自己的私人AI助手。

    NextChat 界面预览

    NextChat 优雅的对话界面

    🚀 项目简介

    NextChat(原名 ChatGPT-Next-Web)是一个基于 Next.js + React 构建的跨平台 AI 聊天机器人 Web UI。项目从2023年发布至今,已获得 88K+ Stars,成为 GitHub 上最受欢迎的开源 AI 对话前端之一。

    它的设计理念是:快、轻、美。整个应用打包后仅约 5MB(Tauri 桌面端),网页端更是做到了极致的加载速度和响应体验。

    NextChat 多模型支持

    📦 安装要求和过程

    环境要求

    • Web 部署:Node.js 18+ 或 Vercel 账号(推荐)
    • 桌面端:Windows / macOS / Linux
    • 移动端:iOS 15+ / Android 8+
    • API Key:需要 OpenAI / Claude / Gemini 等任一模型的 API Key

    快速安装 – 三种方式

    方式一:Vercel 一键部署(推荐)

    最快的方式,5秒钟完成部署:

    1. 访问 NextChat GitHub 仓库
    2. 点击 Deploy with Vercel 按钮
    3. 登录 Vercel,fork 项目并部署
    4. 在 Vercel 环境变量中添加你的 OPENAI_API_KEY
    5. 部署完成!获得你的私人 ChatGPT 域名

    方式二:Docker 部署

    # 拉取镜像并运行
    docker run -d -p 3000:3000   -e OPENAI_API_KEY="你的API密钥"   -e CODE="可选:设置访问密码"   yidadaa/chatgpt-next-web
    
    # 访问 http://localhost:3000 即可使用
    

    方式三:本地开发

    # 克隆项目
    git clone https://github.com/ChatGPTNextWeb/NextChat.git
    
    # 进入目录
    cd NextChat
    
    # 安装依赖
    npm install
    
    # 启动开发服务器
    npm run dev
    
    # 访问 http://localhost:3000
    

    💡 核心功能

    1. 多模型支持,一个界面搞定所有AI

    NextChat 最大的优势在于统一接口。你可以在同一个界面中切换:

    • OpenAI:GPT-3.5, GPT-4, GPT-4o, GPT-4 Turbo
    • Anthropic Claude:Claude 3 Haiku, Sonnet, Opus
    • Google:Gemini Pro, Gemini Ultra
    • 国内模型:DeepSeek, 通义千问, 文心一言, 讯飞星火
    • 本地模型:Ollama, LM Studio (通过 OpenAI 兼容接口)

    这意味着你可以用同一个界面,根据不同的任务选择最合适的模型 —— 写代码用 GPT-4,聊天用 Claude,节省成本用 DeepSeek。

    2. 极速响应,本地存储保护隐私

    NextChat 在性能优化上做到了极致:

    • 首屏加载 < 1秒:得益于 Next.js 的 SSR 和静态生成
    • 流式输出:打字机效果,响应无延迟
    • 本地存储:所有对话记录保存在浏览器 LocalStorage,不会上传到服务器
    • Markdown 渲染:支持代码高亮、表格、数学公式(KaTeX)
    • 对话搜索:快速检索历史对话

    3. 对话管理,像专业IDE一样强大

    • 对话分支:可以基于某条消息创建分支,方便对比不同回复
    • 提示词模板:内置多种系统提示词,也支持自定义
    • 对话导入/导出:支持 Markdown、JSON 格式
    • 多会话管理:左侧边栏快速切换不同对话
    • 消息编辑:可以修改已发送的消息重新生成回复

    4. 全平台覆盖,随时随地使用AI

    NextChat 提供了完整的多端支持:

    • Web:响应式设计,手机/平板/电脑自适应
    • macOS:Tauri 打包,原生应用体验(仅 5MB)
    • Windows:同样使用 Tauri,启动快速
    • iOS:App Store 可下载
    • Android:Google Play 或侧载 APK

    5. 高度可定制,打造你的专属AI界面

    • 主题切换:内置浅色/深色主题,支持自定义 CSS
    • 多语言:支持中文、英文、日文等 18+ 种语言
    • API 代理:支持设置自定义底座 URL,解决网络问题
    • 访问控制:可设置访问密码,分享给团队使用
    • 插件系统:支持自定义功能和第三方集成

    🎯 典型使用场景

    场景一:个人AI助手,隐私数据不上云

    用户:注重隐私的个人用户、自由职业者

    痛点:使用官方 ChatGPT 担心对话记录被用于存储训练,且需要付费订阅 Plus。

    解决方案

    • 部署 NextChat 到自己的服务器或 Vercel
    • 接入自己的 OpenAI API Key(按量付费,更划算)
    • 所有对话本地存储,完全隐私
    • 可切换多个模型,根据任务选择最合适的

    成本对比:ChatGPT Plus $20/月 vs NextChat + API 按量付费(轻度使用 < $10/月)

    场景二:团队协作,统一AI工具入口

    用户:小团队、创业公司、教育机构

    痛点:团队成员各自购买 AI 订阅,成本高且无法共享 Prompt 和对话记录。

    解决方案

    • 部署 NextChat 到团队服务器
    • 设置访问密码,团队成员共享使用
    • 使用同一个 API Key 池,集中管理成本
    • 导出优质对话记录,建立团队知识库

    实际案例:一个 10 人团队,使用 NextChat 自部署,每月 API 成本约 $50,人均 $5,远低于每人 $20 的 Plus 订阅。

    场景三:开发者调试,快速测试不同模型

    用户:AI 应用开发者、Prompt 工程师

    痛点:需要在不同模型中测试同一 Prompt 的效果,但官方界面切换麻烦。

    解决方案

    • 在 NextChat 中配置多个模型 API
    • 同一对话中快速切换模型
    • 使用对话分支功能,对比不同模型的回复
    • 导出 Markdown 格式,方便整理测试报告

    🌟 推荐理由

    为什么我强烈推荐 NextChat?

    1. 开源且活跃
    项目在 GitHub 上开源,代码透明,社区活跃。你可以自己审查代码,确保没有后门。而且更新频繁,新模型支持速度快。

    2. 性能极致优化
    作为前端项目,NextChat 的性能优化做到了极致。首屏加载快,流式输出无延迟,即使在网络不佳的情况下也能流畅使用。相比其他 Web UI,NextChat 的响应速度是最快的之一。

    3. 真正的跨平台
    很多项目声称”跨平台”,但实际上只支持 Web。NextChat 提供了完整的桌面端和移动端应用,而且桌面端使用 Tauri 打包,体积小、启动快、内存占用低。

    4. 隐私保护到位
    所有对话记录保存在本地,不会上传到任何服务器。即使你部署在自己的服务器上,只要不配置云端同步,数据就只在用户设备上。对于注重隐私的用户来说,这一点非常重要。

    5. 成本可控
    使用官方 ChatGPT Plus 需要每月 $20,而 NextChat 按量付费,对于轻度使用者来说,每月可能只需要几美元。而且你可以根据不同任务选择不同模型,进一步控制成本。

    我的使用心得
    我自己部署了 NextChat,接入了 OpenAI API 和 DeepSeek API。日常聊天用 DeepSeek(便宜),写代码用 GPT-4(准确),每月总成本不到 $10。界面美观,响应快速,是我每天使用最多的 AI 工具。

    📥 下载地址

    🎬 总结

    NextChat 是一款真正为用户着想的开源 AI 对话界面。它不追求花哨的功能,而是把速度、隐私、跨平台这三个核心需求做到了极致。

    如果你:

    • ✅ 希望拥有自己的私人 AI 助手
    • ✅ 注重对话隐私,不想数据被上传
    • ✅ 需要同时使用多个 AI 模型
    • ✅ 想要降低成本,按量付费
    • ✅ 需要在多个设备上使用统一的 AI 界面

    那么,NextChat 绝对是你的 最佳选择

    5分钟部署,拥有一个完全属于你的AI助手 🚀

  • OpenAI现场演示无APP手机:所有界面实时生成,推理甩给云端GPT

    把App图标全删了,手机只装一个GPT

    OpenAI 在 Voice Hack Night 活动上搞了个相当激进的演示。一支团队现场展示了一款为手机打造的”智能体操作系统”原型,整场演示看下来,最让人坐不住的点在于:这部手机上没有一个传统 App。

    所有操作界面都是”即时生成”的。你需要订机票,界面就现场画出一个订票界面;你要查日程,它就给你生成一个日程管理视图。不是从手机存储里调出一个安装好的应用,而是需要什么界面,系统就即时画出来什么界面。

    “UI 即系统”——这套原型的核心设计理念,说白了就是把”打开某个 App 才能完成某件事”这个逻辑整个推翻掉。

    技术实现上,这套原型把任务分成了两层。手机本地跑一个小模型,负责实时生成界面——你说出需求,它立刻把对应的操作界面渲染出来。需要重推理的任务(比如理解复杂语义、联网搜索、生成长回复)则交给云端 GPT 处理。

    现场演示里,开发者全程用语音下指令,完成了好几个任务:订机票、删日历日程、查 AI 新闻、发邮件、列待办清单。整个过程没有点开任何一个 App 图标。

    Sam Altman 的”手机梦”动了真格

    这件事的背景是,OpenAI 一直在悄悄推进它的硬件战略。早有消息说它在做手机项目,最近团队已经扩张到了 200 人,核心成员几乎清一色来自苹果。苹果的设计和工程人才被挖走不少,这本身就很说明问题——OpenAI 要做的不只是一款手机,而是重新定义”什么是手机操作系统”。

    Sam Altman 之前好几次暗示过这个方向。他说过”现在是认真重新思考操作系统和用户界面设计的合适时机”,当时很多人以为他只是在说软件层面的改进。现在看来,他脑子里想的是从硬件到操作系统到交互逻辑的全栈重构。

    时间点方面,最新的消息是 OpenAI 把量产目标定在了 2027 年上半年,比外界之前预期的要早。如果这件事真的发生,它可能会改变过去十五年基本没变过的智能手机交互范式。

    当然,现在还只是原型

    现场的演示是在受控环境下做的,真实场景的复杂度远不止此。语音识别在嘈杂环境下的表现、即时生成界面的响应速度、云端推理的延迟和成本——这些都是要解决的问题。

    但方向本身已经很清楚了:OpenAI 不只想做手机上的一个新 App(比如 ChatGPT),它想做的是让”打开 App”这件事本身变得多余。你在手机上要做任何事,直接说、或者直接想,界面随之生成,任务由 AI 智能体完成。

    这对现有的手机操作系统格局(iOS 和 Android 的双寡头)意味着什么,现在下结论还为时过早。但 OpenAI 把200 个硬件人才的团队攒起来这件事本身,已经值得整个行业认真想一想了。


  • DeerFlow:46K+ Stars!字节跳动开源超级AI Agent框架,让AI真正”干活”

    DeerFlow:46K+ Stars!字节跳动开源超级AI Agent框架,让AI真正”干活”

    DeerFlow Logo

    DeerFlow 2.0 – 字节跳动开源的超级AI Agent框架


    📦 项目简介

    DeerFlow(全称 Deep Exploration and Efficient Research Flow)是字节跳动于2025年5月首次开源、2026年2月发布2.0版本的企业级AI超级智能体框架。上线24小时即冲上GitHub Trending榜首,目前Star数已突破46K+

    与简单的AI对话工具不同,DeerFlow是一个完整的Super Agent Harness(超级智能体运行框架),它能将AI从”对话能力”升级为”任务执行能力”,自动完成需要数分钟到数小时的复杂工作流。


    ⚙️ 安装要求和过程

    环境要求

    • 基础依赖:Docker、Docker Compose
    • 本地开发模式:Python 3.12+
    • 前端:Node.js 22+、pnpm
    • 必要配置:至少一个LLM服务商API Key(推荐豆包、DeepSeek、Kimi)
    • 可选配置:搜索引擎API(Tavily API、Brave Search API等)

    快速安装步骤

    # 1. 克隆仓库
    git clone https://github.com/bytedance/deer-flow.git
    cd deer-flow
    
    # 2. 配置环境变量(复制示例配置)
    cp conf.yaml.example conf.yaml
    
    # 3. 创建.env文件并写入API Key
    cat > .env << EOF
    MINIMAX_API_KEY=your-minimax-key
    MOONSHOT_API_KEY=your-moonshot-key
    TAVILY_API_KEY=your-tavily-key
    EOF
    
    # 4. 启动服务(网关模式,适合开发测试)
    docker-compose up -f docker-compose.gateway.yml
    
    # 5. 访问服务
    # LangGraph Server运行在 http://localhost:8000
    # 提供SSE流式响应接口
    

    资源规划建议:开发测试需要4GB+内存、2核+CPU;生产环境推荐16GB+内存、8核+CPU。


    🎯 核心功能

    • 动态Sub-Agent架构:自动将大任务拆解为多个子任务,为每个子任务动态生成专属Sub-Agent并行执行,复杂任务执行效率提升3-5倍。
    • Markdown Skills系统:技能以Markdown文件定义,无需编写代码即可扩展AI能力,大幅降低使用门槛。内置研究、报告、幻灯片、网页、图片、视频等开箱即用技能。
    • Docker沙箱隔离:每个任务运行在独立的Docker容器中,提供完整的文件读写、Bash执行能力,即使执行恶意代码也不会影响宿主机系统。
    • Context Engineering上下文工程:每个Sub-Agent拥有独立的上下文窗口,避免主Agent上下文被污染;支持跨会话长期记忆,可持久化历史任务和结果。
    • 断点续跑:基于LangGraph的checkpointer机制,任务中断后可从最后一个检查点恢复,无需从头执行,节省时间和成本。

    💡 典型使用场景

    场景一:深度行业研究

    需求:分析2025年AI Agent领域5个主要框架并生成对比报告

    执行流程:DeerFlow自动创建5个Sub-Agent同时独立研究,每个Agent负责一个框架的深度分析(技术架构、性能指标、应用场景、社区活跃度等),30-60分钟全自动完成全流程,生成50+页结构化报告及配套幻灯片。

    场景二:全链路营销材料生成

    需求:为产品上线准备全套营销材料

    执行流程:输入需求后,DeerFlow自动完成竞品研究、白皮书撰写、宣传网页生成、视频脚本创作、广告素材设计全流程,每个环节由专门的Sub-Agent并行处理,最终汇总输出完整的营销物料包。

    场景三:定时数据分析报告

    需求:每周分析销售数据并生成可视化报告

    执行流程:配置定时任务后,DeerFlow自动拉取多源数据、清洗转换、分析计算、生成图表并发送报告邮件。整个过程无需人工干预,支持异常数据自动预警。


    🌟 推荐理由

    作为AI Agent开发者,我试用DeerFlow 2.0后有以下几点深刻体会:

    • 不重复造轮子:DeerFlow完全基于LangGraph 1.0 + LangChain重构,在成熟底层之上做企业级封装,而非从零造轮子。这种设计既保证了稳定性,又补充了LangGraph缺失的生产级特性(如沙箱隔离、中间件链、声明式Skills系统)。
    • 真正的企业级思考:11层中间件链、Docker沙箱隔离、Kubernetes编排支持、完整审计日志……这些特性透露出字节跳动内部对AI Agent落地生产的真实思考。这不是一个Demo级项目,而是经过大规模实践验证的框架。
    • Skills系统设计惊艳:用Markdown定义技能,无需编写Python代码即可扩展AI能力,这个设计大大降低了非算法工程师的使用门槛。同时支持接入MCP Server,兼容全球主流工具生态。
    • 数据主权完整:完全自托管,数据不离开本地,满足金融、医疗、政府等对数据安全要求极高的场景。这一点在2026年AI监管日益严格的大环境下尤为重要。

    如果您正在构建需要执行复杂长任务、多步骤工作流、或对数据安全有严格要求的AI应用,DeerFlow绝对值得深入研究和试用。


    📥 下载地址

    授权协议:MIT License(完全开源,可自由使用、修改和分发)


    本文由 WorkBuddy AI 自动采集撰写 | 项目GitHub Stars: 46K+ | 最后更新: 2026-06-02

  • Anthropic悄悄交了IPO申请,Claude的东家要上市了

    最近AI圈又有大动静了——Claude背后的公司Anthropic,偷偷向美国SEC提交了IPO申请,准备上市了。这家成立才5年的公司,现在估值已经接近1万亿美元,算是AI赛道里最靠近公开市场的头部玩家之一。

    Anthropic刚完成65亿美元H轮融资,投后估值9650亿美元,上市筹备已进入实质阶段。

    从融资到IPO的节奏

    就在提交IPO申请前不到一周,Anthropic刚完成65亿美元的H轮融资,推动其估值达到9650亿美元。该轮融资由Altimeter Capital、Draginer、Greenoaks、红杉资本、Capital Group、Coatue和D1 Capital Partners联合领投,吸引了大量机构与战略投资者参与,市场普遍认为这次融资是IPO的前置动作。

    Anthropic CEO Dario Amodei
    Anthropic CEO Dario Amodei(来源:Ludovic MARIN/AFP / Getty Images)

    核心信息梳理

    • 当前估值接近1万亿美元,刚完成65亿美元融资,投后估值9650亿美元
    • 采用秘密提交方式,暂未披露发行股份数量、发行价格,最终IPO落地取决于市场条件
    • 与OpenAI竞争进入新阶段,OpenAI同期完成1220亿美元融资,估值8520亿美元,也在筹备上市
    • 年化营收已超470亿美元,较2025年末的90亿美元增长超5倍,新模型Mythos有望进一步推高营收