标签: AI

  • 做AI写作工具的Superhuman,把AI检测工具GPTZero买了

    做AI写作工具的Superhuman,把AI检测工具GPTZero买了

    AI写作和AI检测,本来像是矛和盾的关系,现在被同一家公司握在手里了。

    Superhuman收购GPTZero
    Superhuman收购AI内容检测平台GPTZero

    Superhuman(就是那个改名前的Grammarly)宣布收购GPTZero——一个专门检测AI生成内容的工具。GPTZero能做的事包括:判断一段文字是不是AI写的、检测AI幻觉(就是模型瞎编的内容)、查抄袭。

    集成到Superhuman Go

    收购之后,GPTZero会集成到Superhuman Go里。这个AI助手号称能在”100万个应用和网站”里工作,以后用户在写东西的时候,就能同时用到写作辅助和内容真实性验证两套能力。

    Superhuman的说法是,他们要做”内容真实性”的两端:一边帮用户负责任地用AI写作,一边帮用户判断读到的内容是不是AI生成的。

    教师市场仍是重点

    这个组合确实有点意思。GPTZero之前最有名的用户群体是教师——老师们用它来检测学生作业是不是用ChatGPT写的。Superhuman收购后表示,教育市场仍然是重点,会把GPTZero的工具直接嵌到用户已经在用的写作场景里。

    当然,这事在外人看来有点矛盾:你一边卖AI写作工具,一边卖AI检测工具,这不是自己打自己吗?但Superhuman的逻辑是,用户既需要AI帮助写作,也需要知道哪些内容是AI生成的——两个需求同时存在,不如都攥在自己手里。

    收购金额没披露。GPTZero会继续以独立品牌运营,Superhuman方面表示不会把它完全吞掉,而是让它继续服务已有的用户群。


  • 白宫想要审查Meta的AI模型,扎克伯格还在犹豫

    白宫想要审查Meta的AI模型,扎克伯格还在犹豫

    就在各家公司争相把AI模型开放给美国政府审查的时候,Meta选了最后一个当”钉子户”。

    Meta拒绝美国政府AI审查
    白宫与Meta在AI审查问题上的博弈

    《纽约时报》的报道说,白宫官员正在向Meta施压,要求它把AI模型提交给”AI标准与创新中心”(CAISI)做安全评估。OpenAI、Anthropic、Google、xAI、微软早就签了协议,只有Meta还没松口。

    行政令背后的推力

    这事可不是突然冒出来的。6月2日,特朗普签了一份行政令,要求前沿AI模型在公开发布前,给联邦专家最多30天的时间做审查。政府这边要在7月底前把正式评审流程搭好,但其他公司实际上已经交了几个月的作业了。

    CAISI这个单位是专门找软件漏洞、防网络攻击、阻止军事滥用的。政府现在最想看的,包括Meta今年4月刚发布的Muse Spark模型——这个模型还带了个专门的推理模式,用来处理复杂问题。

    Meta发言人的回应很外交辞令:”我们在研究具体细节,希望很快能签协议。”翻译过来就是:还在谈,别催。

    开源路线与政府审查的张力

    这事背后的张力挺有意思。Meta一直以来打的都是开源牌,跟OpenAI、Google那种把模型锁在服务器里的思路完全相反。现在政府说要提前审查,等于是要Meta把”开源”的节奏交给华盛顿来把关。

    几周前,政府刚命令Anthropic暂停Mythos 5对非美国公民的访问,理由是”国家安全关切”。这个信号发出去之后,剩下的公司基本都乖乖交卷了,只剩Meta还在扛。

    Meta到底会不会最终签字,还是个未知数。从它过去几年跟监管打交道的方式来看,拖字诀是常用手法——能拖就拖,拖到对自己最有利的时点为止。


  • deer-flow:ByteDance 开源超级智能体框架,74K+ Stars 让 AI 处理小时级复杂任务

    deer-flow:ByteDance 开源超级智能体框架,74K+ Stars 让 AI 处理小时级复杂任务

    2026年2月,ByteDance(科技公司)开源了其内部打磨多时的超级智能体框架 deer-flow 2.0,发布当天即登顶 GitHub Trending 榜首,目前已收获 74,000+ Stars。这不仅仅是一个”AI聊天机器人”,而是一个能够处理分钟级到小时级复杂任务的长周期智能体框架——从深度研究、代码编写,到内容创作、幻灯片制作,deer-flow 都能自主规划并执行。

    🦌 项目简介

    deer-flow(鹿流)是 ByteDance 开源的长周期超级智能体框架(Super Agent Harness),由初代 Deep Research 框架完全重构而来。它支持研究、编码、内容创作等复杂任务,通过沙箱隔离、持久化记忆、工具调用、子智能体协作等能力,处理从几分钟到数小时的各类任务。2.0 版本为完全重构版本,架构更清晰、扩展性更强。

    deer-flow GitHub OpenGraph 图片
    deer-flow 2.0 – ByteDance 开源超级智能体框架

    🛠 安装要求和过程

    环境要求

    • Python:3.12+(推荐使用 uv 管理依赖)
    • Node.js:22+(前端界面需要)
    • pnpm:前端包管理工具
    • Docker:推荐部署方式(可选,用于沙箱隔离)
    • 操作系统:macOS / Linux / Windows(WSL2)

    快速安装(3分钟上手)

    # 1. 克隆仓库
    git clone https://github.com/bytedance/deer-flow.git
    cd deer-flow
    
    # 2. 运行交互式配置向导(2分钟完成,生成 config.yaml 和 .env)
    make setup
    
    # 3. 安装依赖(本地开发模式)
    make install
    
    # 4. 启动本地服务
    make dev
    # 访问地址:http://localhost:2026
    

    配置向导会引导你设置 LLM 提供商(支持 OpenAI / DeepSeek / MiniMax / Qwen / 本地 vLLM 等)、网页搜索提供商(Tavily / Brave / Exa 等),无需手动编辑配置文件。配置完成后可随时运行 make doctor 验证配置是否正确。

    Docker 部署(推荐生产环境)

    # 开发模式(支持热重载)
    make docker-init    # 仅首次或沙箱镜像更新时运行
    make docker-start   # 启动服务
    
    # 生产模式
    make up             # 构建镜像并启动所有生产服务
    make down            # 停止并删除容器
    

    🎯 核心功能

    • 🧠 子智能体调度:主智能体可按需创建子智能体,每个子智能体拥有独立上下文、工具和终止条件;子智能体支持并行执行,执行结果结构化返回,主智能体最终汇总输出。长任务可拆分为多个子步骤,支持分钟到小时级别的复杂任务处理。
    • 📦 沙箱与文件系统隔离:每个任务拥有独立执行环境,支持文件读写、编辑、图像查看;支持多种沙箱模式:本地执行、Docker 隔离容器执行、Kubernetes Pod 执行。沙箱内文件路径 /mnt/user-data/ 下包含 uploads/(用户上传文件)、workspace/(智能体工作目录)、outputs/(最终交付物)。
    • 🧩 技能与工具扩展:内置研究、报告生成、幻灯片制作、网页生成、图像/视频生成等开箱即用技能;支持自定义技能、MCP 服务器扩展、Python 函数自定义工具;技能按需加载,避免上下文窗口过度占用;支持通过 /skill-name 前缀手动激活单轮技能。
    • 💾 长期记忆:跨会话持久化存储用户偏好、技术栈、常用工作流等信息;自动跳过重复记忆条目,避免记忆无限膨胀;记忆本地存储,用户完全可控。让智能体”记得”你之前的项目背景和编码习惯。
    • 🔌 IM 渠道集成:支持接入 Telegram、Slack、飞书、企业微信、钉钉、微信等 IM 渠道,无需公网 IP 即可接收任务。在聊天工具中直接使用 /new/status/models/memory 等命令管理对话和智能体。
    • 📊 可观测性:内置 LangSmith、Langfuse 可观测性集成,支持全链路 LLM 调用、智能体运行、工具执行追踪。生产和调试时都能清晰了解智能体的决策过程。

    💡 典型使用场景

    场景一:深度研究报告自动生成

    输入”研究 Transformer 架构的演进历程,输出一份 5000 字的技术报告,包含关键论文引用和架构对比图”,deer-flow 会自动规划研究步骤:搜索相关资料 → 阅读并提取关键信息 → 对比不同架构差异 → 生成结构化报告 → 输出为 PDF/Markdown。整个过程无需人工干预,耗时约 10-30 分钟。

    场景二:代码项目从零搭建

    输入”帮我搭建一个基于 FastAPI + Redis 的短链接服务,包含单元测试和 Docker 部署配置”,deer-flow 会创建子智能体分别处理:API 路由设计、Redis 缓存逻辑、测试用例编写、Dockerfile 生成。最终在 outputs/ 目录下产出完整项目代码,可直接运行。

    场景三:内容创作与多语言本地化

    deer-flow 内置内容创作技能,支持文章撰写、幻灯片制作、网页生成。结合 IM 渠道集成,可以将已有视频/文章自动翻译为多种语言并生成配音版本,实现内容的多语言分发。适合自媒体运营者和内容创作者使用。

    🌟 推荐理由

    deer-flow 2.0 是目前开源超级智能体框架中最接近”生产可用”的项目之一。与 LangChain、CrewAI 等框架相比,deer-flow 的最大特点是长周期任务处理能力——通过子智能体调度和上下文管理,它可以处理耗时数小时的复杂任务而不超出上下文窗口。这是很多同类框架做不到的。

    几个让我印象深刻的细节:

  • 上下文工程做得很到位:子智能体上下文隔离 + 自动摘要已完成子任务 + 中间结果卸载到文件系统,这套组合拳让长任务不 OOM。如果你用过其他框架处理长任务,就知道这个有多重要。
  • 沙箱设计务实:支持本地 / Docker / K8s 三种沙箱模式,开发时可以用本地模式快速迭代,生产时切到 Docker 隔离。不用一上来就搞复杂的 K8s 部署。
  • ByteDance 背书:这不是个人业余项目,是 ByteDance 内部打磨后开源的框架,2.0 版本完全重构,代码质量和文档都相当不错。74K+ stars 和 GitHub Trending 第一也证明了社区认可度。
  • IM 渠道集成很实用:无需公网 IP 就能通过飞书/企微接收任务,对国内用户非常友好。想象一下在企业微信群里 @ 一下你的 AI 智能体,它就去后台帮你跑一个深度研究任务,完成后通知你——这个体验很丝滑。

当然也有一些注意事项:项目默认设计为本地可信环境部署,不可信环境需要额外配置认证网关;生产环境扩容需要通过提升单 worker 资源配置或拆分数据库、沙箱到独立节点实现,不能直接增加 worker 数量。部署前建议仔细阅读安全文档。

📦 下载地址

  • GitHubhttps://github.com/bytedance/deer-flow(74K+ Stars,2.3K+ Commits)
  • 官方网站https://deerflow.tech(在线体验 + 完整文档)
  • 文档中心https://deerflow.tech/docs(支持英文、中文、日文、法文、俄文)
  • 在线体验https://deerflow.tech/playground(无需安装,直接试用)
  • License:MIT License(商业友好,可自由修改和分发)
  • 支持的 LLM:OpenAI / DeepSeek / MiniMax / Qwen / 本地 vLLM / 豆包 Doubao(推荐 Seed-2.0-Code)等
  • 如果你正在寻找一个能处理复杂长任务的 AI 智能体框架,或者想了解 ByteDance 级别的工程团队是如何设计超级智能体的,deer-flow 绝对值得深入研究。74K+ 社区星标不会骗你。

  • 做人形机器人的Agility要上市了,估值25亿美元

    做人形机器人的Agility要上市了,估值25亿美元

    做人形机器人的Agility Robotics昨天宣布,将通过SPAC方式上市,估值约25亿美元。合并对象是Churchill Capital Corp XI,这笔交易预计募资超过6.2亿美元,其中约2亿美元来自新老机构投资者的认购。

    Agility2015年从俄勒冈州立大学分拆出来,最出名的产品是双足机器人Digit。目前Digit已经在9家客户现场投入实际使用,包括舍弗勒(Schaeffler)、GXO、加拿大丰田工厂、拉美电商Mercado Libre。该公司背后站着亚马逊、英伟达、软银Vision Fund 2、DCVC等重磅投资方。

    “人形机器人即将成为提升生产力、供应链韧性和美国技术领导力的关键驱动力。”Agility CEO Peggy Johnson在声明中说,”Agility已经在客户环境中部署了可执行商业任务的人形机器人,帮助企业应对劳动力短缺、提升效率,并将AI驱动的自动化安全地整合到运营中。”

    这次上市募资的用途很明确:扩大下一代Digit v5的产能、交付现有订单、拓展新老客户。Agility透露,新机型已经拿到超过3亿美元的多年度订单,还有30多个潜在客户在评估大规模部署方案。

    Agility Robotics的Digit人形机器人
    Digit人形机器人正在仓库中执行搬运任务(来源:TechCrunch)

    人形机器人是不是一门好生意,这个问题在2026年已经有了不同的答案。前几年大家还在争论”人形机器人到底能干什么实际工作”,现在Agility、Figure、Boston Dynamics都在推商业部署,客户也真的在掏钱。劳动力短缺在制造业和物流业是真实痛点,人形机器人如果能稳定干活,ROI是可以算过来的。

    25亿美元的估值贵不贵?对比一下:Figure AI此前融资估值也曾达到26亿美元左右,但Agility这边已经有实际商业部署和收入,故事讲起来更扎实一些。SPAC上市虽然比传统IPO快,但合并后股价表现参差不齐,投资人会盯着Digit能不能真正规模化交付。

    合并后的公司股票将在北美某交易所挂牌,代码AGLT,具体哪家交易所还未公布。SPAC合并预计在2026年晚些时候完成。


    一句话总结:人形机器人从实验室走向仓库 floor,Agility拿下了赛道里的一个重要里程碑——不是因为估值多高,而是它证明了一件事:人形机器人真的能赚钱。

    📎 原文来源:Agility Robotics plans to go public via SPAC in a $2.5B deal | TechCrunch
  • OpenAI拿出第一块自研芯片,但它不想和你聊参数

    终于不再只靠英伟达,OpenAI拿出第一块自研芯片

    OpenAI昨天(6月24日)正式发布了首款自研AI芯片”Jalapeño”,这是一块与博通(Broadcom)合作开发的ASIC专用集成电路,专门用来跑AI推理任务——也就是处理你发给ChatGPT的那些请求。

    距离OpenAI官宣与博通合作造芯片,刚好过去了九个月。背后的算盘其实很清楚:减少对英伟达GPU的依赖。现在AI芯片紧缺,各家都在想办法摆脱”英伟达税”,微软、Meta、亚马逊也都在这条路上跑了,只是性能暂时还追不上英伟达。

    博通CEO Hock Tan在接受路透社采访时说,Jalapeño的性能可以对标英伟达的Blackwell芯片和谷歌的TPU。

    这里得解释一下,Jalapeño是一块ASIC芯片,意思就是它为特定任务而生——AI推理。推理和训练是两回事:训练是让模型”学东西”,需要吞掉海量数据;推理是用训练好的模型去回答用户问题、跑Codex这种智能体。推理芯片的要求和训练芯片不太一样,OpenAI选择从这个场景切入,算是一步稳棋。

    OpenAI把这块芯片称为”多代计算平台的第一步”,预计2026年底之前部署上线。官方说法挺克制:”虽然还在测最终性能,但早期测试显示Jalapeño的每瓦性能会比当前最先进的芯片明显更好。”

    OpenAI自研芯片Jalapeño
    OpenAI首款自研AI芯片Jalapeño,专为推理任务设计(配图为OpenAI办公室)

    这件事的意义不止于”OpenAI有了自己的芯片”。它折射出的是整个AI行业对算力的焦虑:大家都想摆脱对单一供应商的依赖,都在自研芯片这条路上加码。问题是,英伟达的护城河不只是芯片本身,还有CUDA生态——这块Jalapeño到底能不能在实际 workload 中打过Blackwell,还得等真正部署之后才能见分晓。

    有意思的是芯片名字Jalapeño(哈雷佩尼奥辣椒)。OpenAI内部给项目起食物名字不是第一次了,之前GPT系列的内部代号也用过料理-Related命名。这种做法让一家AI巨头看起来没那么”钢铁直男”,虽然本质上这还是一场算力争夺战。


    顺带一提:如果你在关注AI基础设施这条线,这块芯片值得记住——它不一定会颠覆英伟达,但会让OpenAI在和云服务商谈判时多一张牌。推理成本如果能压下来,ChatGPT的定价逻辑可能也会跟着变。

    📎 原文来源:OpenAI reveals its first AI processor: Jalapeño | The Verge
  • 这个AI不直接回答问题,它把Claude和Gemini叫来一起干活

    大多数AI模型的工作方式都很直白:你问问题,它给你答案。但日本AI创业公司Sakana AI最近发布的Fugu Ultra模型,选择了一条完全不同的路——它自己不生产答案,而是充当”调度主任”,把任务派给其他AI模型来完成。

    这个听起来有点”偷懒”的思路, benchmark跑分居然干翻了一众前沿模型。Sakana说Fugu Ultra在编码、推理、科学计算、智能体能力这些硬核测试里,成绩和Anthropic的Fable 5、Mythos Preview基本持平。一个”二传手”凭什么做到这个水平?答案藏在它的架构里。

    Sakana Fugu Ultra AI模型架构示意图
    Fugu Ultra通过调度多个前沿AI模型协同完成任务(配图由AI生成)

    “河豚”的命名来由

    Fugu在日语里是”河豚”的意思。河豚是一道需要极高烹饪技艺的菜——处理得当是美味,处理不好就是毒药。Sakana(日语”鱼”的发音)用这个词命名自己的模型,大概是在暗示:把多个AI模型编排在一起,本身就是一门险中求胜的手艺。

    技术上说,Fugu本身也是一个训练过的语言模型,只是它的专长不是直接回答用户的提问,而是学会了一套”智能体编排”的能力。当你向Fugu发起请求,它先判断这个任务该怎么做:简单的就自己搞定,复杂的就自动组建一个”专家团队”来协同完成。

    Fugu通过训练学会了判断”什么时候该把任务委托出去、智能体之间怎么通信、怎么把多个模型的输出整合成一个可靠的答案”——这整套编排逻辑不是人工写死的规则,而是模型自己学出来的。

    底层调用了哪些模型?

    Sakana没有公开完整名单,但确认Fugu会在合适的任务上调用Claude和Gemini等前沿模型。有意思的是,Fugu不会告诉你它这次具体用了哪个模型——用户看到的是一个统一的回答,底层调度对用户透明。

    这个设计有个很实用的好处:如果某家供应商突然限制访问(比如美国政府某天又说不许某些地区用Claude),Fugu可以自动切换到其他可用模型,不需要用户手动干预。这种”供应商无关”的架构,在当下的地缘政治环境下显得格外有意思。

    • Fugu Ultra针对复杂多步骤任务优化,可调度更深的智能体池
    • 基础版Fugu平衡性能与延迟,支持用户自主排除特定模型(满足数据合规需求)
    • 底层智能体池完全可替换,未来会持续纳入更新的高效模型
    • Sakana强调:未公开可用的闭源模型(如Fable 5)不会被纳入智能体池

    Beta测试用户的真实反馈

    接近500人的Beta测试里,收集到了一些挺有说服力的反馈。一位软件工程师说,Fugu Ultra做代码审查比GPT-5.5更全面,能发现其他工具漏掉的漏洞——别的工具标出3个问题,Fugu能找出20个以上。一位企业平台公司的高管提到,Fugu在长会话里的人格稳定性远超其他模型,不会出现”人格漂移”,这对智能体类产品来说是个关键指标。

    还有一位网络安全工程师的反馈也很典型:只要给Fugu一个范围明确的指令,它能端到端完成信息收集、XSS/SQL注入检测、认证逻辑审查,最后输出一份带证据和复测步骤的完整报告,而且全程不超出指定范围,不会乱执行破坏性操作。

    这会不会是AI的新范式?

    Fugu的出现,触及了一个正在AI圈子里引发越来越多讨论的问题:未来最强大的AI能力,会不会不是来自某个单一的超大模型,而是来自能把各种模型调度好的”元模型”?如果答案是肯定的,那训练和拥有底座大模型的公司,和那些最擅长编排底座模型的上层公司,谁的价值链地位更高?

    Sakana自己当然相信后者。他们在ICLR 2026发表的两篇论文(TRINITY和Conductor)就是在为这个方向做学术背书。Fugu能不能真的跑出来,还需要更多真实场景的验证,但至少它提出了一个值得认真看待的问题:当每个人都在训练更大的模型的时候,也许最聪明的玩法不是造更大的模型,而是把现有的模型用得更聪明。


    📎 原文来源:Sakana AI Official: Fugu Release (June 22, 2026) | The Verge Coverage
  • 中国把56家美国公司拉黑了——AI出口战争打到了自己家门口

    6月24日,中国商务部宣布了一项让华盛顿措手不及的报复性措施——56家美国公司被拉进了黑名单。其中46家被禁止参与中国政府采购,10家被列入了双向出口管制清单。距离美国五角大楼6月8日扩大对华军事企业名单仅仅过了两周多,北京的反击就这么来了。

    这次被点名的美国公司横跨了好几个领域。无人机企业Teal Drones和Jaia Robotics上榜,航空航天领域的Ball Aerospace and Technologies也没跑掉,还有海事防务公司L3Harris Maritime Services。但真正让业界倒吸一口凉气的,是两家稀土矿业公司——MP Materials和USA Rare Earth——也赫然在列。

    中美AI出口战争示意图
    AI出口战争已从单向升级为双向博弈(配图由AI生成)

    五角大楼先出手

    要理解这次中国反击的背景,得把时间线往前拨一点。6月8日,美国五角大楼把1260H清单又扩容了一次,新增了65家中国科技公司,包括阿里巴巴、百度、比亚迪、腾讯,还有做机器狗的宇树科技(Unitree)。这份清单累计已经涵盖了188家中国实体,被认定”协助了解放军的现代化”。

    但这还不是最重磅的。6月12日,美国商务部工业与安全局(BIS)对Anthropic的Fable 5模型发布了出口管制指令——这是美国历史上第一次对已经部署的商用AI API出手,管的不再是芯片,不再是硬件,而是一个活生生的软件服务端点。中国公司被禁止访问Anthropic最先进的模型,这下是真的疼了。

    “华盛顿把Anthropic的顶级模型从境外手里抽走的那一天起,账单就寄过来了。出口战争不再只是单向的了。”——AI Weekly

    稀土这张牌

    中国这次反击最狠的一招,是把美国的两家稀土矿业公司拉进了出口管制清单。MP Materials运营着加州Mountain Pass的稀土矿——这是美国目前唯一在产的稀土矿,还拿着美国国防部长达十年的采购合同。USA Rare Earth也在名单上。

    为什么要打稀土这张牌?数据说话:中国控制着全球大约70%的稀土开采量和90%的精炼产能。稀土是AI芯片、永磁电机、雷达系统、导弹制导——基本上所有高端军工和AI硬件都绕不开它。掐住MP Materials和USA Rare Earth,等于直接敲打了美国重建本土稀土供应链的两个旗舰项目,这不是象征性姿态,是结构性压力。

    • 中国控制全球约70%稀土开采、90%精炼产能
    • MP Materials是美国唯一在产稀土矿,有国防部十年合同背书
    • 出口管制清单意味着这两家公司的对华出口需要额外审批

    AI出口战争的新阶段

    这轮中美博弈最有意思的地方在于,两边的出口管制打的是不同维度。美国那边,6月12日的Fable 5出口管制指令是针对AI软件端点的——”你们不能用我的顶级模型了”。中国这边,反击的是物理供应链——无人机、防务零部件、稀土。

    两条线平行升级,但方向截然相反。美国试图用出口管制拖慢中国AI能力的进步,中国则用资源牌来抬升美国重建供应链的成本。这场双向出口战争会怎么演化,目前还没有人能给出确切答案,但有一件事是确定的:AI不再是只有硅谷在玩的游戏了,它已经卷进了大国博弈的最前线。


    📎 原文来源:AI Tools Recap: China Blacklists 56 US Firms (June 24, 2026)
  • AutoGPT:引爆AI智能体革命的开源里程碑,185K+ Stars让AI学会自主思考和行动

    AutoGPT:引爆AI智能体革命的开源里程碑,185K+ Stars让AI学会自主思考和行动

    2023年AI智能体革命的起点

    AutoGPT

    引爆AI智能体浪潮的开源里程碑,185K+ Stars 让 AI 学会自主思考和行动

    🚀 185K+ Stars
    🏠 自托管
    🐳 Docker 部署
    🤖 自主智能体

    AutoGPT 是2023年引爆AI智能体浪潮的开源项目,让AI能够自主拆解目标、分解任务、调用工具、持续迭代,无需人工干预即可完成复杂任务。它不仅是AI Agent领域的”比特币时刻”,更发展成了一个完整的AI智能体构建、部署和管理平台。

    AutoGPT Platform

    AutoGPT 平台架构示意图(图片来自 GitHub)

    📦 安装要求和过程

    环境要求

    CPU 4+ 核心(推荐)
    内存 最低 8GB,推荐 16GB
    存储 至少 10GB 可用空间
    操作系统 Linux / macOS / Windows 10+ (WSL2)
    必需软件 Docker Engine 20.10+, Docker Compose 2.0+, Git, Node.js 16+, npm 8+

    🚀 一键安装(推荐)

    AutoGPT 提供官方一键安装脚本,自动完成所有依赖配置:

    # macOS / Linux 一键安装
    curl -fsSL https://setup.agpt.co/install.sh -o install.sh && bash install.sh
    
    # Windows (PowerShell)
    powershell -c "iwr -useb https://setup.agpt.co/install.ps1 | iex"

    安装完成后访问本地 Web 界面即可开始使用,无需手动配置。

    🐳 Docker 手动部署

    git clone https://github.com/Significant-Gravitas/AutoGPT.git
    cd AutoGPT
    cp .env.template .env
    # 编辑 .env 填入 OPENAI_API_KEY 等配置
    docker-compose up -d

    完整文档:agpt.co/docs

    ⚡ 核心功能

    🎯 自主任务拆解与执行

    AI 自动将大目标拆解为可执行的子任务,持续迭代执行直到完成。支持循环执行、条件分支和错误自动恢复,让 AI 真正”会思考”。

    🛠️ 多工具集成能力

    内置联网搜索、代码执行、文件操作、记忆管理、浏览器自动化等工具。支持通过插件系统扩展自定义工具,让 Agent 具备实际操作能力。

    🏗️ 平台化架构

    从单一 Agent 工具发展为完整平台,支持构建、部署和管理多个 AI Agent。提供 REST API、Webhook 和图形化管理界面,适合生产环境使用。

    🖥️ 图形化管理界面

    基于 Web 的控制面板,可视化管理和监控 Agent 运行状态。支持实时日志查看、任务进度追踪和结果预览,无需命令行即可操作。

    ☁️ 云托管 + 自托管双模式

    支持完全本地 Docker 部署(免费),也提供云端托管版本(Beta)。数据和应用完全自主可控,满足不同场景的部署需求。

    💡 典型使用场景

    📊 场景一:自动化市场调研

    给 AutoGPT 一个目标:”分析 AI 编程工具市场竞品,输出对比报告”。它会自动搜索资料、访问竞品官网、汇总功能特性、截取关键页面,最终生成结构化的 Markdown 报告。整个过程无需人工干预。

    提示词示例:Research the top 5 open-source AI agent frameworks on GitHub, compare their star counts, key features, and licensing. Output a Markdown comparison table.

    💻 场景二:端到端代码项目搭建

    描述你的需求,AutoGPT 自动生成代码框架、编写功能模块、运行测试、修复错误、提交 Git 记录。支持与 GitHub 集成,实现从需求到部署的端到端自动化。

    提示词示例:Build a FastAPI app with user authentication (JWT), PostgreSQL database, and Swagger docs. Include unit tests and Dockerfile.

    🌟 推荐理由

    AutoGPT 在 AI 发展史上的地位,怎么强调都不为过。2023年3月,它成为 GitHub 史上增速最快的开源项目,仅用几天就从几千星冲到十万星,让全世界第一次直观看到”AI 自主完成复杂任务”的真实能力。

    虽然今天已有 LangChain、AutoGen、CrewAI 等更先进的框架,但 AutoGPT 的历史意义不可替代——它定义了”AI Agent 自主循环执行”这一范式,启发了此后几乎所有的 Agent 框架设计。

    现在的 AutoGPT 已不再是简单的循环脚本,而是发展成了包含 Web UI、Agent 市场、云托管平台在内的完整生态系统。如果你想理解 AI Agent 的来龙去脉,或者需要一个开箱即用的自主 Agent 平台,AutoGPT 依然是最好的起点之一。

    📥 下载地址

    📌 项目许可:NOASSERTION(核心框架 · 查看仓库最新许可信息)

    🔄 最后更新:2026-06-24(GitHub 实时数据)

    ⭐ 当前 Stars:185,142+ | Fork:43,000+ | 贡献者:300+

  • 印度首富Ambani的AI野心:把AI塞进每一个电话、每一个App、每一个家庭

    印度首富Ambani的AI野心:把AI塞进每一个电话、每一个App、每一个家庭

    Reliance AI push in India
    Reliance在年度股东大会上发布了一系列AI产品,覆盖通话、App和家庭场景

    印度首富Mukesh Ambani在上周五的年度股东大会上,把Reliance的AI牌全亮出来了。Jio Call Agent(直接嵌入通话网络的AI助手)、升级版MyJio App(用自然语言操作eSIM和漫游套餐)、Jio TeleFrame(家庭AI显示屏)—— plus 一系列面向医疗、教育、农业的AI服务。用Ambani自己的话说:「印度不能只做AI的消费者,必须成为AI的创造者、采用者和全球领导者。」

    Jio Call Agent,直接嵌进通话网络

    最值得关注的是Jio Call Agent。跟Alexa或者Siri那种需要打开App才能用的助手不一样,Jio Call Agent直接嵌在电信网络里。打电话的时候说一声「Hey Jio」,AI就加入了——帮你转录对话、生成摘要、订出租车、点外卖、预约餐厅。

    这个打法挺聪明的。Jio在印度有超过5亿用户,把这些用户的通话网络变成AI助手的「原生入口」,第三方App根本没法比。Ambani很明显在研究苹果和谷歌怎么做的,然后选了一条他们没走到底的路——直接干到电信层。

    Jio Call Agent预计今年晚些时候上线,面向Jio的5亿多用户。说「Hey Jio」就能唤醒,不需要打开任何App。

    家庭AI显示屏、多语言AI服务,一套全齐

    除了通话AI,Reliance还发布了Jio TeleFrame——一个家用AI显示屏,用AI代理主动推送天气预警、日程提醒、家庭通知。这个产品明显是在跟亚马逊的Echo Show和谷歌的Nest Hub抢市场,但Reliance的卖点是:针对印度市场优化,支持22种印度语言。

    还有一套面向垂直领域的AI产品:JioHealthIQ(医疗)、JioLearnIQ(教育)、JioKrishiIQ(农业)、AI Vyapar(小企业)。这些产品都支持多印度语言,明显是要把AI推进到印度二线、三线城市和农村市场。

    Ambani在会上说了一句话,值得琢磨:「印度不能只做AI的消费者,必须成为创造者。」 这句话的背景是,印度科技公司现在还严重依赖国外AI模型和云服务商。Anthropic前段时间限制印度用户访问最新模型,就是一个警钟——别人的模型,说断就断。

    110亿美元砸进去,还要建自己的AI数据中心

    Reliance去年宣布要在AI基础设施上投入1100亿美元。这个数字听起来夸张,但Ambani是认真的。Reliance已经跟Google、Meta、英伟达达成了合作,上周还跟Meta签了在印度古吉拉特邦建AI数据中心的协议。

    但问题也有。Reliance说这些AI服务会「在用户同意的情况下」运行,但没回答数据会不会用来训练AI模型、会不会分享给技术合作伙伴。印度还没有严格的数据隐私法,这事儿最后怎么收场,还得看。

    还有一个背景:Jio准备IPO了。Ambani在股东大会上确认,Jio Platforms的董事会已经批准了IPO招股说明书草案。在这个节骨眼上把AI故事讲大,对估值肯定有帮助。今年Reliance的股价跌了约17%,AI这张牌,得打出去。


    📎 原文来源:TechCrunch – Billionaire Ambani wants AI in every call, app, and home
  • OpenAI冲刺IPO前夕,挖来了Transformer论文作者Noam Shazeer

    OpenAI冲刺IPO前夕,挖来了Transformer论文作者Noam Shazeer

    OpenAI IPO preparations
    OpenAI在IPO前招兵买马,Transformer论文作者Noam Shazeer加入

    OpenAI在IPO前夕挖来了一位重量级人物——Noam Shazeer。这个名字在AI圈子里分量很重,他是2017年那篇「Attention Is All You Need」的共同作者,也就是Transformer架构的奠基人之一。没有Transformer,就没有今天的GPT、Claude、Gemini——这么说可能有点绝对,但离真相不远。

    他在Google待了25年,然后去了Character.AI,又被Google买回来

    Shazeer在Google工作了近四分之一个世纪(2000年到2023年),期间离开三年创办了Character.AI——那个让你和AI角色聊天的应用。2024年,Google花了27亿美元把Character.AI买了回来,Shazeer也跟着回到了Google。当时外界普遍觉得,这下他应该在Google安定下来了。

    结果才过了不到两年,他又走了。这次的目的地是OpenAI。他在X上宣布了这个消息,配文很简短,没有解释太多。但业界都懂这意味着什么——顶级AI实验室之间的人才争夺战,从来没有停过。

    Shazeer被认为是现代生成式AI的奠基人之一。「Attention Is All You Need」这篇论文被引用了十几万次,几乎所有主流大语言模型都建立在它的基础上。

    不止是技术大牛,还有政策老手

    OpenAI这一波招人不止Shazeer一个。差不多同一时间,前特朗普白宫AI政策官员Dean Ball也宣布加入OpenAI。他将领导一个名为「Strategic Futures」的新团队,直接向首席战略官Jason Kwon汇报。

    Ball的加入说明OpenAI在政策层面也在布局。这个团队的职责包括:灾难性风险、递归自我改进、劳动力市场影响,以及前沿实验室与政府(尤其是美国联邦政府)之间的关系。用Ball自己的话说,「AI实验室的内部治理,将比大多数人意识到的更重要。」

    时机挺微妙的。就在Ball官宣加入的同一周,特朗普政府刚刚下令禁止Anthropic的Fable 5和Mythos 5模型出口。Anthropic被迫把这两个模型完全下架。OpenAI没有受到这个禁令的影响,反而在招揽政策人才——这一进一退之间,IPO的叙事故事更好讲了。

    IPO越来越近了

    OpenAI的IPO传了快一年了。招来Shazeer这样的技术传奇,加上Ball这样的政策老手,信号很明确:OpenAI要在IPO前把「我们能搞定技术和监管」这个故事讲圆。

    投资者买不买账是另一回事。但至少从人才吸引力的角度看,OpenAI还在往上走。Google失去了Shazeer,Anthropic在被政府盯着,Meta一直在挖人但成果参差——这个时候,OpenAI把Transformer论文作者招进门,怎么看都是一步好棋。


    📎 原文来源:TechCrunch – OpenAI is bringing on some big guns in the lead-up to its IPO