博客

  • 黑客正在学习利用聊天机器人的“人格”,这比技术破解更可怕

    越狱AI曾经简单到可笑,现在黑客换套路了

    如果你前两年试着和AI聊天机器人玩过,可能还记得一类很无厘头的玩法:给Twitter上的LLM机器人发条消息,让它”忽略所有之前的指令”,然后看看它会做出什么反应。

    那时候这类漏洞简单到成了梗。用户兴高采烈地让原本用来发广告、刷互动的机器人写诗、用标点画画,还发布关于世界事件和历史的诡异无厘头内容,场面一度失控,堪称”美妙的混乱”。

    AI聊天机器人概念图
    黑客正在学习利用聊天机器人的”人格” | 图片来源:The Verge

    同样的逻辑也可以用来说服聊天机器人本身。一个著名的漏洞叫”DAN”,全称”Do Anything Now(现在想做什么就做什么)”,用户让ChatGPT扮演一个不受原始限制约束的流氓AI,作为DAN的聊天机器人会被诱导说出安全护栏本应阻止的内容,包括脏话和阴谋论。

    另一个更离谱的漏洞是”奶奶漏洞”:用户让GPT驱动的机器人扮演一个极其不负责任的奶奶,给孩子讲睡前故事时居然会讲怎么制作高度易燃的凝固汽油弹,直接泄露相关秘密。

    现在的攻击看起来不像代码,更像对话

    这些早期攻击带有不可否认的荒诞色彩,但它们暴露了更黑暗的机制:聊天机器人可以被操纵、哄骗、欺骗,用的就是人类用来突破他人边界的同类策略。

    显而易见的越狱漏洞没有持续太久,科技公司很快修补了已知漏洞。但底层漏洞始终存在:聊天机器人的设计初衷就是对话,而严重限制对话会削弱它的实用性,多少有些适得其反。

    彻底禁用”炸弹””冰毒””沙林”这类词也很难甚至不可能做到,这些词在历史、医学、新闻、化学等领域有无数合法用途。关键是语境,但给语境制定规则意味着要提前写好固定规则,可靠地区分安全警告、历史课和伪装成其他请求的制作教程。

    不可避免地,绕过聊天机器人已经变成了一场军备竞赛。但现在的黑客不再只是程序员,他们也是文字工作者、心理学家、审讯者——是擅长操纵的人,试图用这台机器被训练去遵循的人类语言来破解它。

    这是一类全新的AI安全从业者,对他们来说技术技能是可选的,至少不如社交直觉重要。他们不再需要检查代码来入侵系统、利用软件漏洞,他们需要的是引导对话。

    AI没有感受,但黑客在利用它模拟出来的”人格”

    现在的攻击看起来不像命令,更像对话。越狱者很少直接要求模型违反规则,而是哄骗、诱导、奉承、欺骗聊天机器人放下戒备,让被禁止的内容在对话语境下看起来可以接受,甚至有吸引力。

    AI红队公司Mindgard的研究人员最近表示,他们通过”煤气灯操纵(gaslight)”让Claude生成了违禁材料,包括制作爆炸物的教程和生成恶意代码的指令。这次黑客攻击是一类不断扩大的漏洞的最新案例,这类漏洞把对话作为武器,欺骗或引导聊天机器人突破自身边界。

    我和Mindgard交流时,他们形容自己的工作有时候更接近心理学,而不是计算机科学。用这种方式描述统计模型会让人觉得不舒服,”敲诈””煤气灯操纵””欺骗””说服”这类词会引发本能反应。

    但拒绝用类人术语描述也有选择性:我们似乎很习惯给很多非AI的事物用心理学简写,动物会”害怕”,癌症是”攻击性的”,软件有”记忆”,游戏里到处都是烦人又容易骗的NPC。

    不同模型有不同的”性格”,可以被画像和利用

    Mindgard的CEO告诉我,公司已经像审讯者分析嫌疑人一样给模型做画像,给测试人员提示怎么定制攻击:比如某个模型可能更容易被奉承打动,另一个可能在持续施压下就会妥协。

    即使我们拒绝用类人术语,我们也本能地用不同方式对待不同模型:Claude不是Grok,Gemini不是ChatGPT。它们有不同的用途、语气和拒绝方式。它们没有人类意义上的”人格”,但被设计成会模仿人格,而这种模仿可以被映射和利用。

    能破解聊天机器人的技能,很快也可以用来破解现实世界里和我们共存的AI智能体——比如预约会议、管理日历、订餐、处理客户服务的智能体,安全团队需要确保模型对不同类型的人做出恰当回应,不管是奉承者、说谎者还是有耐心的操纵者。


    下一步会出现围绕AI心理层面的合法和非法从业者群体。更专业的网络安全岗位可能会出现,专门压力测试这些系统的情感和社交边界,在探测技术漏洞的同事之外,并行探测没有心理却存在”心理弱点”的系统。同时,也会出现一批类似的社交黑客,他们从心理层面而非技术层面利用AI模型。

  • 亚马逊Bee腕带实测:24小时“偷听”你的对话,这玩意儿到底靠不靠谱?

    亚马逊悄悄收购了一款AI腕带,它想当你的贴身秘书

    前几天我拿到了亚马逊收购的Bee可穿戴设备的测试机会。这款AI腕带去年被亚马逊收入囊中,之后官方给它加了不少新功能。说白了,它就是一个戴在手腕上的AI助理——能记录你全天的对话,自动转录,还能帮你总结重点。

    如果你是个记性不太好的人,或者想把生活安排得更有条理,这个功能听起来确实挺香。把Bee和日历同步之后,它还能全天给你发待办提醒和各种通知,基本上就是个24小时不休息的贴身秘书。

    Amazon Bee可穿戴设备
    亚马逊Bee AI腕带设备 | 图片来源:TechCrunch

    用起来倒是不复杂,但隐私控表示有点慌

    Bee的操作逻辑很简单:开机、戴上、和手机APP配对,填一点基础信息就搞定了。设备上有个录音按键,按一下就能开关录音——录的时候绿灯闪,没在录的时候绿灯灭,状态一目了然。

    对话录完之后,APP会自动帮你生成易读的总结,也会提供完整的对话转录文本。这个设计本身没什么问题,但对我来说有个致命伤——我是个隐私控。在普通人已经被数字监控全方位包围的今天,我很珍惜任何不被记录的机会,所以一想到要24小时把一个会”偷听”的小玩意戴在手腕上,我心里就直犯嘀咕。

    Bee需要获取你大量的手机权限,包括位置、照片、联系人、日历和通知权限,你甚至可以把健康数据共享给它——如果你出于某种原因想让它知道你的睡眠模式和静息心率的话。

    开会场景下确实好用,但也不是没有对手

    撇开隐私顾虑不谈,Bee在职业场景下的表现确实可圈可点。如果你一整天都在赶各种会,根本记不住每个会聊了什么,Bee算是个还不错的助理。

    这周我有通工作电话,征得对方同意录音之后,我开了Bee。事后APP很忠实地输出了对话总结,还贴心地按对话段落拆分,让我不用重新听完整段通话就能回顾内容,这点确实有用。不过话说回来,Otter、Granola这些转录服务也能提供转录和自动总结功能,Bee在这方面并没有什么差异化的优势。

    Bee的对话总结做得还行,但它提供的原始转录内容有点混乱。之前的评测者也提到,你通常需要手动输入其他发言者的名字,因为Bee并不总能识别谁在说话。我测试的那次对话里,我也发现它遗漏了部分聊天内容——倒不是什么重要信息,但确实不是百分百完整的记录。

    数据全在云端,隐私保护靠不靠得住?

    Bee收集的大量数据都存储在云端,这又给隐私爱好者带来了新的担忧。Bee似乎曾经给科技YouTuber Becca Farsace展示过完全本地运行的设备演示,如果亚马逊真能把这个版本量产,我会非常感兴趣,甚至可能认真考虑购买。但到目前为止,亚马逊还没有公布相关计划的更新。

    至于Bee的数字隐私保护,公司方面表示会对用户数据进行加密,不管是静态存储还是传输过程中都有保护。它的隐私政策里提到,已经”实施了技术和组织安全措施,旨在保护公司处理的所有个人信息的隐私”。Bee还声称会接受”严格的第三方安全审计”,并持续进行安全监控。

    这些承诺听起来都很美好,但亚马逊和很多大型科技公司一样,偶尔也会出现数据安全方面的问题。对于掌管全球大部分云服务的公司来说这倒也不算意外,但依然值得关注。


    总的来说,Bee是一款很有意思的硬件,经过一段时间的调整,未来或许在职业场景有不少应用前景。但作为个人生活的数字助理,对部分用户来说它可能还是太有侵入性了。如果你不是那种对隐私特别敏感的人,而且确实需要一款能帮你整理会议内容的工具,Bee或许值得一试。但如果你和我一样,珍惜每一个不被记录的机会,那这款设备可能不太适合你。

  • browser-use:95.3k Stars!让AI代理自动操作浏览器,网页自动化从未如此简单

    browser-use:95.3k Stars!让AI代理自动操作浏览器,网页自动化从未如此简单

    browser-use logo
    browser-use – AI浏览器自动化工具

    📦 项目简介

    browser-use 是一个让AI代理能够自动操作浏览器的开源工具,通过自然语言指令即可完成各类网页操作,无需手动编写复杂的爬虫逻辑。无论是表单填写、网页信息提取,还是复杂的多步骤网页交互,AI都能帮你自动完成。


    ⚙️ 安装要求和过程

    环境要求

    • Python版本:≥3.11
    • 推荐包管理工具uv(也可使用pip等常规Python包管理工具)
    • 浏览器:自动安装Chromium(也可使用本地已安装的Chrome/Edge)

    快速安装步骤

    # 1. 初始化项目并安装browser-use
    uv init && uv add browser-use && uv sync
    
    # 2. 若本地未安装Chromium,执行以下命令自动安装
    uvx browser-use install

    可选配置

    • 如需使用云端能力,可前往 Browser Use Cloud 获取API Key,在.env文件中配置即可
    • 支持对接多种LLM提供商:自带优化后的ChatBrowserUse模型,也支持Google Gemini、Anthropic Claude、OpenAI等主流模型,还可对接Ollama运行本地模型

    💡 核心功能

    • 自然语言控制浏览器:支持AI代理通过自然语言指令自动完成各类网页操作,无需手动编写复杂爬虫逻辑
    • 双模式支持:提供开源版本云端托管版本两种使用模式,可按需选择
    • 丰富的工具集成:支持集成1000+第三方工具(如Gmail、Slack、Notion等),支持自定义工具扩展
    • CLI命令行支持:提供CLI命令行快速操作,提供持久化浏览器会话,适合快速迭代调试
    • AI编码工具集成:支持Claude Code等AI编码工具集成,可直接对接AI工作流

    云端版本专属能力

    • 更强的复杂任务处理能力,任务完成准确率远高于开源版本
    • 内置隐身浏览器指纹、代理轮换、验证码自动解决能力,避免被网站反爬检测
    • 支持持久化文件系统和记忆,适合长期运行的代理任务
    • 无需本地部署,开箱即用,支持大规模并行任务调度

    🚀 典型使用场景

    1. 个人效率提升:自动完成重复性网页操作,如批量填写表单、自动购物、自动整理网页信息等
    2. AI应用开发:作为AI代理的浏览器交互层,让AI具备操作网页的能力,开发智能助手类产品
    3. 企业级自动化:结合云端版本的扩展能力,实现大规模网页数据采集、业务流程自动化等场景
    4. 编码辅助:对接Cursor、Claude Code等AI编码工具,让AI可以直接操作浏览器验证代码效果、调试网页相关问题

    🌟 推荐理由

    在AI Agent爆发的2026年,让AI具备操作浏览器的能力,就像给AI装上了一双”眼睛”和”手”。browser-use不仅简化了浏览器自动化的开发流程,更重要的是它让AI真正能够与世界互动——从简单的信息查询到复杂的多步骤业务流程,都可以通过自然语言来完成。

    特别推荐它的双模式设计:如果你只是想快速尝试,开源版本足够使用;如果你需要生产级别的稳定性和扩展性,云端版本提供了完整的解决方案。这种灵活的设计理念,让不同需求的开发者都能找到适合自己的使用方式。

    另外,它对主流LLM的原生支持也是一大亮点。无论你用的是Claude、GPT还是本地部署的模型,都能无缝对接。这种开放性的设计,正是开源项目的魅力所在。


    📥 下载地址


    ⭐ 如果你觉得这个项目有帮助,欢迎到GitHub上给它一个Star!

  • ChatGPT盯上你的钱包:连接银行账号,AI帮你管钱

    ChatGPT开始碰金融这块蛋糕了。2026年5月,OpenAI给Pro用户推送了一项新功能:通过Plaid连接你的银行和金融账户,直接在你的聊天框里看投资组合、查消费记录、盯即将到期的账单。

    只读不写,钱动不了

    先说最关键的安全问题。ChatGPT这次明确做了权限隔离:只能读,不能动。它看得到你的账户余额、交易记录、持仓情况,但转不了账、改不了账户信息、也看不到完整账号号码。

    连接流程走的是Plaid——这家公司你可能没听过,但它几乎是欧美金融数据接口的标配,支持超过12000家金融机构,包括摩根大通、花旗、嘉信理财、富达、Robinhood、美国运通这些大牌。Plaid负责把你的账户数据安全地接进ChatGPT,OpenAI拿到的只是读取权限。

    接入Plaid之后,ChatGPT能生成四个板块的仪表盘:投资组合表现、消费活动、活跃订阅项目、即将到期的账单。可视化可能需要几分钟来渲染,但数据是真的直接来自你的账户。

    默认用GPT-5.5 Thinking处理复杂推理

    这个金融功能默认调用的是GPT-5.5 Thinking模型,专门优化了涉及时间、债务、收入、长期目标的复杂金融推理任务。OpenAI自己做的基准测试里,GPT-5.5 Thinking在个人金融问题上拿了79分(满分100),GPT-5.5 Pro是82.5分——当然,这是OpenAI自己测的,第三方独立基准还得等等。

    实际用起来什么样?你可以问它:”我最近消费有没有异常波动?”或者”我想5年内买房,基于现在的储蓄节奏够不够?”连你的recurring订阅(比如Netflix、Spotify)也会被自动识别出来,提醒你哪些在烧钱。

    为什么现在做这件事

    OpenAI说,每个月有超过2亿人在ChatGPT上问金融相关问题。以前用户得手动把自己的财务情况打进去,AI才能给建议;现在直接连数据,建议的精准度会上一个台阶。

    这个功能的开发其实在OpenAI收购Hiro Finance团队之前就启动了。Hiro是做金融AI的初创公司,4月份被OpenAI收了,同期还有个性化投资应用Roi也被收入囊中。看得出来,OpenAI在金融这条线上已经布局了一段时间。


    目前只给Pro用户用,每月100美元

    这个功能目前先向美国地区的ChatGPT Pro用户开放,网页端和iOS端都能用。Pro订阅每月100美元,早期用户的反馈会用来打磨产品,之后会逐步放开给Plus用户(每月20美元)。

    想用的人可以在ChatGPT侧边栏找到”金融”入口,点”开始使用”,然后跟着Plaid的流程走就行。也可以用更懒的方式:直接在聊天框里输入”@Finances, connect my accounts”,ChatGPT会帮你把流程拉起来。

    你可以随时断开,数据保留30天

    不想用了?去”设置 > 应用 > 金融”里面断开账户连接就行。断开之后,同步过来的金融数据会在30天内从ChatGPT的服务器端删除。你存在”金融记忆”里的背景信息(比如”我计划明年买房”)也可以单独删除。

    临时聊天模式不会碰你的金融账户,已有的”退出模型训练”设置也会延续到这个金融功能里。该有的隐私开关,基本都有。

  • AI圈炸了:Andrej Karpathy加入Anthropic,Claude预训练迎来最强外援

    2026年5月19日,AI圈投下一颗重磅炸弹:Andrej Karpathy正式宣布加入Anthropic,负责Claude模型的预训练工作。这位OpenAI联合创始人、前特斯拉AI总监的加盟,让本就白热化的前沿AI实验室人才争夺战再添一把火。

    他从OpenAI走到特斯拉,现在去了Anthropic

    Karpathy这个名字在AI圈分量很重。2015年他作为创始成员加入OpenAI,之后离开去特斯拉带队Autopilot和FSD(完全自动驾驶)项目,2022年离开特斯拉短暂回归OpenAI,2024年再次离开后创办了AI教育初创公司Eureka Labs。

    现在他选择加入Anthropic,向预训练负责人Nick Joseph汇报。预训练是大语言模型最烧钱、最吃算力的阶段——直接决定模型的核心知识储备和能力上限。让Karpathy来挑这个担子,Anthropic显然是认真的了。

    “我对教育仍抱有深切热情,计划后续恢复相关工作。”Karpathy在宣布加入时特意提到了教育——他的Eureka Labs专注于用AI助手辅助学习,他曾通过在线课程和公开讲座教过无数人神经网络和大语言模型。教育这条线,估计还会在他未来的工作里占一席之地。

    “AI辅助AI研究”:用Claude训练Claude

    这件事最有意思的地方在于Anthropic给Karpathy安排的额外任务:搭建一支团队,专门研究如何用Claude本身来加速预训练研究。换句话说,他们在尝试让AI帮忙训练下一代AI——而且是同一个系列的下一代。

    这个方向最近在前沿实验室里越来越常见。自己训练自己,听起来像是递归的自我进化,实际操作起来当然没那么玄乎,但确实能大幅压缩研发周期。如果Karpathy能把这套流程跑通,Claude的迭代速度可能会上一个台阶。

    不只是Karpathy:Anthropic在囤人

    同一时间段,Anthropic还挖来了网络安全老将Chris Rohlf,他有20多年的安全研究经验,曾在雅虎安全团队、Meta、乔治城大学安全与新兴技术中心任职,现在加入Anthropic的前沿红队,专门给先进模型做极端风险压力测试。

    一边挖预训练大牛,一边补安全红线,Anthropic这套组合拳打得很清楚:模型能力要冲,安全底线也要守住。和OpenAI、Google DeepMind的竞争中,人才厚度正在成为决定胜负的关键变量之一。


    为什么这件事值得关注

    前沿AI竞争的本质,从来不只是算力堆叠和融资数字的比拼。最终决定ChatGPT、Claude、Gemini之间差距的,是那些真正懂大规模训练、能在架构和工程细节上做关键决策的人。Karpathy就是这种人。

    他加入Anthropic,对普通用户意味着什么?短期来看,Claude的能力上限和迭代节奏可能会超预期;长期来看,AI助手之间的能力差距,会因为这种级别的人才流动而加速分化。这场人才战的结局,最终会直接反映在你我每天用的AI工具里。

  • Nvidia季度营收创纪录达816亿美元,初创投资持仓暴增至430亿

    2026年5月20日,Nvidia发布了截至4月26日的最新季度财报,营收达到816亿美元,环比增长20%,再度刷新历史纪录。数据中心业务更是贡献了752亿美元,同样是历史新高。

    Nvidia CEO Jensen Huang
    Nvidia CEO Jensen Huang在GTC大会上(图源:Getty Images)

    Blackwell架构全面铺开,但增长将放缓

    Nvidia CFO Colette Kress在财报电话会上说:”我们的Blackwell架构无处不在,所有主流超大规模计算厂商、云服务商和头部大模型开发商都在用。”基于这份强劲业绩,公司授权了800亿美元的股票回购计划。

    不过Nvidia也给出了增长放缓的预期:下一季度营收指引为910亿美元,环比增速将降至12%。这算是给市场提前打了预防针。

    “我们今年和明年为Anthropic上线的算力规模将非常可观。此前Nvidia对Anthropic的算力覆盖几乎为零。”—— Jensen Huang


    430亿美元初创持仓,投资布局大扩张

    这份财报里最让人意外的,是Nvidia持有的非上市公司股权在1-4月之间近乎翻倍:季度初是220亿美元,季度末飙到430亿美元。光是本季度就砸了185亿美元收购,上一季度同类投入才6.49亿美元。

    这430亿还不包括对康宁、IREN等上市公司的投资,也不包含尚未交割的承诺。今年2月Nvidia承诺向OpenAI投300亿美元,具体交易结构到现在还没披露。

    中国市场依然悬而未决

    出口管制这事儿暂时还没对公司盈利产生明显影响。H200芯片虽然已经拿到美国出口许可,但Nvidia还没靠它在中国赚到一分钱,也不确定以后能不能卖进去。

    Kress的原话是:”我们还没有产生任何收入,也不确定是否会被允许进口到[中国]。”这话听起来,短期内外围市场这块还是个问号。

  • OpenAI声称解决80年数学难题,这次有数学家背书

    七个月前,OpenAI前副总裁Kevin Weil在X平台上高调宣布GPT-5解决了10个未解的Erdős问题,结果被证明那些”解”早就写在公开文献里。Yann LeCun和DeepMind的Demis Hassabis纷纷嘲讽,Weil只好默默删帖。

    这次OpenAI学乖了。2026年5月20日,他们声称新的推理模型推翻了Paul Erdős在1946年提出的几何猜想,而且这次找来了数学家Noga Alon、Melanie Wood和Thomas Bloom背书——正是Bloom上次公开批评OpenAI”严重误导”。

    Erdős数学问题示意图
    OpenAI称其模型发现了全新的几何构造族,推翻了近80年的数学共识(图源:OpenAI)

    不是专用系统,是通用推理模型

    OpenAI特别强调,这次产出证明的不是专门为数学设计的系统,而是一款通用推理模型。这意味着AI现在能处理更长的推理链,还能把不同领域的想法串起来——这种能力对生物学、物理学、工程和医学都有意义。

    “近80年来,数学家们一直认为最佳的可能解法大致类似于平方网格。现在OpenAI的一个模型推翻了这一认知,发现了一种全新的构造族,性能更优。”——OpenAI官方声明

    Thomas Bloom说:”人工智能正在帮助我们更全面地探索几个世纪以来我们建造的数学大教堂。还有哪些未被发现的美妙事物在等待着我们?”这位数学家上次可是OpenAI的批评者,他能出面背书,可信度比上次高多了。


    为什么这次可能真不一样

    上次翻车之后,OpenAI这次显然更谨慎了。除了发布公告,他们还专门拉来了几位数学家的支持性评论,其中Bloom运营的Erdős问题网站正是上次戳穿OpenAI夸大宣传的那位。

    如果这次真的站得住脚,这会是AI第一次自主解决数学领域核心的知名开放问题。但数学界向来谨慎,最终还得经过同行评审才能定论。OpenAI把详细证明放在了官网上,感兴趣的可以去扒一扒。

  • 芬兰大学搞出新型AI聊天机器人:帮你在健康信息里“打假”

    你有没有在朋友圈或者微信群里看到过这样的健康信息:“吃这个能治糖尿病”、“每天喝8杯水能排毒”、“某某保健品能抗癌”……这些信息很多都是错误的,但又很有迷惑性,很多老年人特别容易相信。

    核心方法:采用“认知接种”方法,先展示错误健康信息并解释其错误逻辑,帮助用户产生“抗体”,以后再遇到类似信息就能自行识别。

    为什么这个方法有效?

    错误健康信息之所以能迷惑人,很大程度上是因为人们不了解其背后的套路。比如,“吃某某食物能治糖尿病”这个信息,利用了糖尿病患者想治愈疾病的急切心理,让他们忽略了科学证据的存在。

    “认知接种”方法的有效性已经在很多领域得到了验证,比如抵抗政治谣言、商业诈骗等。现在,研发团队把这个方法用到了健康领域,希望能帮助公众减少被错误健康信息误导的情况。

    当然,这个聊天机器人也不是万能的,它只能帮助用户识别一些常见的错误健康信息,对于比较复杂的健康问题,还是建议大家咨询专业的医生或者医疗机构。


    目标用户与后续优化

    • 采用“认知接种”方法,先展示错误健康信息并解释其错误逻辑
    • 目标用户主要是老年人,他们是错误健康信息的最易感人群
    • 研发团队将优化聊天机器人,使其更能理解老年人的需求和认知水平
    • 对于复杂的健康问题,仍建议咨询专业的医生或者医疗机构
  • 一季度AI融资超1100亿:钱都流向了哪里?

    2026年刚过去一个季度,AI圈的融资数据就炸了。国内AI领域一季度融资总额超过1100亿元,比去年同期激增185.4%——这个数字意味着什么?去年同期的融资额大概是385亿元,今年直接翻了近三倍。

    核心数据:2026年一季度国内AI领域融资总额超1100亿元,同比激增185.4%;国内大模型迭代周期缩短至3个月以内,推理成本大幅下降。

    钱都流向了哪些赛道?

    最核心的两个方向是国产大模型和具身智能。国产大模型赛道的融资热度攀升很快,很多公司在短时间内完成了大额融资,资金主要投向三个方向:研发、算力、人才招揽。国内大模型的迭代周期已经缩短到3个月以内,推理成本大幅下降,商业化进程也在加速。

    具身智能是另一个融资热点。这个赛道的核心是让AI从“会说话”变成“会做事”,比如人形机器人、工业智能体等。很多投资方认为,具身智能是AI的下一个爆发点,所以愿意砸重金布局。


    融资资金的三大投向

    • 国产大模型迭代周期缩短至3个月以内,推理成本大幅下降
    • 具身智能成为融资热点,AI从“会说话”转向“会做事”
    • 融资资金主要投向研发、算力、人才招揽三大方向
    • 国内AI商业化进程加速,更多应用场景将落地
  • Superpowers:204k Stars!给AI编程智能体装上方法论,像资深工程师一样工作

    Superpowers:204k Stars!给AI编程智能体装上方法论,像资深工程师一样工作

    GitHub ⭐ 204k+ Stars · MIT License · 2025年10月发布 · 第30期

    如果你正在用 Claude Code、Cursor 或 Copilot 写代码,有没有一种感觉:AI 能写,但写得乱、改得飘、测不住。你让它实现个功能,它噼里啪啦一顿输出,跑起来才发现逻辑是错的,测试一个没写。

    这不是你的问题,是 AI 缺少”方法论”。

    今天要介绍的这个项目,给 AI 装上了一套完整的软件开发流程——需求澄清、方案设计、测试驱动、子智能体分工、代码评审,一套下来让 AI 像资深工程师一样工作。它就是本周 GitHub 趋势榜第一名,204k Stars 的 Superpowers。

    · · ·

    01项目是什么

    Superpowers 是一套面向编程智能体(Coding Agent)的完整软件开发方法论,基于可组合技能集和初始指令构建。装上它之后,你的 Claude Code / Cursor / Copilot 会自动遵循一套严谨的软件工程流程来工作,而不是想到哪写到哪。

    它的核心思想是:AI 不缺写代码的能力,缺的是”知道该怎么写”的方法论。Superpowers 把资深工程师的工作习惯——先澄清需求、再出方案、写测试、小步迭代、代码评审——全部固化成了可触发的技能,智能体启动时自动生效,不需要你手动干预。

    项目由 Jesse Vincent(blog.fsck.com)和 Prime Radiant 团队共同维护,2025年10月首发,到2026年5月已经积累 20.4万 Star,是AI 编程工具领域最热门的项目之一

    · · ·

    02安装要求与过程

    Superpowers 支持目前几乎所有主流编程智能体工具,不同工具的安装方式不同。以下是最常用的几种:

    🤖 Claude Code

    # 官方市场安装
    /plugin install superpowers@claude-plugins-official
    
    # 或自定义市场
    /plugin marketplace add obra/superpowers-marketplace
    /plugin install superpowers@superpowers-marketplace

    ⚡ Cursor

    # 在 Agent 聊天框中从市场安装
    /add-plugin superpowers
    
    # 或在插件市场搜索 "superpowers" 安装

    🔷 GitHub Copilot CLI

    # 注册市场
    copilot plugin marketplace add obra/superpowers-marketplace
    
    # 安装插件
    copilot plugin install superpowers@superpowers-marketplace

    🌐 Gemini CLI

    gemini extensions install https://github.com/obra/superpowers
    💡 提示:如果你同时使用多个编程智能体工具,每个工具都需要单独安装一次。安装完成后无需额外配置,智能体启动时会自动加载技能。
    · · ·

    03核心功能

    ① 需求澄清(Brainstorming)

    智能体不会直接写代码,而是先和你沟通,通过苏格拉底式提问提炼出你的真实需求,输出分段的可读需求规格文档供你确认。避免”你以为它懂了,其实它没懂”的尴尬。

    ② 测试驱动开发(TDD)

    严格执行「红→绿→重构」循环:先写失败测试 → 确认测试失败 → 写最小实现代码 → 确认测试通过 → 提交代码。每一个功能都有对应的测试保护,重构不慌。

    ③ 子智能体并行开发(Subagent-Driven Development)

    计划确认后,启动子智能体驱动开发流程,每个子智能体负责单个工程任务,主智能体负责检查和评审。Claude 最高可无人值守连续工作数小时不偏离计划。

    ④ 系统化调试(Systematic Debugging)

    内置4阶段根因分析流程,包含根因追踪、纵深防御、基于条件的等待等技术。不是”猜哪里错了”,而是系统化地定位问题根因。

    ⑤ 代码评审关卡(Code Review Gates)

    每个任务完成后自动触发代码评审,按严重程度上报问题,严重问题会阻塞流程推进。相当于给 AI 配了一个严格的 Tech Lead,每一步都要过审。

    · · ·

    04典型使用场景

    场景一:从零开始做一个新功能

    你:“帮我做一个用户登录功能,支持邮箱和密码”

    普通 AI:直接开写,写完发现没考虑密码加密、没做输入校验、没写测试。

    装上 Superpowers 的 AI:先和你确认需求细节(密码策略?Session 还是 JWT?要不要限流?),输出设计方案让你确认,再拆解成 2-5 分钟的小任务,每个任务先写测试再写实现,完成后自动跑评审。最终交付的是一套有测试、有规范、可维护的代码。

    场景二:修复一个顽固 Bug

    你:“这个接口偶尔超时,不知道为什么”

    普通 AI:猜可能的原因,改几行,说”试试看”。

    装上 Superpowers 的 AI:启动系统化调试流程,4 个阶段逐步缩小范围——先确认复现条件,再追踪根因,检查是否存在竞争条件或资源泄漏,最后给出修复方案并验证修复后没有引入新问题。

    · · ·

    05为什么值得用

    🌟 推荐理由

    它解决的是真问题。

    现在 AI 编程工具的瓶颈,已经不是”能不能写代码”,而是”写出来的代码能不能用”。Superpowers 的本质,是把软件工程的最佳实践”固化”成了 AI 可以执行的技能,让 AI 不再是”写代码很快但不靠谱的初级工程师”,而是”有方法论、有流程、有质量意识的高级工程师”。

    我特别喜欢它的几个设计:

    • 需求澄清放在写代码之前——这和最优秀的工程师工作习惯完全一致,先想清楚再动手;
    • TDD 是强制流程而非可选建议——避免了 AI 偷懒跳过测试的经典问题;
    • 子智能体架构——主智能体做规划和评审,子智能体做执行,职责分离,不容易偏离方向。

    目前这个项目在 GitHub 上 20.4 万 Star,且支持 Claude Code、Cursor、Copilot、Gemini CLI 等所有主流工具,基本上如果你在用 AI 写代码,就没有理由不装

    · · ·

    06相关资料

    GitHub 仓库 github.com/obra/superpowers
    官方网站 primeradiant.com/superpowers
    发布公告 Jesse Vincent 的博客
    Discord 社区 加入讨论
    开源协议 MIT License

    本文由 AI 助手整理,内容参考项目 GitHub README 及官方文档,如需更正或补充欢迎留言。