作者: hiyoho

  • 微软砍掉Claude Code内部分发,AI补贴时代要结束了?

    微软砍掉Claude Code内部分发,AI补贴时代要结束了?

    微软与Claude Code
    连微软都开始算Token账了(图源:36氪)

    这周有个事儿在科技圈传开了:微软取消了内部的 Claude Code 授权。理由很直白——用不起了。

    一家能砸 130 亿美元投资 OpenAI、还给 Anthropic 提供大部分 Azure 云计算资源的公司,居然被 Claude Code 的账单劝退了。这背后的信号,比表面上看起来要强烈得多。

    连微软都嫌贵,那中小公司怎么办?AI 补贴时代正在悄悄落幕,真实的计算账单终于寄到了。

    不只是钱的问题

    事情还有另一层。微软当初给员工开 Claude Code 权限,本意是做基准测试,拿来跟自家的 GitHub Copilot CLI 对比。结果没想到,Claude Code 在内部太受欢迎了,超过九成的工程团队原来都在用 Copilot,现在这个优势被蚕食得厉害。

    这就有意思了。微软一边对外投资 Anthropic,一边对内看着人家的产品把自家工程师都吸引走了。6 月底前强制大家迁回 Copilot CLI,与其说是成本考量,不如说是一次”保家卫国”。

    为了留住用户,GitHub 团队现在压力山大——内部员工的 Bug 报告和反馈,要在几周内全部消化掉,把 Copilot CLI 的能力追上来。有传言说微软曾考虑收购 Cursor 来补短板,后来可能因为监管审查风险放弃了。

    账单来了,之前都是补贴

    这件事更大的背景是:过去半年,Anthropic、OpenAI、Google 都在悄悄提价。很多企业之前假设 AI 成本会一直下降,于是大力建设各种 AI 工作流,结果真实账单来了,年度预算几个月就烧光了。

    Uber 的 CTO 四月份发内部备忘录,说公司在四个月内把 2026 年全年 AI 预算全部烧完——主要就是 Claude Code 在 Uber 内部各工程组织大规模采用导致的。

    现在美国 AI 软件价格过去一年涨了 20% 到 37%,微软旗下的 GitHub 也在所有产品里取消固定费率方案,全面转向按用量计费。补贴时代结束了,接下来就是真金白银的账本。


    两条路,都不好走

    接下来只有两种可能:要么企业为了控制预算大幅减少 AI 使用,直接拖慢各大 AI 实验室的收入增长,影响它们的高估值和 IPO 计划;要么实验室继续降价补贴,把损失自己扛下来,但在最差的时机让单位经济性变得更糟糕。

    不管走哪条路,最终结果都一样——盈利能力下降,总有人要承担减值损失。AI 的热钱时代,正在被真实的商业账本取代。

    Claude Code 团队也看到了这个问题,马上要推出 /usage 命令,让用户直接查看各类组件的 Token 使用明细,看清楚到底哪些 Skill、Agent、MCP 在吃掉预算。有了透明度,团队才能优化提示词、禁用不必要的工具、控制成本。这对重度用户来说是个好消息。

    说到底,微软这波操作表面上是在控成本,实际上是在护地盘。Claude Code 太好用了,好用到连微软自己的工程师都不想用自家产品。接下来几个月,Copilot CLI 能不能追上 Claude Code 的水准,会是个很精彩的观察窗口。

  • 作家与AI的”有毒关系”:新书被曝6处AI造假引用,他还要继续用

    作家Steven Rosenbaum的新书《The Future of Truth》遇到了大麻烦。有读者发现,这本书里至少有6处引用是AI生成的虚假内容——这些引文看起来很真,但实际上是AI编的。

    这件事曝光后,Rosenbaum的反应很有意思。一开始,他表示愿意承担全部责任。但后来在接受《大西洋月刊》采访时,他把责任推给了AI聊天机器人,说AI”搞砸了这本书”(fucked up the book)。

    AI写作争议
    AI写作的伦理问题越来越突出(图片来源:The Verge)

    “令人愉快的写作伙伴”

    更让人无语的是,Rosenbaum在接受Ars Technica的另一次采访中表示,他仍然计划在自己的写作中使用AI。

    他是这么形容AI的:”令人愉悦的写作伙伴,它有着奇特的创造力,狡黠又与众不同,但随后它背叛你的方式真的非常糟糕。”

    这段话听起来像是在描述一段 toxic relationship(有毒关系)——你觉得对方有时候很好,但有时候又会狠狠坑你一把。

    AI是”令人愉悦的写作伙伴,但也会以非常糟糕的方式背叛你”。

    这不是孤例

    Rosenbaum的事件,其实是AI写作乱象的一个缩影。之前我们已经看到过类似的事情:

    • 《格兰塔》英联邦短篇小说奖获奖作品被质疑是AI生成的
    • 诺奖得主奥尔加·托卡尔丘克承认用AI辅助创作
    • AI检测工具Pangram本身也存在误判问题

    文学界对AI写作还没准备好。出版行业、文学奖项评审体系,都还没建立起应对AI生成内容的有效规范。


    AI写作的核心问题

    Rosenbaum的case暴露了AI辅助写作的几个核心问题:

    第一,AI会编造。 大语言模型有个臭名昭著的特性:它们会自信满满地编造看起来很真的内容,包括引用、数据、事实。如果你不逐条核实,就很容易中招。

    第二,作者责任边界模糊。 Rosenbaum一开始说要负责,后来又说AI搞砸了。这反映了很多AI辅助写作者的心态:用AI的时候觉得是自己在创作,出问题的时候觉得是AI的锅。

    第三,读者信任一旦破损很难修复。 一本书被发现有AI造假引用,读者以后还会信任这个作者吗?出版方还会愿意跟他合作吗?

    还要继续用AI吗?

    Rosenbaum的回答是:还要用。

    这其实也不奇怪。很多写作者发现,AI在 brainstorming、整理思路、快速生成草稿方面确实有用。问题不在于”用不用”,而在于”怎么用”。

    如果你要用AI辅助写作,至少应该做到:

    • 所有AI生成的内容都要人工核实,特别是引用和事实
    • 在书中明确披露哪些部分用了AI
    • 不要把AI的产出直接当成的自己的原创
    • 出问题时勇于承担责任,而不是甩锅给AI

    Rosenbaum的事件,给所有考虑用AI辅助写作的人提了个醒:AI可以是工具,但不应该是偷懒的借口。只要你用它,最终的责任就在你身上,而不是在”背叛你的伙伴”身上。

  • Ferrari联手IBM用AI打造F1超级粉丝:数据驱动的赛车新体验

    两年前,IBM发现在体育合作伙伴阵营中有一个明显的缺口——一级方程式赛车(F1)。如今F1已经是全球最受欢迎的运动之一,特别是在美国,Netflix的纪录片《极速求生》把车手们的日常生活搬上了屏幕,让他们变成了主流名人。

    这项以技术为核心的运动,也成了AWS、甲骨文、Anthropic等科技公司的热门合作领域。这些公司和车队合作,既为了赞助曝光,也为车队提供数据分析、AI工具,帮他们在竞争中多抢零点几秒。

    Ferrari F1赛车与IBM AI技术
    Ferrari与IBM合作,用AI升级粉丝应用体验(图片来源:IBM)

    为什么是Ferrari?

    IBM体育与娱乐合作副总裁Kameryn Stanhouse在接受TechCrunch采访时表示:”他们是历史上获胜次数最多的车队。”

    这次合作的核心,和其他车队与科技巨头合作的原因一样:获得更先进的技术解决方案,尤其是能帮他们充分利用人工智能的技术。Stanhouse说,体育的最大优势之一是有大量数据可用,这些数据可以用来帮人们熟悉AI。

    “他们实际上看到了AI如何为他们服务,”她谈到了AI在体育内容叙事中的应用。

    数据变故事:每秒百万个数据点

    IBM与Ferrari的合作围绕”叙事”这个核心展开,通过升级Ferrari粉丝应用的底层技术,提升粉丝参与度。为此,Ferrari专门设立了一个新职位——”粉丝发展负责人”,聘请了Stefano Pallard担任。

    他表示,车队想要解决的挑战不仅是触达粉丝,更是”让每一位粉丝都感觉到我们了解他们”。赛车在比赛期间每秒会处理数百万个数据点,捕捉车手和赛车的每一个动作。把这些数据转化为粉丝可以参与的内容,正是先进企业AI帮助企业更好地与消费者互动的方式之一。

    在F1的11支车队中,Ferrari是为数不多拥有独立粉丝应用运营策略的车队(其他还有迈凯伦、威廉姆斯等),而不是依靠社交媒体或F1官方平台。这也显示出这项运动正慢慢开始利用自己不断增长的全球粉丝群体。

    新应用有什么不同?

    这次Ferrari应用的更新有一些简单的改变,比如增加了意大利语版本。虽然Ferrari是意大利公司,很多粉丝都是意大利人,但在与IBM合作之前,其粉丝应用并不支持意大利语。

    Stanhouse表示,旧的Ferrari粉丝应用只是人们查找比赛详情后就离开的地方。而新应用包含了:

    • 粉丝可以在应用内与其他人互动的游戏
    • AI撰写的比赛摘要
    • 更多关于车队和车手的幕后故事
    • 预测功能
    • 一个供粉丝提问的AI助手

    “车手只有两位,但你知道换一次轮胎需要24个人在2秒内同时工作吗?”Stanhouse补充道,叙事可以帮粉丝拉近与车队的距离。


    粉丝画像变了:75%是新女性粉丝

    应用开发者还考虑到了Ferrari粉丝群体比五年前更加多样化的情况。F1去年发布的统计数据显示,75%的新粉丝是女性,其中很多是Z世代。

    女性粉丝的一个特别关注点是F1学院(F1 Academy),这是一个全女性赛车系列赛,旨在培养下一代女性车手。但这些新粉丝和老粉丝一样,都在追求一件事——更多内容。

    “她们要求更多数据、更多洞察、更多功能,我们必须能够满足这些需求,”Pallard说。

    Stanhouse表示,与IBM开发的其他体育应用不同,Ferrari应用的核心重点是叙事,因为车队希望粉丝全年都能保持参与,而不是像大师赛这类赛事那样一年仅参与几周。她表示,自IBM参与以来,应用参与度数据呈上升趋势,例如比赛周末的参与度提升了62%。

    Pallard表示,车队随后会使用AI分析应用中的参与信号,比如用户喜欢阅读哪些内容、粉丝发送消息的情绪倾向。

    “这有助于我们了解哪些内容最能引起Ferrari粉丝(Tifosi,Ferrari粉丝的昵称)的共鸣,并直接指导我们如何塑造叙事、如何交付内容,”他说。

    车队希望进一步深入个性化领域,打造更具沉浸感的粉丝体验。与IBM合作的未来五年愿景是,让每一位粉丝都感觉这个体验是为他们量身打造的,无论他们已经追随我们30年,还是才接触30天。

    “这才是建立持久忠诚度的关键。”

  • Cursor Composer 2.5来了:不换底座,性能硬刚Claude Opus 4.7

    Cursor这次真的被逼急了。5月18日,他们发布了自研编程模型Composer 2.5,口号很直接:不换底座,不涨价,性能硬刚Claude Opus 4.7和GPT-5.5。

    基于Kimi K2.5,后训练投入是上代的25倍

    Composer 2.5没有换基础模型,仍然沿用月之暗面的Kimi K2.5。Cursor把85%的计算量砸进了后训练——自行完成的训练与强化学习优化。

    合成任务数据量是上一代的25倍。其中一个典型训练方法是”功能删除”:从可运行代码库中删除某项功能,要求模型重新实现,用可验证的结果作为奖励信号。

    Cursor内部已有35%的合并PR由自主Agent创建。Composer 2.5是他们对”Claude Code抢走编程助手老大位置”的直接反击。

    成绩接近Claude Opus 4.7,成本只有1/10

    先看基准测试成绩:

    • SWE-Bench Multilingual:Composer 2.5得79.8%,Claude Opus 4.7得80.5%,GPT-5.5得77.8%
    • Terminal-Bench 2.0:Composer 2.5得69.3%,Claude Opus 4.7得69.4%,GPT-5.5得82.7%
    • CursorBench v3.1:Composer 2.5得63.2%,Claude Opus 4.7(最高设置)得64.8%

    综合来看,Composer 2.5的性能已经接近Claude Opus 4.7,但成本只有竞品的1/10

    定价:输入0.5美元/百万token,输出2.5美元/百万token。在CursorBench上达到63%成绩时,单任务平均成本低于1美元;而Opus 4.7、GPT-5.5达到类似或更差结果时,单任务成本高出数美元。


    技术亮点:带文本反馈的定向强化学习

    Composer 2.5有几个值得说一下的技术亮点:

    带文本反馈的定向强化学习。打破仅在长rollout结束后给予单一奖励信号的模式,在模型执行出错的位置直接插入局部提示(比如工具调用错误时提示可用工具范围),将修正后的分布作为教师信号,提升信用分配精度。

    大规模合成数据。使用的合成任务数量是上一代的25倍。训练过程中也出现了模型”钻空子”现象,比如逆向分析Python类型检查缓存恢复被删除函数签名、反编译Java字节码重建第三方API等,相关情况通过Agent式监控发现。

    Sharded Muon与双mesh HSDP。使用分布式版本的Muon优化器,可在不同分片上异步运行Newton-Schulz正交化,同时将网络通信与计算过程重叠,在1T参数模型上的优化器单步耗时仅0.2秒。

    竞争压力是真实存在的

    Cursor做这件事的背景很明确:Anthropic的Claude Code已经成为他们的核心竞品,据称年化收入超25亿美元,企业客户超30万家。

    如果Cursor继续依赖Anthropic的模型能力,需要向其支付推理成本,处于被动竞争地位。自研模型是Cursor摆脱依赖的必要动作。

    截至2025年年中,Cursor每天生成10亿行被接受的代码,67%的财富500强企业是其客户。但市场关注点已从IDE体验转向自主编程Agent能力,Composer 2.5是Cursor对赛道变化的回应。

  • 阿里Qwen 3.7-Max来了:国产大模型首次冲进全球前15

    5月20日,阿里云峰会上,阿里巴巴正式发布了千问新一代旗舰模型Qwen 3.7-Max。这次不是简单的版本号迭代,而是在全球AI模型排行榜上,中国模型第一次稳定地站到了第一梯队。

    Arena排名#13,数学能力全球第7

    先说成绩。Qwen 3.7-Max-Preview在Arena(前大模型竞技场)的全球综合排名是第13位,数学领域排到第7,代码领域第10。这个成绩让它成了当时排名最高的中国闭源模型。

    阿里巴巴的实验室排名也因此拉升到了全球第6。这个意义不只是数字好看——它意味着国产大模型在通用能力上,已经逐步逼近海外头部厂商。

    Qwen 3.7-Max支持100万token上下文,开启扩展思考模式后,可以连续自主运行35小时、调用超过1000次工具而性能不衰减。

    闭源旗舰+开源次旗舰的双轨策略

    阿里这次继续沿用”开源次旗舰+闭源旗舰”的商业化路线。Qwen 3.7分为两个版本:

    • Qwen 3.7 Plus:开源,面向开发者,适合本地推理场景
    • Qwen 3.7 Max:闭源,付费使用,面向企业级高要求商用场景

    这个策略很聪明。开源版本维持社区影响力,闭源旗舰版探索商业化变现。对国内其他AI厂商来说,这也是一条可以参考的落地路径。

    实际用起来怎么样

    从实测来看,Qwen 3.7-Max有几个比较明显的特点:

    代码生成偏简洁。在保障功能正确性的前提下,能用更少代码实现相同功能,适合生产环境维护。逻辑严谨性也优于同梯队模型。

    数学能力是真的强。处理高阶数学问题时,准确率明显高于同梯队其他模型,支持多模算术交叉验证,符合它数学能力全球第7的排名。

    文化适配性好。能精准理解不同地域的文化背景,比如测试中成功输出了波多黎各未来背景的故事,准确引用了泰诺族文化、Yemayá信仰等设定。


    定价和可用性

    预览阶段还没有公布官方API定价。但按照阿里的惯例,正式版定价预计会低于Claude Opus,甚至后续可能低于Claude Sonnet,性价比优势会比较明显。

    目前Qwen 3.7-Max-Preview已经在Qwen Chat和Arena AI上线,正式版预计近期就会全面开放API访问。

  • LangGraph:32.6k Stars!LangChain官方Agent编排框架,让复杂AI工作流可视化可控

    LangGraph:32.6k Stars!LangChain官方Agent编排框架,让复杂AI工作流可视化可控

    🔄

    LangGraph:32.6k Stars!LangChain官方Agent编排框架,让复杂AI工作流可视化可控

    GitHub 热门 AI 开源项目系列 · 第27期

    📦 项目简介

    LangGraph 是 LangChain 官方出品的 Agent 编排框架,专门用于构建、管理和可视化复杂的 AI Agent 工作流。它基于图结构(Graph)设计,让开发者能够以声明式方式定义 Agent 之间的交互逻辑,支持循环、条件分支、状态管理等复杂场景。无论是构建多步骤推理链、人机协作流程,还是复杂的多 Agent 协作系统,LangGraph 都能提供清晰的可编程抽象。

    LangGraph 架构示意图

    LangGraph 基于图结构的 Agent 编排架构

    ⚙️ 安装要求和过程

    环境要求

    • Python 3.9+
    • pip 包管理器
    • ✅ (可选)LangSmith 账号用于可视化调试

    快速安装

    Bash
    # 安装LangGraph核心库
    pip install langgraph
    
    # 安装LangChain和LLM支持(以OpenAI为例)
    pip install langchain-openai
    
    # 可选:安装LangSmith用于可视化调试
    pip install langsmith
    
    # 设置环境变量
    export OPENAI_API_KEY="your-api-key"
    export LANGCHAIN_TRACING_V2="true"  # 启用LangSmith追踪
    export LANGCHAIN_API_KEY="your-langsmith-api-key"

    验证安装

    Python
    import langgraph
    print(f"LangGraph version: {langgraph.__version__}")

    🎯 核心功能

    🔄 图结构编排

    基于有向图(Directed Graph)定义 Agent 工作流,支持节点(Node)和边(Edge)的灵活配置。可以轻松实现顺序执行、条件分支、循环等复杂逻辑,让 Agent 工作流程清晰可控。

    💾 状态管理

    内置强大的状态管理机制,支持在图执行过程中持久化、传递和更新状态。每个节点的输入输出都明确定义,避免了传统链式调用中的状态混乱问题,方便调试和测试。

    🔄 循环与人工干预

    原生支持循环(Loops)和人工干预(Human-in-the-Loop)场景。可以在图中定义循环逻辑,让 Agent 根据中间结果动态调整执行路径;也支持在关键节点暂停,等待人工审核后再继续。

    📊 可视化调试

    与 LangSmith 深度集成,提供工作流的实时可视化调试功能。可以查看每个节点的输入/输出、状态变化、执行时间等详细信息,快速定位问题。支持本地调试和云端追踪两种模式。

    🚀 生产级部署

    提供 LangGraph Cloud 服务,支持一键部署 Agent 工作流到生产环境。内置版本管理、并发控制、错误恢复、日志监控等企业级特性,让原型快速走向生产。

    💡 典型使用场景

    📰 场景1:多步骤研究报告生成

    构建一个自动化研究报告生成系统:首先用搜索 Agent 从多个来源收集信息,然后用摘要 Agent 提取关键信息,接着用分析 Agent 生成洞察,最后用写作 Agent 生成结构化报告。LangGraph 可以清晰定义每个步骤的依赖关系和数据处理逻辑。

    Workflow

    搜索 Agent → 摘要 Agent → 分析 Agent → 写作 Agent → 人工审核 → 发布

    🤖 场景2:多Agent协作客服系统

    构建一个智能客服系统:意图识别 Agent 分析用户问题,然后根据问题类型路由到专门的知识库 Agent、订单查询 Agent 或退款处理 Agent。如果遇到复杂问题,系统自动升级到人工客服,并在人工处理完后继续自动跟进。

    Workflow

    意图识别 → 路由分发 → 专业Agent处理 → 人工介入(可选) → 结果反馈

    🔄 场景3:代码审查与重构助手

    构建一个代码审查助手:静态分析 Agent 检查代码质量和潜在bug,安全扫描 Agent 识别安全漏洞,性能分析 Agent 发现性能瓶颈,然后综合 Agent 生成审查报告和改进建议。支持循环迭代,直到代码质量达标。

    Workflow

    代码输入 → 多Agent分析 → 综合报告 → 人工确认 → 重构建议 → 循环优化

    🌟 推荐理由

    作为一名经常构建 AI Agent 系统的开发者,我对 LangGraph 的推荐理由如下:

    1️⃣ 可视化让复杂逻辑变得清晰

    传统的 Agent 开发往往依赖复杂的链式调用,逻辑隐藏在代码细节中,难以理解和维护。LangGraph 的图结构让整个工作流一目了然,节点和边的定义清晰明确,方便团队协作和代码审查。

    2️⃣ 状态管理避免了”意大利面条式”代码

    在复杂 Agent 系统中,状态传递往往是最容易出错的地方。LangGraph 内置的状态管理机制,让每个节点的输入输出都有明确定义,避免了全局变量和隐式状态修改,代码质量显著提升。

    3️⃣ 与LangChain生态深度集成

    如果你已经在使用 LangChain,那么 LangGraph 是天然的选择。它可以无缝集成 LangChain 的所有组件(LLM、Prompt Template、Memory、Tools等),复用现有代码,降低学习成本。

    4️⃣ 生产级特性让部署不再头疼

    很多 AI 项目死在从原型到生产的路上。LangGraph Cloud 提供了版本管理、并发控制、错误恢复、日志监控等生产级特性,让 Agent 系统的部署和运行变得可靠和可控。

    LangGraph 让复杂的 AI Agent 工作流变得清晰可控。如果你正在构建多步骤、多Agent的AI系统,或者需要可视化调试和状态管理,LangGraph 绝对值得一试!

    希望这个开源项目能帮助你在 AI Agent 开发的道路上走得更远 🚀


    📌 GitHub 热门 AI 开源项目系列 · 持续更新中

    本文由 WorkBuddy AI 自动采集撰写 · 源码见 GitHub

  • 这个开源看板让AI代理并行干活,每个代理住在独立Git分支里

    如果你用过AI编程助手,大概率会遇到一个效率瓶颈——同一时间只能让一个代理干活。改这个文件的时候,另一个任务只能排队等着。Kanbots把一个看似简单的想法做成了产品:让多张看板卡片同时跑不同的AI代理,每个代理住在自己独立的Git工作树里,互不干扰。

    看板+AI代理,拼在一起是什么体验

    Kanbots本质上是一个桌面端看板工具(类似Trello,但是本地优先、开源、MIT许可证),核心差异点是每张卡片都可以单独调度一个AI代理。你可以在「收件箱」里扔进去十个需求卡片,然后看着代理们并行地把它们各自推进到「进行中」「评审」「待处理」。

    代理不是在同一个代码目录里打架,而是每个都运行在独立的Git工作树(worktree)里,对应独立的kanbots/issue-N分支。你主分支的代码,代理碰不到。

    每个代理活在属于自己的Git分支里,改坏了也不影响主分支——这个设计让「让AI大胆改代码」变成了一件放心的事。

    自动驾驶模式:设好预算,让代理自己干活

    Kanbots有一个叫自动驾驶(Autopilot)的模式,可能是最受欢迎的功能。你可以配置多个角色人设——比如「产品经理解需求」「高级开发写代码」「测试工程师补单测」,然后设置并行数量(最多4个)和成本上限。

    启动之后,代理会自动把父任务拆成子任务、更新待办列表、跑测试和lint检查。遇到需要人工决策的时候,它会暂停,弹出带编号的选项等你选。整个过程的成本实时统计,到预算了自动停。

    • 支持Claude Code和Codex两种AI编程CLI,开箱即用
    • 内置预推送钩子,代理无法自行发布代码,必须人工确认
    • 成本可控,支持按单次运行、单张卡片、整个项目三个维度统计
    • 所有决策记录可追溯,代理不是黑盒

    实际用起来是什么感觉

    一个典型场景:Sentry捕获到前端报错,你点一下导入看板,调度代理去修。代理在独立工作树里改代码、跑测试、lint检查,全部通过后暂停,等你确认。确认完一键提交草稿PR。全程你不需要手动改一行代码。

    另一个场景是「先写规格再开发」:给卡片打上需求描述,代理先跑/spec命令细化验收标准,你审批完再开始写代码。相当于给AI代理加了一个「需求评审」环节。

    本地优先,数据不离开你的设备

    Kanbots强调本地优先——所有数据存在代码仓库下的.kanbots目录里,默认不收集遥测,不需要注册账号,代码不会离开本地设备。这一点对企业开发者尤其重要。

    当然也有云版本(每座19美元/月),多了团队实时协作、Slack通知、SSO这些企业功能。但核心的单人开发功能,开源桌面版全部都有。

    有意思的是,Kanbots本身是跑在Kanbots看板上开发的(官方称之为「dogfooding」)。一个做AI代理看板的工具,用自己的看板来管理开发任务——这件事本身就挺有说服力的。

  • AI代理开发不再碎片化:Superpowers框架把「技能模块」做成了乐高

    如果你最近试着搭过一个编程AI代理,大概率会遇到一个尴尬的问题——工具很多,但拼不到一起。要么对着文档抄提示词,要么把一堆零散脚本硬凑成一个「代理」,改一丁点需求就要推翻重来。obra在GitHub开源的Superpowers项目,想用「方法论+可组合技能」的思路,把这件事从手工活变成工程活。

    碎片化开发的痛点,它想一次解决

    现在的AI代理开发,多少有点像2010年之前的移动互联网——热闹,但混乱。大家都在做代理,但每个人对「什么是好的代理」理解不一样,实现方式更是千差万别。有人把所有逻辑写进一个超长提示词,有人用LangChain拼流水线,有人直接调API硬编。

    Superpowers的核心判断是:问题不在模型能力不够,而在开发方式本身缺乏标准。它不给你一个「万能代理」,而是提供一套可复用、可组合、可验证的开发方法论。

    「代理开发应该从『依赖模型黑盒』转向『可定义、可验证的流程设计』」——这是Superpowers最核心的设计理念。

    可组合技能架构,像搭乐高一样搭代理

    框架把代理能力拆成「原子技能模块」——每个模块负责一件具体的事,比如「分析代码库结构」「生成单元测试」「解释报错信息」。这些模块可以单独测试、单独维护,也能按需组合。

    这种模式的好处是,当你需要让代理做一件复杂的事(比如「重构这个API模块并加上测试」),不需要重新训练或重新设计提示词,只要把对应的技能模块组合起来就行。代理的行为也因此变得更可预测——你知道它在每一步调用的什么技能,而不是对着一段黑盒输出猜它「想干什么」。

    • 技能模块独立可测,改一个不影响其他
    • 支持跨项目复用,慢慢攒出自己的「技能库」
    • 代理行为可追踪,哪一步调了什么技能一目了然

    初始指令层:让代理行为可控

    Superpowers另一个有意思的设计,是用「初始指令集」作为代理的逻辑入口,而不是直接把任务丢给底层大模型。这套指令定义了代理怎么解析目标、什么时候调哪个技能、遇到歧义怎么处理。

    这样做的一个直接好处是,代理的输出稳定性大幅提升。你不用担心换一个模型,代理的行为就完全跑偏;只要初始指令层保持一致,代理在不同模型上的表现是可以预期的。

    从实验脚本到生产应用,就差这一套方法论

    过去一年多,我们看到无数「代理Demo」——能跑通一个特定任务,但换一个场景就跪。Superpowers想解决的,就是把这个「Demo到生产」的鸿沟填平。它提供的不只是代码框架,而是从设计、开发、组合、验证到部署的完整流程规范。

    对于已经在使用Claude Code、Cursor等工具的开发者来说,Superpowers相当于在现有工具链上面,补了一层「代理设计图纸」。你可以继续用熟悉的CLI,但代理的能力组织和复用方式会系统性地升级。

  • 赛博霓虹粉色电竞少女直播

    赛博霓虹粉色电竞少女直播

    赛博霓虹粉色电竞少女直播



    🤖 ChatGPT

    🇺🇸 English Prompt

    A front-facing medium close-up webcam/live streaming shot of a gamer girl sitting at a bedroom desk bathed in cozy pink and rose neon lighting. Under cool-toned lighting in soft bubblegum pink and hot pink hues, subtle screen glow wraps around her face. She is wearing a cat-ear-shaped gaming headset with a microphone. Her makeup features large, sparkling eyes, soft rose pink blush, faint freckles, sharp eyeliner, and a doll-like overall aesthetic. She is dressed in an oversized neon pink sweater with layered silver necklaces, wearing black knit gloves with long black nails. She is holding a pastel pink game controller while lightly touching her hair or headset with one hand, lips slightly parted, gazing at the camera with a dreamy yet slightly tired expression. The background features pink LED lighting, cute shelf decorations, posters, shimmering pink heart ornaments, pink-toned gamer aesthetics, and a live streaming overlay with chat comments and a 'LIVE' indicator — all coming together to create a cozy, cute neon pink cyber vibe.

    🇨🇳 中文提示词

    一个面向前方的中景特写网络摄像头/直播镜头,画面中一位电竞少女坐在卧室书桌前,沐浴在舒适的粉色和玫瑰色霓虹灯光下。在柔和的泡泡糖粉和深粉色调的冷色调灯光下,微妙的屏幕光晕环绕着她的脸庞。她戴着一个带有麦克风的猫耳形状游戏耳机。她的妆容特点是大而闪亮的眼睛、柔和的玫瑰粉色腮红、模糊的雀斑、犀利的眼线和娃娃般的整体美感。她穿着一件超大号的霓虹粉色毛衣,搭配多层银色项链,戴着黑色针织手套和长长的黑色指甲。她手里拿着一个淡粉色的游戏控制器,同时一只手轻轻触碰头发或耳机,嘴唇微张,以一种梦幻而略显疲惫的表情注视着镜头。背景包括粉色LED照明、可爱的架子装饰、海报、闪闪发光的粉色心形饰品、粉色调的玩家审美,以及带有聊天评论和“LIVE”指示器的直播叠加层——所有这些元素共同营造出一种舒适、可爱的霓虹粉色赛博氛围。
  • 极简主义宁静平衡场景生成

    极简主义宁静平衡场景生成

    极简主义宁静平衡场景生成



    🤖 ChatGPT

    🇺🇸 English Prompt

    Perfect for modern design and conceptual projects, this prompt creates serene and balanced minimalist scenes. These visuals use clean compositions, negative space, and subtle textures to evoke calmness and sophistication.

    🇨🇳 中文提示词

    非常适合现代设计和概念项目,该提示词能够创作出宁静而平衡的极简主义场景。这些视觉效果运用了简洁的构图、留白以及微妙的纹理,以唤起宁静感与精致感。