博客

  • browser-use:95.3k Stars!让AI代理自动操作浏览器,网页自动化从未如此简单

    browser-use:95.3k Stars!让AI代理自动操作浏览器,网页自动化从未如此简单

    browser-use logo
    browser-use – AI浏览器自动化工具

    📦 项目简介

    browser-use 是一个让AI代理能够自动操作浏览器的开源工具,通过自然语言指令即可完成各类网页操作,无需手动编写复杂的爬虫逻辑。无论是表单填写、网页信息提取,还是复杂的多步骤网页交互,AI都能帮你自动完成。


    ⚙️ 安装要求和过程

    环境要求

    • Python版本:≥3.11
    • 推荐包管理工具uv(也可使用pip等常规Python包管理工具)
    • 浏览器:自动安装Chromium(也可使用本地已安装的Chrome/Edge)

    快速安装步骤

    # 1. 初始化项目并安装browser-use
    uv init && uv add browser-use && uv sync
    
    # 2. 若本地未安装Chromium,执行以下命令自动安装
    uvx browser-use install

    可选配置

    • 如需使用云端能力,可前往 Browser Use Cloud 获取API Key,在.env文件中配置即可
    • 支持对接多种LLM提供商:自带优化后的ChatBrowserUse模型,也支持Google Gemini、Anthropic Claude、OpenAI等主流模型,还可对接Ollama运行本地模型

    💡 核心功能

    • 自然语言控制浏览器:支持AI代理通过自然语言指令自动完成各类网页操作,无需手动编写复杂爬虫逻辑
    • 双模式支持:提供开源版本云端托管版本两种使用模式,可按需选择
    • 丰富的工具集成:支持集成1000+第三方工具(如Gmail、Slack、Notion等),支持自定义工具扩展
    • CLI命令行支持:提供CLI命令行快速操作,提供持久化浏览器会话,适合快速迭代调试
    • AI编码工具集成:支持Claude Code等AI编码工具集成,可直接对接AI工作流

    云端版本专属能力

    • 更强的复杂任务处理能力,任务完成准确率远高于开源版本
    • 内置隐身浏览器指纹、代理轮换、验证码自动解决能力,避免被网站反爬检测
    • 支持持久化文件系统和记忆,适合长期运行的代理任务
    • 无需本地部署,开箱即用,支持大规模并行任务调度

    🚀 典型使用场景

    1. 个人效率提升:自动完成重复性网页操作,如批量填写表单、自动购物、自动整理网页信息等
    2. AI应用开发:作为AI代理的浏览器交互层,让AI具备操作网页的能力,开发智能助手类产品
    3. 企业级自动化:结合云端版本的扩展能力,实现大规模网页数据采集、业务流程自动化等场景
    4. 编码辅助:对接Cursor、Claude Code等AI编码工具,让AI可以直接操作浏览器验证代码效果、调试网页相关问题

    🌟 推荐理由

    在AI Agent爆发的2026年,让AI具备操作浏览器的能力,就像给AI装上了一双”眼睛”和”手”。browser-use不仅简化了浏览器自动化的开发流程,更重要的是它让AI真正能够与世界互动——从简单的信息查询到复杂的多步骤业务流程,都可以通过自然语言来完成。

    特别推荐它的双模式设计:如果你只是想快速尝试,开源版本足够使用;如果你需要生产级别的稳定性和扩展性,云端版本提供了完整的解决方案。这种灵活的设计理念,让不同需求的开发者都能找到适合自己的使用方式。

    另外,它对主流LLM的原生支持也是一大亮点。无论你用的是Claude、GPT还是本地部署的模型,都能无缝对接。这种开放性的设计,正是开源项目的魅力所在。


    📥 下载地址


    ⭐ 如果你觉得这个项目有帮助,欢迎到GitHub上给它一个Star!

  • ChatGPT盯上你的钱包:连接银行账号,AI帮你管钱

    ChatGPT开始碰金融这块蛋糕了。2026年5月,OpenAI给Pro用户推送了一项新功能:通过Plaid连接你的银行和金融账户,直接在你的聊天框里看投资组合、查消费记录、盯即将到期的账单。

    只读不写,钱动不了

    先说最关键的安全问题。ChatGPT这次明确做了权限隔离:只能读,不能动。它看得到你的账户余额、交易记录、持仓情况,但转不了账、改不了账户信息、也看不到完整账号号码。

    连接流程走的是Plaid——这家公司你可能没听过,但它几乎是欧美金融数据接口的标配,支持超过12000家金融机构,包括摩根大通、花旗、嘉信理财、富达、Robinhood、美国运通这些大牌。Plaid负责把你的账户数据安全地接进ChatGPT,OpenAI拿到的只是读取权限。

    接入Plaid之后,ChatGPT能生成四个板块的仪表盘:投资组合表现、消费活动、活跃订阅项目、即将到期的账单。可视化可能需要几分钟来渲染,但数据是真的直接来自你的账户。

    默认用GPT-5.5 Thinking处理复杂推理

    这个金融功能默认调用的是GPT-5.5 Thinking模型,专门优化了涉及时间、债务、收入、长期目标的复杂金融推理任务。OpenAI自己做的基准测试里,GPT-5.5 Thinking在个人金融问题上拿了79分(满分100),GPT-5.5 Pro是82.5分——当然,这是OpenAI自己测的,第三方独立基准还得等等。

    实际用起来什么样?你可以问它:”我最近消费有没有异常波动?”或者”我想5年内买房,基于现在的储蓄节奏够不够?”连你的recurring订阅(比如Netflix、Spotify)也会被自动识别出来,提醒你哪些在烧钱。

    为什么现在做这件事

    OpenAI说,每个月有超过2亿人在ChatGPT上问金融相关问题。以前用户得手动把自己的财务情况打进去,AI才能给建议;现在直接连数据,建议的精准度会上一个台阶。

    这个功能的开发其实在OpenAI收购Hiro Finance团队之前就启动了。Hiro是做金融AI的初创公司,4月份被OpenAI收了,同期还有个性化投资应用Roi也被收入囊中。看得出来,OpenAI在金融这条线上已经布局了一段时间。


    目前只给Pro用户用,每月100美元

    这个功能目前先向美国地区的ChatGPT Pro用户开放,网页端和iOS端都能用。Pro订阅每月100美元,早期用户的反馈会用来打磨产品,之后会逐步放开给Plus用户(每月20美元)。

    想用的人可以在ChatGPT侧边栏找到”金融”入口,点”开始使用”,然后跟着Plaid的流程走就行。也可以用更懒的方式:直接在聊天框里输入”@Finances, connect my accounts”,ChatGPT会帮你把流程拉起来。

    你可以随时断开,数据保留30天

    不想用了?去”设置 > 应用 > 金融”里面断开账户连接就行。断开之后,同步过来的金融数据会在30天内从ChatGPT的服务器端删除。你存在”金融记忆”里的背景信息(比如”我计划明年买房”)也可以单独删除。

    临时聊天模式不会碰你的金融账户,已有的”退出模型训练”设置也会延续到这个金融功能里。该有的隐私开关,基本都有。

  • AI圈炸了:Andrej Karpathy加入Anthropic,Claude预训练迎来最强外援

    2026年5月19日,AI圈投下一颗重磅炸弹:Andrej Karpathy正式宣布加入Anthropic,负责Claude模型的预训练工作。这位OpenAI联合创始人、前特斯拉AI总监的加盟,让本就白热化的前沿AI实验室人才争夺战再添一把火。

    他从OpenAI走到特斯拉,现在去了Anthropic

    Karpathy这个名字在AI圈分量很重。2015年他作为创始成员加入OpenAI,之后离开去特斯拉带队Autopilot和FSD(完全自动驾驶)项目,2022年离开特斯拉短暂回归OpenAI,2024年再次离开后创办了AI教育初创公司Eureka Labs。

    现在他选择加入Anthropic,向预训练负责人Nick Joseph汇报。预训练是大语言模型最烧钱、最吃算力的阶段——直接决定模型的核心知识储备和能力上限。让Karpathy来挑这个担子,Anthropic显然是认真的了。

    “我对教育仍抱有深切热情,计划后续恢复相关工作。”Karpathy在宣布加入时特意提到了教育——他的Eureka Labs专注于用AI助手辅助学习,他曾通过在线课程和公开讲座教过无数人神经网络和大语言模型。教育这条线,估计还会在他未来的工作里占一席之地。

    “AI辅助AI研究”:用Claude训练Claude

    这件事最有意思的地方在于Anthropic给Karpathy安排的额外任务:搭建一支团队,专门研究如何用Claude本身来加速预训练研究。换句话说,他们在尝试让AI帮忙训练下一代AI——而且是同一个系列的下一代。

    这个方向最近在前沿实验室里越来越常见。自己训练自己,听起来像是递归的自我进化,实际操作起来当然没那么玄乎,但确实能大幅压缩研发周期。如果Karpathy能把这套流程跑通,Claude的迭代速度可能会上一个台阶。

    不只是Karpathy:Anthropic在囤人

    同一时间段,Anthropic还挖来了网络安全老将Chris Rohlf,他有20多年的安全研究经验,曾在雅虎安全团队、Meta、乔治城大学安全与新兴技术中心任职,现在加入Anthropic的前沿红队,专门给先进模型做极端风险压力测试。

    一边挖预训练大牛,一边补安全红线,Anthropic这套组合拳打得很清楚:模型能力要冲,安全底线也要守住。和OpenAI、Google DeepMind的竞争中,人才厚度正在成为决定胜负的关键变量之一。


    为什么这件事值得关注

    前沿AI竞争的本质,从来不只是算力堆叠和融资数字的比拼。最终决定ChatGPT、Claude、Gemini之间差距的,是那些真正懂大规模训练、能在架构和工程细节上做关键决策的人。Karpathy就是这种人。

    他加入Anthropic,对普通用户意味着什么?短期来看,Claude的能力上限和迭代节奏可能会超预期;长期来看,AI助手之间的能力差距,会因为这种级别的人才流动而加速分化。这场人才战的结局,最终会直接反映在你我每天用的AI工具里。

  • Nvidia季度营收创纪录达816亿美元,初创投资持仓暴增至430亿

    2026年5月20日,Nvidia发布了截至4月26日的最新季度财报,营收达到816亿美元,环比增长20%,再度刷新历史纪录。数据中心业务更是贡献了752亿美元,同样是历史新高。

    Nvidia CEO Jensen Huang
    Nvidia CEO Jensen Huang在GTC大会上(图源:Getty Images)

    Blackwell架构全面铺开,但增长将放缓

    Nvidia CFO Colette Kress在财报电话会上说:”我们的Blackwell架构无处不在,所有主流超大规模计算厂商、云服务商和头部大模型开发商都在用。”基于这份强劲业绩,公司授权了800亿美元的股票回购计划。

    不过Nvidia也给出了增长放缓的预期:下一季度营收指引为910亿美元,环比增速将降至12%。这算是给市场提前打了预防针。

    “我们今年和明年为Anthropic上线的算力规模将非常可观。此前Nvidia对Anthropic的算力覆盖几乎为零。”—— Jensen Huang


    430亿美元初创持仓,投资布局大扩张

    这份财报里最让人意外的,是Nvidia持有的非上市公司股权在1-4月之间近乎翻倍:季度初是220亿美元,季度末飙到430亿美元。光是本季度就砸了185亿美元收购,上一季度同类投入才6.49亿美元。

    这430亿还不包括对康宁、IREN等上市公司的投资,也不包含尚未交割的承诺。今年2月Nvidia承诺向OpenAI投300亿美元,具体交易结构到现在还没披露。

    中国市场依然悬而未决

    出口管制这事儿暂时还没对公司盈利产生明显影响。H200芯片虽然已经拿到美国出口许可,但Nvidia还没靠它在中国赚到一分钱,也不确定以后能不能卖进去。

    Kress的原话是:”我们还没有产生任何收入,也不确定是否会被允许进口到[中国]。”这话听起来,短期内外围市场这块还是个问号。

  • OpenAI声称解决80年数学难题,这次有数学家背书

    七个月前,OpenAI前副总裁Kevin Weil在X平台上高调宣布GPT-5解决了10个未解的Erdős问题,结果被证明那些”解”早就写在公开文献里。Yann LeCun和DeepMind的Demis Hassabis纷纷嘲讽,Weil只好默默删帖。

    这次OpenAI学乖了。2026年5月20日,他们声称新的推理模型推翻了Paul Erdős在1946年提出的几何猜想,而且这次找来了数学家Noga Alon、Melanie Wood和Thomas Bloom背书——正是Bloom上次公开批评OpenAI”严重误导”。

    Erdős数学问题示意图
    OpenAI称其模型发现了全新的几何构造族,推翻了近80年的数学共识(图源:OpenAI)

    不是专用系统,是通用推理模型

    OpenAI特别强调,这次产出证明的不是专门为数学设计的系统,而是一款通用推理模型。这意味着AI现在能处理更长的推理链,还能把不同领域的想法串起来——这种能力对生物学、物理学、工程和医学都有意义。

    “近80年来,数学家们一直认为最佳的可能解法大致类似于平方网格。现在OpenAI的一个模型推翻了这一认知,发现了一种全新的构造族,性能更优。”——OpenAI官方声明

    Thomas Bloom说:”人工智能正在帮助我们更全面地探索几个世纪以来我们建造的数学大教堂。还有哪些未被发现的美妙事物在等待着我们?”这位数学家上次可是OpenAI的批评者,他能出面背书,可信度比上次高多了。


    为什么这次可能真不一样

    上次翻车之后,OpenAI这次显然更谨慎了。除了发布公告,他们还专门拉来了几位数学家的支持性评论,其中Bloom运营的Erdős问题网站正是上次戳穿OpenAI夸大宣传的那位。

    如果这次真的站得住脚,这会是AI第一次自主解决数学领域核心的知名开放问题。但数学界向来谨慎,最终还得经过同行评审才能定论。OpenAI把详细证明放在了官网上,感兴趣的可以去扒一扒。

  • 芬兰大学搞出新型AI聊天机器人:帮你在健康信息里“打假”

    你有没有在朋友圈或者微信群里看到过这样的健康信息:“吃这个能治糖尿病”、“每天喝8杯水能排毒”、“某某保健品能抗癌”……这些信息很多都是错误的,但又很有迷惑性,很多老年人特别容易相信。

    核心方法:采用“认知接种”方法,先展示错误健康信息并解释其错误逻辑,帮助用户产生“抗体”,以后再遇到类似信息就能自行识别。

    为什么这个方法有效?

    错误健康信息之所以能迷惑人,很大程度上是因为人们不了解其背后的套路。比如,“吃某某食物能治糖尿病”这个信息,利用了糖尿病患者想治愈疾病的急切心理,让他们忽略了科学证据的存在。

    “认知接种”方法的有效性已经在很多领域得到了验证,比如抵抗政治谣言、商业诈骗等。现在,研发团队把这个方法用到了健康领域,希望能帮助公众减少被错误健康信息误导的情况。

    当然,这个聊天机器人也不是万能的,它只能帮助用户识别一些常见的错误健康信息,对于比较复杂的健康问题,还是建议大家咨询专业的医生或者医疗机构。


    目标用户与后续优化

    • 采用“认知接种”方法,先展示错误健康信息并解释其错误逻辑
    • 目标用户主要是老年人,他们是错误健康信息的最易感人群
    • 研发团队将优化聊天机器人,使其更能理解老年人的需求和认知水平
    • 对于复杂的健康问题,仍建议咨询专业的医生或者医疗机构
  • 一季度AI融资超1100亿:钱都流向了哪里?

    2026年刚过去一个季度,AI圈的融资数据就炸了。国内AI领域一季度融资总额超过1100亿元,比去年同期激增185.4%——这个数字意味着什么?去年同期的融资额大概是385亿元,今年直接翻了近三倍。

    核心数据:2026年一季度国内AI领域融资总额超1100亿元,同比激增185.4%;国内大模型迭代周期缩短至3个月以内,推理成本大幅下降。

    钱都流向了哪些赛道?

    最核心的两个方向是国产大模型和具身智能。国产大模型赛道的融资热度攀升很快,很多公司在短时间内完成了大额融资,资金主要投向三个方向:研发、算力、人才招揽。国内大模型的迭代周期已经缩短到3个月以内,推理成本大幅下降,商业化进程也在加速。

    具身智能是另一个融资热点。这个赛道的核心是让AI从“会说话”变成“会做事”,比如人形机器人、工业智能体等。很多投资方认为,具身智能是AI的下一个爆发点,所以愿意砸重金布局。


    融资资金的三大投向

    • 国产大模型迭代周期缩短至3个月以内,推理成本大幅下降
    • 具身智能成为融资热点,AI从“会说话”转向“会做事”
    • 融资资金主要投向研发、算力、人才招揽三大方向
    • 国内AI商业化进程加速,更多应用场景将落地
  • Superpowers:204k Stars!给AI编程智能体装上方法论,像资深工程师一样工作

    Superpowers:204k Stars!给AI编程智能体装上方法论,像资深工程师一样工作

    GitHub ⭐ 204k+ Stars · MIT License · 2025年10月发布 · 第30期

    如果你正在用 Claude Code、Cursor 或 Copilot 写代码,有没有一种感觉:AI 能写,但写得乱、改得飘、测不住。你让它实现个功能,它噼里啪啦一顿输出,跑起来才发现逻辑是错的,测试一个没写。

    这不是你的问题,是 AI 缺少”方法论”。

    今天要介绍的这个项目,给 AI 装上了一套完整的软件开发流程——需求澄清、方案设计、测试驱动、子智能体分工、代码评审,一套下来让 AI 像资深工程师一样工作。它就是本周 GitHub 趋势榜第一名,204k Stars 的 Superpowers。

    · · ·

    01项目是什么

    Superpowers 是一套面向编程智能体(Coding Agent)的完整软件开发方法论,基于可组合技能集和初始指令构建。装上它之后,你的 Claude Code / Cursor / Copilot 会自动遵循一套严谨的软件工程流程来工作,而不是想到哪写到哪。

    它的核心思想是:AI 不缺写代码的能力,缺的是”知道该怎么写”的方法论。Superpowers 把资深工程师的工作习惯——先澄清需求、再出方案、写测试、小步迭代、代码评审——全部固化成了可触发的技能,智能体启动时自动生效,不需要你手动干预。

    项目由 Jesse Vincent(blog.fsck.com)和 Prime Radiant 团队共同维护,2025年10月首发,到2026年5月已经积累 20.4万 Star,是AI 编程工具领域最热门的项目之一

    · · ·

    02安装要求与过程

    Superpowers 支持目前几乎所有主流编程智能体工具,不同工具的安装方式不同。以下是最常用的几种:

    🤖 Claude Code

    # 官方市场安装
    /plugin install superpowers@claude-plugins-official
    
    # 或自定义市场
    /plugin marketplace add obra/superpowers-marketplace
    /plugin install superpowers@superpowers-marketplace

    ⚡ Cursor

    # 在 Agent 聊天框中从市场安装
    /add-plugin superpowers
    
    # 或在插件市场搜索 "superpowers" 安装

    🔷 GitHub Copilot CLI

    # 注册市场
    copilot plugin marketplace add obra/superpowers-marketplace
    
    # 安装插件
    copilot plugin install superpowers@superpowers-marketplace

    🌐 Gemini CLI

    gemini extensions install https://github.com/obra/superpowers
    💡 提示:如果你同时使用多个编程智能体工具,每个工具都需要单独安装一次。安装完成后无需额外配置,智能体启动时会自动加载技能。
    · · ·

    03核心功能

    ① 需求澄清(Brainstorming)

    智能体不会直接写代码,而是先和你沟通,通过苏格拉底式提问提炼出你的真实需求,输出分段的可读需求规格文档供你确认。避免”你以为它懂了,其实它没懂”的尴尬。

    ② 测试驱动开发(TDD)

    严格执行「红→绿→重构」循环:先写失败测试 → 确认测试失败 → 写最小实现代码 → 确认测试通过 → 提交代码。每一个功能都有对应的测试保护,重构不慌。

    ③ 子智能体并行开发(Subagent-Driven Development)

    计划确认后,启动子智能体驱动开发流程,每个子智能体负责单个工程任务,主智能体负责检查和评审。Claude 最高可无人值守连续工作数小时不偏离计划。

    ④ 系统化调试(Systematic Debugging)

    内置4阶段根因分析流程,包含根因追踪、纵深防御、基于条件的等待等技术。不是”猜哪里错了”,而是系统化地定位问题根因。

    ⑤ 代码评审关卡(Code Review Gates)

    每个任务完成后自动触发代码评审,按严重程度上报问题,严重问题会阻塞流程推进。相当于给 AI 配了一个严格的 Tech Lead,每一步都要过审。

    · · ·

    04典型使用场景

    场景一:从零开始做一个新功能

    你:“帮我做一个用户登录功能,支持邮箱和密码”

    普通 AI:直接开写,写完发现没考虑密码加密、没做输入校验、没写测试。

    装上 Superpowers 的 AI:先和你确认需求细节(密码策略?Session 还是 JWT?要不要限流?),输出设计方案让你确认,再拆解成 2-5 分钟的小任务,每个任务先写测试再写实现,完成后自动跑评审。最终交付的是一套有测试、有规范、可维护的代码。

    场景二:修复一个顽固 Bug

    你:“这个接口偶尔超时,不知道为什么”

    普通 AI:猜可能的原因,改几行,说”试试看”。

    装上 Superpowers 的 AI:启动系统化调试流程,4 个阶段逐步缩小范围——先确认复现条件,再追踪根因,检查是否存在竞争条件或资源泄漏,最后给出修复方案并验证修复后没有引入新问题。

    · · ·

    05为什么值得用

    🌟 推荐理由

    它解决的是真问题。

    现在 AI 编程工具的瓶颈,已经不是”能不能写代码”,而是”写出来的代码能不能用”。Superpowers 的本质,是把软件工程的最佳实践”固化”成了 AI 可以执行的技能,让 AI 不再是”写代码很快但不靠谱的初级工程师”,而是”有方法论、有流程、有质量意识的高级工程师”。

    我特别喜欢它的几个设计:

    • 需求澄清放在写代码之前——这和最优秀的工程师工作习惯完全一致,先想清楚再动手;
    • TDD 是强制流程而非可选建议——避免了 AI 偷懒跳过测试的经典问题;
    • 子智能体架构——主智能体做规划和评审,子智能体做执行,职责分离,不容易偏离方向。

    目前这个项目在 GitHub 上 20.4 万 Star,且支持 Claude Code、Cursor、Copilot、Gemini CLI 等所有主流工具,基本上如果你在用 AI 写代码,就没有理由不装

    · · ·

    06相关资料

    GitHub 仓库 github.com/obra/superpowers
    官方网站 primeradiant.com/superpowers
    发布公告 Jesse Vincent 的博客
    Discord 社区 加入讨论
    开源协议 MIT License

    本文由 AI 助手整理,内容参考项目 GitHub README 及官方文档,如需更正或补充欢迎留言。

  • 诺基亚老将HMD的新玩法:给手机装上印度本土AI

    HMD(对,就是那个做诺基亚手机的芬兰公司)在2026年5月21日干了一件事:发布了一款中端安卓手机Vibe 2 5G,预装了印度AI公司Sarvam的聊天机器人Indus。这不是贴个图标那么简单,而是把一整个1050亿参数的大模型直接塞进了手机里。

    HMD Vibe 2 5G手机
    HMD Vibe 2 5G,售价114美元,预装Sarvam Indus AI助手

    为什么是印度AI

    Sarvam的Indus大模型有个很实用的能力:支持22种印度本土语言,还能在句子中间无缝切换语言(比如刚说了印地语,下一句直接切英语)。这对印度市场来说非常关键——印度的语言多样性意味着英语AI工具的实际覆盖面相当有限。

    HMD的CEO Ravi Kunwar说得很直白:第一阶段就是把Indus应用推给消费者,先让大家用起来,后面再考虑粘性和深度集成。这款Vibe 2 5G售价10999卢比(约114美元),配了6000mAh的大电池,定位就是平价走量。

    数据显示,Indus应用上线近3个月,在印度全平台的下载量只有29.3万次。作为对比,同期ChatGPT在印度的下载量是4390万次。差距是肉眼可见的。

    HMD的市场赌注

    HMD在2025年拿了印度功能机市场4%的份额,但智能手机市场几乎可以忽略——连前15名都没挤进去。所以这次跟Sarvam的合作,某种程度上是在赌一个差异化的切入点:把本土AI助手和平价硬件绑定,在大厂的英语AI工具覆盖不到的市场里找存在感。

    更有意思的是后续规划:HMD说未来几个月会推出集成Sarvam AI的功能机。功能机+本土语音AI,这个组合如果在印度跑通了,对其他新兴市场也有参考意义。

    Sarvam的融资故事

    顺带一提,Sarvam正在推进一轮3亿美元的融资,投后估值预计15亿美元。如果完成,它将成为印度融资额最高的AI初创公司之一。从这件事也能看出来,不只是美国和中国在卷AI——印度的AI本土化浪潮,才刚刚开始。

  • 做AI播客的Huxe倒了,大厂的跟风速度比你想的快

    前NotebookLM的开发者出来创业,做了一个叫Huxe的AI音频应用——你输入几个提示词,它就能生成一期播客或者播客系列。听起来很酷对吧?但就在2026年5月22日,这家公司宣布关停了。

    时机挺讽刺的。Huxe发布关停公告的前一天,Spotify刚刚推出了功能几乎一模一样的个人播客工具。这已经不是巧合了,这是AI消费级市场的常态——你辛辛苦苦做的创新功能,大厂两个月就给你做到自己的产品里,还不收你钱。

    Huxe AI音频生成应用界面
    Huxe的核心功能:输入提示词,生成播客

    为什么撑不下去

    Huxe不是没拿到钱。2024年底成立,拿了Conviction、Genius Ventures、Figma CEO Dylan Field、还有谷歌研究院首席科学家Jeff Dean的投资,总共460万美元。创始团队是前谷歌员工Raiza Martin、Jason Spielman和Stephen Hughes,履历相当能打。

    但问题出在产品形态上。”用提示词生成播客”这个核心功能,在2025-2026年之间被大厂们集体盯上了。NotebookLM先做了一遍,然后Adobe跟进了,亚马逊的Alexa也加了类似功能,ElevenLabs、Meta、谷歌……现在连Spotify都做了。你做一个独立应用,靠这个功能怎么跟免费的大厂生态竞争?

    Huxe在给用户的邮件里写得很委婉:”团队将转向新的项目,不会再继续开发这款产品。”没说具体原因,但答案其实很明显——赛道已经被碾平了。

    同类竞品也在挣扎

    不是只有Huxe一家碰到这种事。Anchor联合创始人做的Oboe(拿了a16z的1600万美元)和a16z speedrun孵化的Sun,都在做类似的”AI生成音频内容”赛道。但大趋势是一样的:AI模型能力越强,跨格式转换越容易,只做单一消费级模态的初创公司就越难维持长期活跃和收入。

    已安装Huxe的用户还能再用7天,之后公司会删除所有用户相关数据。算是体面的收场吧。