博客

  • Suno用户上瘾了:他们不再听真人音乐,只听自己用AI生成的歌

    你大概没想过,有人会把自己用AI生成的歌循环播放两千多次,而对Spotify上真人歌手的作品完全失去兴趣。这不是科幻小说里的情节,而是The Verge记者Terrence O’Brien最近在Suno子版块(r/SunoAI)里亲眼看到的现象。

    “我做了六百首,现在不听别的了”

    Suno是一个AI音乐生成工具,用户输入几句提示词,它就能输出一首完整歌曲——有旋律、有歌词、有编曲,听起来像模像样。这本身没什么问题,很多人在用它做实验、找灵感,甚至作为创作辅助。

    问题在于,有一群用户不只拿它做实验——他们真的在只听自己用Suno生成的歌。有人在Reddit上发帖问:”有没有人也像我一样,现在只听自己做 music,再也不听Spotify了?”跟帖的人不少,有人说自己已经这样好几个月了,有人说自己生成了六百多首,每天循环播放,还有人坦承:”Last.fm显示我过去365天里,听了自己AI生成的音乐2239次。”

    AI生成的音乐内容示意图
    AI音乐生成工具Suno引发争议:用户开始只听自己生成的歌曲

    “我生成音乐毫无疑问比大多数真实艺人的作品更符合我的口味。”——Suno用户在Reddit上的发言

    “偏门流派找不到”?这个理由站不住脚

    有用户解释说自己只听AI歌,是因为”Suno上才能找到那些很偏的流派融合”——比如乡村加说唱、电子舞曲加说唱。记者O’Brien对此并不买账,他列举了一长串真实音乐史里的例子:1980年就有乡村嘻哈作品《Blowfly’s Rapp》,Lil Nas X的《Old Town Road》把乡村和说唱送上了榜单冠军,还有hip house、electro rap、crunk这些本身就是融合风格的音乐类型,早就存在了几十年。

    那么真正的原因是什么?O’Brien提出了两种推测。第一种是自恋——YouTuber、贝斯手Adam Neely认为,这种模式很大程度上是自恋驱动的,是过度个性化的副产品。你听的不是音乐,是你自己的”作品”,哪怕它其实是AI写的。第二种是懒惰——为什么要花几年时间练贝斯?为什么要花时间找符合口味的音乐?直接输入提示词,十秒钟就有一首”专属歌曲”。


    为什么没人愿意聊这个?

    O’Brien想做一件很简单的事:联系那些公开说自己只听AI生成音乐的用户,问问他们为什么。他联系了十几个人,结果没有一个愿意接受采访。没有人愿意公开解释,自己为什么更喜欢那些空洞又过度打磨的AI内容,而不去听真人音乐人花一生打磨的作品。

    原因其实不难猜。Suno子版块是一个”安全空间”,里面的人都在做同样的事,互相点赞、互相鼓励,不会感到尴尬。但一旦走出来,面对外界的目光,”我每天听自己AI生成的歌两千次”这种事,确实不太容易解释得出口。

    这个现象折射出一个更大的问题:当AI让”创作”变得零门槛,当”消费自己生成的内容”成为一种瘾,我们对音乐、对艺术的理解,是不是已经在悄悄发生变化?这个问题,可能比Suno本身值得更多人想一想。

  • UI-TARS Desktop:35.3k Stars!字节跳动开源多模态AI代理桌面端,让AI直接操作你的电脑

    UI-TARS Desktop:35.3k Stars!字节跳动开源多模态AI代理桌面端,让AI直接操作你的电脑


    📦 项目简介

    UI-TARS Desktop 是字节跳动开源的多模态 AI Agent 桌面应用,基于自研的 UI-TARS 多模态大模型和先进的 GUI Agent 架构,让你可以用自然语言直接控制电脑——打开软件、修改设置、操作浏览器,全部由 AI 代劳。

    项目已获得 35.3k+ Stars,Apache 2.0 开源协议,支持 Windows / macOS / Linux 三平台,是 2026 年最值得关注的多模态 AI Agent 项目之一。

    UI-TARS Desktop 演示

    UI-TARS Desktop 实际操作演示

    ⚙️ 安装要求和过程

    环境要求:

    • Windows 10+ / macOS 12+ / Linux(Ubuntu 20.04+)
    • 8GB+ RAM(推荐 16GB)
    • 支持 CPU 推理,推荐 NVIDIA GPU(4GB+ 显存)以获得最佳体验
    • Node.js 22+(如使用 Agent TARS CLI)

    方式一:下载桌面端(推荐)

    1. 访问 GitHub Releases 页面,下载对应系统的安装包
    2. Windows 用户:下载 .exe 安装包,双击安装
    3. macOS 用户:下载 .dmg 文件,拖入 Applications 文件夹
    4. 首次启动需下载 UI-TARS 模型(约 4GB),请保持网络畅通

    方式二:使用 Agent TARS CLI

    # 快速启动(无需全局安装)
    npx @agent-tars/cli@latest
    
    # 全局安装
    npm install @agent-tars/cli@latest -g
    
    # 使用火山引擎方舟模型启动
    agent-tars --provider volcengine --model doubao-1.5-thinking-vision-pro-250428 --apiKey YOUR_KEY
    
    # 使用 Anthropic Claude 模型启动
    agent-tars --provider anthropic --model claude-3-7-sonnet-latest --apiKey YOUR_KEY
    

    🚀 核心功能

    🤖
    自然语言控制
    基于视觉语言模型(VLM),用日常语言描述任务,AI 自动理解并执行
    🖥️
    全系统 GUI 操作
    精准控制鼠标、键盘,操作任意桌面应用,不受 API 限制
    🌐
    混合浏览器 Agent
    支持 GUI Agent 视觉定位、DOM 操作或混合策略控制浏览器
    🔌
    MCP 工具集成
    内核基于 MCP 构建,支持挂载各类 MCP 服务器,连接真实世界工具
    🔒
    隐私安全
    完全本地处理,数据不上传云端,支持企业内网部署
    🔄
    远程操作
    v0.2.0 起免费提供远程电脑操作和远程浏览器操作,无需额外配置

    🎯 典型使用场景

    场景一:让 AI 帮你配置开发环境

    告诉 UI-TARS “帮我在 VS Code 里打开自动保存,并把延迟设为 500 毫秒”,它会自动打开 VS Code 设置页面,找到对应选项并完成修改——全程无需你动手。

    场景二:自动完成网页预订任务

    对 Agent TARS CLI 说 “帮我在 Priceline 上订 9 月 1 日圣何塞到纽约最早的航班,以及 9 月 6 日最晚的返程航班”,它会自动打开浏览器、填写表单、筛选结果并完成预订。

    场景三:查询并分析 GitHub 项目

    直接问 “你能帮我查看 GitHub 上 UI-TARS-Desktop 项目最新的开放 issue 吗?”,AI 会自动访问项目页面、抓取 issue 列表并整理成可读的格式反馈给你。

    💡 推荐理由

    UI-TARS Desktop 最打动我的是它的「真正理解界面」的能力。不同于传统 RPA 工具依赖元素定位,UI-TARS 通过视觉语言模型直接”看”屏幕,就像人一样理解界面布局和元素含义。

    作为字节跳动出品的开源项目,它的技术栈相当扎实:基于自研的 UI-TARS-1.5-7B 多模态模型,支持 Docker 沙箱隔离执行,MCP 工具集成也非常完善。最关键的是——它完全本地运行,你的数据不会被上传到任何云端服务器。

    如果你一直在寻找一个能真正帮你操作电脑的 AI Agent,而不是只会聊天的对话工具,UI-TARS Desktop 绝对值得一试。它的远程操作功能(v0.2.0 起免费)更是让”AI 助手”的概念从聊天进化到了”真正帮你做事”。

    🚀 立即体验 UI-TARS Desktop

    开源 · 本地运行 · 多模态 AI Agent · 字节跳动出品

    支持 Windows / macOS / Linux · Apache 2.0 协议

    📥 下载地址


    📌 本文由 WorkBuddy AI 自动采集撰写,原文发布于 hiyoho.com

  • OpenAI秘密递交IPO招股书,目标估值1万亿美元

    OpenAI秘密递交IPO招股书,目标估值1万亿美元

    OpenAI在2026年5月22日提交了对科技企业、投资者和整个AI行业都具有历史意义的保密S-1招股书。这家运营着全球最知名AI产品的公司,终于要上市了。

    目标是估值超过1万亿美元。如果成功,这将成为2021年Coinbase上市以来最受关注的科技类IPO。

    OpenAI当前年化经常性收入(ARR)250亿美元,周活跃用户超过9亿。这些数字放在任何一家公司身上都足够惊人,但放在一家还在大幅亏损的公司身上,故事就变得复杂了。

    招股书里有什么

    招股书目前还处于保密状态,公众还看不到。按流程,OpenAI正在与SEC进行S-1文件的审核和修订,由高盛和摩根士丹利担任承销商。

    从已知信息来看,OpenAI2026年Q1披露的年化营收是250亿美元,对应月均收入约20亿美元。付费订阅用户(ChatGPT Plus/Pro/Team)超过5000万,企业付费用户超过900万。API业务规模是每分钟处理150亿个token。

    问题是盈利。OpenAI2026年预计仍运营亏损约140亿美元。亏损主要来自三个方面:算力采购、顶级AI研究员的人才保留(据报道单名人选签约奖金达1000万美元)、基础设施搭建。

    为什么现在上市

    时机选择值得玩味。Anthropic在2026年5月刚刚宣布首次实现运营盈利,Q2营收109亿美元,估值突破9000亿美元。两家公司的走向开始出现分化。

    OpenAI选择在这个时候递交IPO,可能有两个考虑。一个是锁定估值窗口。AI行业的热度还在,但竞争格局正在变化,越早上市越能锁定高估值。另一个是治理结构的调整。2026年4月,OpenAI与微软修订了合作协议,微软放弃部分独家合作权,换取收入分成,同时OpenAI可以更灵活地在AWS、谷歌云等平台销售服务。


    估值能不能撑住

    1万亿美元的估值目标意味着什么?按250亿美元ARR计算,市销率达到40倍。这个倍数高于所有规模化的上市SaaS公司。

    投资者会问两个问题。第一个是亏损什么时候能收窄。Anthropic已经证明了前沿AI实验室可以实现盈利,OpenAI的压力变大了。第二个是大模型性能优势能不能维持。竞争正在缩小差距,Claude、Gemini、Grok都在追赶。

    算力成本也是个挑战。OpenAI没有像Anthropic那样披露与算力供应商的长期协议细节,这部分成本在S-1文件中会有更清晰的呈现。

    行业影响

    OpenAI上市将成为通用人工智能领域的首个公开估值基准。后续Anthropic、xAI、Mistral等AI公司的估值都将参考它的公开交易倍数。

    季度财报披露也将首次让AI行业的成本结构、客户留存等核心数据公开化。这个行业过去太依赖融资和讲故事了,财务透明度提高对所有人都有好处。


    关键要点

    • OpenAI于2026年5月22日提交保密S-1招股书,目标估值超1万亿美元
    • 年化营收250亿美元,周活跃用户超9亿,付费用户超5000万
    • 2026年预计仍亏损140亿美元,盈利时间点不明朗
    • 由高盛和摩根士丹利担任承销商,预计2026年Q4上市
    • 与微软修订合作协议,为IPO扫清治理层面障碍
    • 上市后将成为通用AI领域首个公开估值基准,行业财务透明度将提高
  • Anthropic首次盈利背后:Claude Code年收入25亿美元,估值超OpenAI

    Anthropic首次盈利背后:Claude Code年收入25亿美元,估值超OpenAI

    2026年5月下旬,AI行业被两颗重磅炸弹震动。先是Anthropic宣布预计Q2实现首次运营盈利,营收达到109亿美元;紧接着完成300亿美元融资,投后估值突破9000亿美元,历史上第一次在估值上超过了老对手OpenAI。

    这家由前OpenAI高管创办的公司,用五年时间走完了大多数科技公司十年的路。更让人意外的是,它盈利的时间点比自己预期的2028年整整提前了两年。

    Anthropic CEO达里奥·阿莫代伊在开发者大会上说:”我们原本为每年10倍增长做了充分规划,但实际增速达到了80倍。”

    数字背后的故事

    具体来看这组数字:Q1营收48亿美元,Q2预计跳到109亿美元,环比增长130%。年化营收运行率按Q2数据推算已经到了436亿美元。更关键的是,Q2预计实现5.59亿美元的运营利润——这是Anthropic成立以来的第一次。

    赚钱的能力来自哪里?答案有点出人意料:不是消费级产品,而是企业服务。Claude Code(代码智能体)已经成长为第一大营收来源,年化营收25亿美元。在企业客户消费数据中,Claude Code已经超过了OpenAI的Codex。

    大客户的增长也很惊人。年消费超过100万美元的客户,两个月内从500家增长到超过1000家。普华永道在5月14日宣布向全球数十万专业人员部署Claude,摩根大通部署了10个金融智能体用于招股说明书和信贷备忘录制作,百时美施贵宝向超过3万名员工部署Claude用于药物研发。

    融资与算力的双重押注

    300亿美元的融资规模在AI行业里是天文数字,但放在Anthropic身上又显得合理。这笔钱主要投向两个方向:云计算基础设施和芯片采购。谷歌云是主要合作方,SpaceX的算力协议每月费用12.5亿美元,协议持续到2029年5月,总金额450亿美元。

    算力成了AI时代的核心战略资源。Anthropic的算力格局已经形成AWS Trainium、谷歌TPU、英伟达GPU三线并进的局面。谁掌握算力,谁就掌握行业发展主动权。


    为什么现在盈利很重要

    Anthropic的盈利验证了一个关键假设:前沿AI实验室在当前市场价格下是可以实现盈利的。这改变了此前行业”亏损换规模”的叙事。

    后续融资中,投资者会更关注已验证的单位经济模型,而不是远期的盈利预期。对于整个行业来说,这意味着从”讲故事”阶段进入了”看财报”阶段。

    不过Anthropic也提示了风险:2026年下半年算力成本会上升,SpaceX算力协议完全爬坡后费用将大幅提高,全年维持盈利存在挑战。Q2的盈利只是一个阶段性里程碑。

    IPO时间表

    按当前计划,Anthropic将在2026年10月IPO。如果下半年盈利能够维持,它将以”盈利、高增长的企业级AI公司”身份上市,IPO基本面优于同期准备上市的OpenAI。

    OpenAI2026年预计仍运营亏损约140亿美元。两家公司的走向开始出现分化:Anthropic选择了企业服务的稳健路线,OpenAI还在消费级市场大规模投入。


    关键要点

    • Anthropic Q2 2026预计营收109亿美元,首次实现5.59亿美元运营利润
    • 完成300亿美元融资,投后估值超9000亿美元,首次超过OpenAI
    • Claude Code年化营收25亿美元,成为第一大营收来源
    • 年消费超100万美元的客户两个月内从500家增至1000家以上
    • 与SpaceX的算力协议总金额450亿美元,持续到2029年
    • 计划2026年10月IPO,盈利时间点比预期提前两年
  • Erin Brockovich出手了:她把美国AI数据中心地图画出来了

    Erin Brockovich出手了:她把美国AI数据中心地图画出来了

    提到Erin Brockovich,很多人脑子里会冒出Julia Roberts在电影里扮演的那个倔强女人的样子。她当年靠一己之力扳倒了太平洋煤气电力公司,帮加州小镇的居民拿到了3.33亿美元的赔偿。那是真事,不是编剧瞎写的。

    现在这位74岁的环保活动家又出手了,这次她的目标是一类全新的「污染源」——AI数据中心。

    一张地图,揭开AI竞赛的地面代价

    Erin新做了一个网站,叫「Brockovich Data Center Map」,把全美各地正在推进、已经落地、或者已经被社区抵制掉的数据中心项目全部标了出来。不只是标个点,她还同步收集各地居民对本地数据中心项目的具体投诉。

    她在网站上写了一段话,大意是:建设AI基础设施的竞赛正在美国一个城镇接一个城镇地展开。在某些地方,数据中心受到欢迎;在其他地方,它们被推迟、引发争议,甚至完全被放弃。这张地图捕捉了这场竞赛在现实世界中的足迹。

    「建设AI基础设施的竞赛正在美国一个城镇接一个城镇地展开。这张地图捕捉了这场竞赛在现实世界中的足迹——揭示了增长、冲突和不确定性的模式。」——Erin Brockovich

    这张地图的价值在于,它把平时只在当地新闻里出现的争议,汇总到了一个全国视角里。你能清楚地看到,AI这场盛宴的背后,哪些社区在买单。

    数据中心到底惹了什么麻烦

    数据中心本身不是新东西,但AI让它变了质。训练一个大模型需要成千上万块GPU同时跑,这意味着巨大的电力消耗和惊人的冷却水需求。

    一个大型AI数据中心的耗电量,差不多相当于一座小城市。用水量大到什么程度?有些地方的数据中心每天要消耗上百万加仑的水来冷却服务器。这些成本,最终都会转嫁到当地居民头上——要么是电费上涨,要么是水资源紧张。

    更让居民闹心的是,数据中心带来的就业岗位其实很少。建的时候有一批建筑工人,建完之后可能只需要几十个人来维持运转。相比之下,它被挡掉的那些产业发展机会和社区生活质量,是很难用数字衡量的。

    各地反应天差地别

    这张地图最有趣的地方在于,它显示了美国各地对数据中心的态度完全不同。有些州(比如得克萨斯和弗吉尼亚)非常积极,给了大量税收优惠,数据中心建得像雨后春笋。但在另一些社区,居民们组织起来,在镇议会上发言,写信给民选官员,硬是把项目拖黄了。

    这种分化背后有一个很现实的原因:数据中心带来的税收收益,跟它消耗的公共资源(电力、水、道路)相比,很多社区算完账之后觉得不划算。

    Erin的地图给这些分散在社区层面的抗争提供了一个「全国联动」的视角。以前一个小镇的居民可能会觉得自己是在孤军奋战,现在他们能上这个网站,看看其他地方的人是怎么跟数据中心打交道的。


    这件事跟我们有什么关系

    说回国内。中国在AI算力上的投入同样巨大,贵州、内蒙古、京津冀等地都在大力建数据中心产业园。Erin在美国做的事情,其实给我们提供了一个可以参考的视角:在拼命建算力基础设施的同时,有没有把社区的代价也算进去?

    AI公司喜欢谈「改变世界」,但真到了要建数据中心的时候,往往是离得最近的那些人在承担代价。Erin Brockovich把这件事摊开在地图上,至少让更多人开始问这个问题。

    这张地图目前只覆盖了美国,但它触及的问题是全球性的。AI的基础设施竞赛不只在加州或弗吉尼亚上演,它正在全世界每一个被选中建数据中心的社区里上演。那些地方的人,有权利知道他们要承接的是什么。

    • Erin Brockovich制作全美AI数据中心互动地图,收集社区投诉
    • 大型AI数据中心耗电量相当于一座小城市,日耗水可达百万加仑
    • 各地态度分化:得州、弗吉尼亚积极引进,部分社区成功抵制项目
    • 数据中心带来的长期就业有限,税收收益与公共资源消耗不成正比
  • ClickUp裁员22%背后:AI正在重新定义「谁还有工作」

    ClickUp裁员22%背后:AI正在重新定义「谁还有工作」

    上个周四,协作软件公司ClickUp的CEO Zeb Evans在X平台上发了一条消息,说他们刚裁掉了22%的员工。听起来是个坏消息,但Evans的话风很有意思——他说这次裁员不是为了省钱,而是为了激进地拥抱AI。

    这话不是修饰。Evans说他要把裁员省下来的大部分钱,直接回馈给留下来的员工,甚至要推出「百万美元级别」的薪资档位。意思很直白:如果你用AI做出了远超预期的成果,你的薪水就不该被传统档位限制住。

    「那些用AI自动化了自己工作的人,永远会有工作。」——Zeb Evans,ClickUp CEO

    3000个AI代理已上岗

    根据《财富》杂志的报道,ClickUp最近内部部署了大约3000个AI代理,用来代替员工处理各类复杂任务。现在的员工不需要亲自完成那些工作,而是负责指挥这些代理,最后审核输出结果是否符合公司标准。

    这个变化挺激进的。员工的核心技能从「把事情做好」变成了「把AI代理用好」。ClickUp把这个目标叫做成为一家「100倍组织」——用极少的真人,产出百倍于传统团队的产出。

    ClickUp不是唯一这么想的公司。Gartner最近的调查显示,大约80%正在使用自主AI技术的公司已经进行了裁员。但这里有个问题:裁员并不一定会转化为有意义的财务回报。也就是说,有些公司可能只是拿AI当裁员的借口。

    ClickUp坚称自己不是这类公司。Evans在邮件里跟TechCrunch说,他们确实从AI代理身上看到了生产力提升,而且不仅在内部衡量这些效率提升,显然还在准备向客户推出包含相关功能的新产品。

    ClickUp AI工作流程示意图
    ClickUp总部,该公司正大力拥抱AI代理技术(图源:Getty Images)

    「Token最大化」正在成为考核指标

    近几个月来,越来越多的公司开始监测员工的token消耗量,把它当作衡量员工是否真的在用AI工具的指标。但批评者认为这个叫「tokenmaxxing」的概念是错误的——它只会推高AI成本,而不一定带来实际价值。

    Evans的说法是:「我们不做token成本的游戏化,我们做的是创造价值和节省时间的游戏化。」这话听起来有道理,但实际执行起来,员工为了证明自己在用AI,可能会无意义地消耗更多token。

    这场实验的核心矛盾在于:如果AI不断接管更多任务,ClickUp最终需要的人就会越来越少。那些没能很好实现职能自动化的员工,最终还是会被淘汰。CEO说「用AI自动化工作的人永远有工作」,但没说这些工作将来还有多少需要真人来做。

    一个人估值2.5亿美元的公司

    科技圈已经出现了一个把AI自动化用到极致的极端案例。成立仅一年的Polsia,声称用AI为独立创业者处理所有软件运营工作,而这家公司只有1名员工——就是它的创始人兼CEO Ben Broca。

    这种效率显然带来了回报:Polsia刚刚以2.5亿美元的估值完成了3000万美元的融资。这个故事给整个行业抛出了一个尖锐的问题:如果1个人加上一堆AI代理就能做原来需要几百人才能做的事情,那其他人的工作在哪里?

    ClickUp的这次裁员,加上他们明说的「100倍组织」目标,本质上是在告诉整个行业:用AI极致提效不是未来,是现在。那些还在犹豫要不要拥抱AI的公司和员工,可能很快就要面对一个很现实的选择——要么学会指挥AI代理,要么被那些已经学会的人取代。

    这场变化的速度可能比大多数人想象的要快。ClickUp把节省下来的人力成本用来给剩下的人涨薪,这个做法挺聪明——它至少在一定程度上缓解了留下来的员工的焦虑。但整个行业能不能复制这个模式,还得看AI代理到底能不能真的交付它们承诺的那些生产力红利。


    • ClickUp裁员22%,CEO称是拥抱AI而非成本削减
    • 内部已部署约3000个AI代理,员工角色转变为「代理指挥者」
    • Gartner:80%使用自主AI技术的公司已完成裁员
    • 「1人公司」Polsia以2.5亿美元估值融资,AI极致效率的极端案例
  • Hark拿下7亿美元A轮:神秘AI通用界面公司估值60亿

    Hark拿下7亿美元A轮:神秘AI通用界面公司估值60亿

    Brett Adcock又融了一大笔钱。他创办的AI实验室Hark在周四宣布完成7亿美元A轮融资,投后估值60亿美元。这家公司外面的人几乎没听说过,但融资金额和估值已经把很多成名已久的AI公司甩在了后面。

    Hark AI interface concept
    Hark 正在开发通用AI界面 | 图片来源:Hark

    Hark在做什么?用创始人自己的话来说,是做一个通用AI界面——一个能帮普通人跟数字世界打交道的智能体系统。听起来有点抽象,但Adcock的履历让人不敢轻视:他之前创办了人形机器人公司Figure.AI,还创办了电动飞机公司Archer。这两家公司都还在跑,而且都融了不少钱。

    豪华融资阵容

    这轮融资的阵容也挺豪华:领投方是Parkway Venture Capital,跟投名单里出现了英伟达、AMD、英特尔资本、高通创投、Salesforce Ventures这些战略投资方。也就是说,Hark不仅有钱,还有算力供应链上的关键玩家的支持。

    公司目前有70名员工,运营着搭载英伟达B200 GPU的数据中心。Adcock自己先投了1亿美元种子钱,2025年末才正式启动这个项目。按照规划,今年夏天会发布第一款多模态模型,后续还会推出专门配合这个系统的硬件设备。

    产品设计负责人Abidur Chowdhury说:”我还没见过真正能帮到普通人的AI产品。现在很多产品都是帮人做软件的,但面向普通人的好产品还没出现。”

    还没解答的问题

    当然,挑战也明摆着。怎么在给AI助理提供足够多的用户上下文的同时,不让人觉得被监视了?可穿戴设备到现在都没解决这个问题。Chowdhury被问到这个时只是笑着说:”听起来这会是个很棒的产品。”

    Hark目前对产品的具体形态仍然守口如瓶。但从融资规模和团队背景来看,这家公司显然想在AI硬件和界面的交叉点上做点不一样的东西。能不能做成,可能今年夏天就能看到初步答案。


  • Anthropic要盈利了:Claude营收翻倍,AI烧钱时代正在松动

    Anthropic要盈利了:Claude营收翻倍,AI烧钱时代正在松动

    《华尔街日报》捅出了一个挺炸的消息:Anthropic告诉投资人,今年第二季度营收将比去年第四季度翻倍,冲到约109亿美元,而且有望首次实现运营盈利。整个AI圈都侧目。

    这家公司过去一年确实势头不错。职场人对Claude的偏好在上升,不少专业用户把ChatGPT换成了Claude,理由是后者”更不容易胡说八道”。Anthropic也在一边拓客,不久前刚宣布了面向中小企业的新服务,还给律师事务所推了专用工具。

    Anthropic如果真能在第二季度实现运营盈利,即便只是单季转正,也是一个很强的信号。它意味着大模型公司不一定永远活在亏损里。

    盈利背后的算力账单

    别急着下结论说Anthropic已经跑通了商业模式。报道同时提到,因为接下来要付的算力账单太贵,今年剩下几个季度未必能守住盈利。训练和下一代模型推理都要烧钱,这不是什么秘密。

    有意思的是,这条消息和OpenAI可能很快提交IPO申请的新闻撞在了同一天。两家公司的节奏越来越像在互相看清对方底牌——Anthropic亮出盈利预期,OpenAI则在筹备上市。

    两个巨头的暗中较劲

    OpenAI有微软撑腰,Anthropic的投资方则包括谷歌、亚马逊等。盈利这件事,对Anthropic来说不只是财务数字,也是向投资人证明自己能够独立造血、不完全依赖持续融资的关键一步。

    至于全年能否维持盈利,报道给出的判断是比较谨慎的。大模型公司的成本结构里,算力支出是最重的一块,而且往往集中在某几个季度——比如新模型训练完成、大规模推理服务上线的那个节点。


    总的来说,这条消息释放的信号比数字本身更值得琢磨。AI行业从”拼命烧钱换增长”到”认真对待unit economics”,可能比很多人预期的要快。Anthropic如果真的在这个季度转正,不管能不能维持,都会给其他大模型公司带来压力。

  • OpenClaw — 你的专属个人AI助手

    OpenClaw — 你的专属个人AI助手

    🦞 OpenClaw — 你的专属个人AI助手


    OpenClaw Logo

    📝 项目简介

    OpenClaw 是一款可以运行在你自己设备上的个人AI助手,支持任何操作系统、任何平台。它让你在已经使用的通讯渠道中与AI交互,真正实现”你的数据你做主”。

    项目在GitHub上获得了 374,000+ Stars,是2026年最热门的个人AI助手项目之一。

    💻 安装要求和过程

    环境要求:

    • Node.js:24.x(推荐)或 22.19+
    • 操作系统:macOS、Linux、Windows(推荐WSL2)
    • 包管理器:npm、pnpm 或 bun

    快速安装步骤:

    # 全局安装 OpenClaw
    npm install -g openclaw@latest
    # 或使用 pnpm
    pnpm add -g openclaw@latest
    
    # 运行引导式安装(推荐)
    openclaw onboard --install-daemon

    守护进程模式(推荐):

    # 安装守护进程
    openclaw onboard --install-daemon
    
    # 检查网关状态
    openclaw gateway status

    前台调试模式:

    # 停止后台网关
    openclaw gateway stop
    
    # 前台运行(带详细日志)
    openclaw gateway --port 18789 --verbose

    ✨ 核心功能

    🌐 本地优先网关(Local-first Gateway)
    单一控制平面管理会话、渠道、工具和事件,所有数据保存在本地设备上。
    📱 多渠道收件箱
    支持 20+ 通讯平台:WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、IRC、Microsoft Teams、Matrix、飞书、LINE、Mattermost等。
    🤖 多Agent路由
    将不同渠道/账号/联系人路由到隔离的Agent(工作区 + 每Agent会话),实现多用户、多场景并行处理。
    🎙️ 语音唤醒 + 对话模式
    macOS/iOS支持语音唤醒词,Android支持连续语音对话(集成ElevenLabs TTS + 系统TTS备用)。
    🎨 实时画布(Live Canvas)
    Agent驱动的可视化工作区,支持A2UI协议,让AI实时生成和操作界面元素。

    🚀 典型使用场景

    场景1:跨平台消息助手
    在你最常用的通讯工具(如WhatsApp或Telegram)中直接与AI对话,OpenClaw作为后台网关统一处理,无需切换应用。

    场景2:开发者工作流自动化
    结合Cron作业、Webhook和Gmail Pub/Sub,让AI定时执行任务、监控邮件并自动回复,打造个性化自动化工作流。

    场景3:多设备协同助手
    在macOS菜单栏、iOS和Android设备上同时运行OpenClaw节点,通过WebSocket配对,实现跨设备语音控制和画布同步。

    💡 推荐理由

    作为一名AI工具和开源项目的爱好者,我认为OpenClaw在以下几个方面表现出色:

    • 隐私优先:所有数据保存在本地,不依赖第三方云服务,真正实现了”own-your-data”的理念。
    • 渠道覆盖广:支持的平台数量远超同类项目,几乎覆盖了所有主流通讯工具。
    • 架构设计优雅:Gateway作为控制平面,配合可选 Companion App,既保证了功能完整性,又保持了模块化。
    • 活跃社区:374K+ Stars和众多企业赞助商(OpenAI、GitHub、NVIDIA、Vercel等)证明了项目的生命力和商业价值。

    如果你在寻找一个真正属于自己、可定制、跨平台的AI助手,OpenClaw绝对值得一试!

    📥 下载地址

    🦞 EXFOLIATE! EXFOLIATE!

  • 谷歌云安全负责人说一套做一套:Gemini API密钥漏洞让开发者收到五位数账单

    谷歌云COO的”安全宣言”

    洛杉矶的一场活动后台,谷歌云首席运营官弗朗西斯·德·索萨(Francis de Souza)抽了几分钟出来聊企业AI安全的现状。他的语气像大学教授一样冷静审慎:”会有一个过渡期,然后我认为我们会进入一个更好的阶段。”

    话说得漂亮。但《注册表》(The Register)在过去几周里记录的大量案例,让这番话听起来有点微妙——那些案例里,开发者因为对 Gemini 模型的未授权 API 调用,收到了五位数甚至六位数的账单。

    AI安全概念图
    AI安全:说起来容易做起来难

    “影子AI”:企业安全的隐形漏洞

    德·索萨的核心观点其实是安全专业人士多年来一直在试图让高管们内化的:安全不能是事后想法。他特别警告了”影子AI”的风险——员工在没有组织监督的情况下使用消费级工具。

    他说:”当公司开启AI之旅时,他们需要采取平台化方法。安全不是你之后可以加装的东西,也不是你可以留给员工自己处理的事情。”

    这话没错。但有趣的地方在于,谷歌自己似乎也还在经历这个”过渡期”——就像德·索萨自己说的那样。

    “没有数据战略和安全战略的AI战略是不存在的,它们必须齐头并进。”——弗朗西斯·德·索萨,谷歌云首席运营官

    23分钟的”黑洞”:Gemini API密钥撤销延迟

    问题出在哪儿?《注册表》报道了一个让人坐不住的细节:开发者即使捕获到泄露的 Gemini API 密钥并立即删除它,攻击者仍然可以继续使用该密钥长达23分钟。

    原因是谷歌的撤销操作在其基础设施中是逐步传播的,不是即时生效。安全公司 Aikido 的研究员约瑟夫·莱昂(Joseph Leon)发现,在这23分钟的窗口期内,超过90%的请求仍然可以认证——攻击者完全可以利用这段时间从 Gemini 中提取文件和缓存的对话数据。

    莱昂还指出,谷歌自己较新的凭证格式似乎没有同样的问题:服务账户 API 凭证的撤销时间约为5秒,Gemini 较新的 AQ 前缀密钥格式的撤销时间约为1分钟。这说明23分钟的窗口不是工程限制,而是优先级问题。

    五位数账单:开发者的噩梦

    面试准备平台 Prentus 的 CEO 罗德·达南(Rod Danan)遇到了这种事。他的密钥被攻击者利用后,大约30分钟内账单就达到了10138美元。

    悉尼的开发者伊苏鲁·丰塞卡(Isuru Fonseka)也遭遇了类似入侵,醒来时发现自己被收取了大约17000澳元的费用——尽管他相信自己设置了250澳元的消费上限。

    两个人都不知道的是,谷歌的自动化系统根据账户历史记录升级了他们的计费层级,将有效上限提高到高达10万美元,而且不需要明确同意。

    在《注册表》发布初步报告后,谷歌退还了这两人的费用。但谷歌表示不打算改变自动升级层级的政策,理由是优先考虑防止服务中断,而不是执行用户声明的预算偏好。

    威胁格局已经变了

    德·索萨说得对:从初始入侵到攻击进入下一阶段的平均时间已经从8小时缩短到22秒,攻击面也远远超出了传统的网络边界。除了通常的资产,企业现在还有模型、用于训练模型的数据管道、智能体,还有提示词——所有这些都需要被保护。

    但他也指出了一个没有得到足够关注的风险:在企业内部系统游走的智能体,可能会暴露出多年来无人问津的遗忘数据存储库。”很多组织有旧的 SharePoint 服务器和访问控制,他们很久没有真正更新过,但这没关系,因为没人知道它们在哪里。但会在你的企业里漫游的智能体会找到这些数据资产,并暴露上面的数据。”

    应对方法是以机器速度对抗机器速度——用 AI 原生的、完全智能体化的防御来保护自己。但这又回到了那个问题:当平台自己还在”过渡期”的时候,客户的过渡期要到什么时候才能结束?