作者: hiyoho

  • 谷歌AI眼镜上手:差一口气就成正经产品了

    谷歌I/O的”几乎时刻”:AI眼镜终于像个正经产品了

    上周谷歌I/O大会我摸到那个Android XR眼镜了。说”摸到”而不是”看到”,是因为终于有个大厂把AI眼镜做得不像科幻片道具,而是像个你能日常戴出门的东西。

    先说清楚,这次体验的还是原型机。但和往年那些”展示柜里的概念品”不一样,这次的完成度已经到了”差点就能卖”的程度。TechCrunch的Sarah Perez在现场试戴后写了一篇文章,标题就很诚实:We tried Google’s AI glasses and they’re almost there

    Google Android XR AI眼镜原型机
    谷歌Android XR眼镜原型机,与Gentle Monster合作设计(来源:Google/TechCrunch)

    两条腿走路:先卖音频版,再推显示版

    谷歌这次的策略挺聪明。他们说今年秋天先推仅音频版本的眼镜,就是没有显示屏、只靠耳机和Gemini语音交互的那个版本。然后晚些时候再推带显示屏的AR版。

    为什么要分两步走?我理解的原因有两个:一是音频版技术门槛低,供应链和品控更容易搞定,能赶在Meta Ray-Ban继续蚕食市场之前先占个坑;二是显示版确实需要再多打磨一阵,这次原型机的显示效果还不够锐利,长时间戴容易眼疲劳。

    谷歌和Warby Parker、Gentle Monster、三星一起做的这个眼镜,外观上已经不像”极客玩具”了。Gentle Monster那款的造型,普通年轻人戴着逛街完全不违和。

    实际戴起来怎么样

    我挑几个最有感的场景说:

    实时翻译是最好用的功能。演示人员说西班牙语,眼镜在我右眼上方显示英文文本,同时Gemini用英语在我耳边”悄悄话”。那个感觉……就像一个随身同声传译,而且不用低头看手机。对于经常出国的人来说,这个功能本身就值回票价了。

    导航也做得挺好。你告诉Gemini”导航到最近的咖啡店”,眼镜会在你视野里显示下一个转弯的信息。低头能看到地图上的蓝点,抬头走路的时候导航提示不会挡视线。这个设计细节说明谷歌真的想过”日常使用”的场景,而不是堆功能。

    拍照+AI处理这个组合有点意思。你可以直接说”拍张照片,把这个人变成动漫角色”,眼镜拍完照,传给Gemini和Nano Banana的服务器,几十秒后返回处理好的版本。当然现场Wi-Fi负载太高,来回花了45秒,但这个工作流本身是通顺的。

    Android XR眼镜显示界面演示
    眼镜显示界面可以叠加天气、导航、翻译等信息(来源:Google)

    但缺点也挺明显

    先说显示版的问题。原型机只有右眼有显示屏,图像有点模糊(TechCrunch的记者认为是他戴了左右眼度数不同的隐形眼镜导致的,但也有可能就是分辨率还不够)。更关键的是,戴了几分钟后右眼上方开始有疲劳感。这个问题如果不解决,没人能戴着它超过半小时。

    音频版的问题在于音质。现场太吵,音乐开到最大还是听不清细节。谷歌显然也没打算让它替代高端耳塞,它的定位就是”走路、做家务、骑车的时候能听个响,同时还听得清别人说话”。这个定位和Meta Ray-Ban是一样的。

    还有一个细节:原型机不能自动检测你是否戴着眼镜。量产版会有这个传感器,摘下来就暂停,戴上去继续。这种小功能看似不起眼,但日常用起来差别很大。


    谷歌的算盘

    为什么谷歌在这个时间点推AI眼镜?我理解有几个原因:

    • Meta Ray-Ban卖得不错,证明”眼镜+AI”这个形态是有市场需求的,谷歌不想再错过一波硬件浪潮
    • Gemini需要更多的”入口”。手机、网页、智能音箱都有了,眼镜是最自然的”始终在线”的场景
    • 安卓生态需要一个新的差异化卖点,尤其是在和苹果竞争的时候

    但谷歌也要面对一个现实:Meta已经在市面上卖了一年多,Snap也在做类似的事情。谷歌选择先推音频版”占坑”,再把显示版慢慢打磨到真正能用的程度,这个节奏是合理的。

    现场体验完我最直观的感受是:这款眼镜距离”能日常戴”还差最后那一小步。显示效果再锐利一点、续航再长一点、重量再轻一点,就够了。按照谷歌的节奏,显示版大概率要到2027年才会真正上市。

    到那时候,AI眼镜会不会已经是一片红海了?

  • Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI:104.5k Stars!Google官方终端AI智能体,让命令行成为你的AI搭档

    Gemini CLI 特色图

    📌 项目简介

    Gemini CLI 是 Google 官方开源的终端 AI 智能体,把 Gemini 大模型的能力直接搬进了你的命令行。它不只是一个聊天工具——它能读你的代码库、帮你写代码、调试 Bug、执行终端命令,甚至直接操作文件,真正实现了「在终端里有一个懂你项目的 AI 搭档」。


    ⚙️ 安装要求和过程

    📦 环境要求

    • Node.js >= 18(必须!)
    • npm 或 npx(自带)
    • Google 账号(登录获取免费额度)
    • 终端:支持 macOS / Linux / Windows

    🚀 快速安装(3步搞定)

    最简单的方式,一步安装:

    npm install -g @google/gemini-cli

    或者用 npx 直接运行(无需安装):

    npx @google/gemini-cli

    安装完成后,在终端输入以下命令启动:

    gemini

    首次使用会用浏览器打开 Google 登录页面,授权后即可开始使用,免费版有每天 1000 次请求额度,对个人使用完全够用。


    💡 核心功能

    🔍 1. 全代码库理解

    Gemini CLI 不是「瞎猜」你的代码,它能真正读取和理解整个项目目录。你问它「这个函数的逻辑是什么」,它会去读对应的文件,给你准确的答案,而不是泛泛而谈。

    🛠️ 2. 代码生成与执行

    直接让它写代码、改 Bug、重构函数,它生成完还能直接帮你写到文件里。更厉害的是它可以在沙箱环境里执行代码,验证结果后再提交,减少低级错误。

    🔗 3. 内置 Google 工具集成

    因为是第一方工具,Gemini CLI 可以直接调用 Google 的生态:搜索网页、读取 Gmail、管理日历、操作 Google Drive 文件……这些都不需要额外配置,登录账号就能用,真正的一体化体验。

    📋 4. 多模态支持

    不只处理文字——你可以把截图、设计图、PDF 文档直接丢给它,它能看懂图片内容、提取 PDF 里的文字、分析表格数据。写前端的时候直接把设计稿截图发过去,它能帮你写出对应的 HTML/CSS,这体验真的很丝滑。

    ⚡ 5. 超长上下文窗口

    Gemini 的杀手锏就是上下文长度,CLI 版本同样支持最高 100 万 token 的上下文窗口(付费版)。什么概念?你可以把整个中型项目的代码库全部塞进去,它都能记住,不需要像其他工具那样担心「忘记前面的对话」。


    🎯 典型使用场景

    场景一:接手陌生项目,快速上手

    刚 clone 下来一个开源项目,看不懂项目结构?在终端里直接输入 gemini 启动,然后问它:「这个项目的入口文件在哪?主要业务逻辑是怎么流转的?」它会读一遍整个目录,给你画出一张「项目地图」,比自己瞎看文档快太多了。

    场景二:写代码卡壳,AI 当结对编程伙伴

    正在写一个复杂的正则表达式或者递归算法,脑子转不动了?不用切换窗口去网页版 ChatGPT,直接在终端里问 Gemini CLI,它看着你的代码上下文给建议,甚至直接帮你写完整个函数。最关键是——它知道你项目里已有的工具和风格,不会给你写出风格迥异的代码。

    场景三:自动化日常开发任务

    需要批量重命名文件、生成项目的 README、写单元测试、或者分析 git log 找出是谁引入了某个 Bug?这些琐碎但耗时的任务,直接告诉 Gemini CLI 去做,它能在终端里直接执行,你只需要最后确认一下结果就行。


    🌟 推荐理由

    我推荐 Gemini CLI,最直接的原因就是:它是真的「懂终端」的 AI 工具

    之前用过不少 AI 编程助手,但大多要么是在网页里聊天(切换窗口很打断思路),要么是 VS Code 插件(离开编辑器就用不了)。Gemini CLI 不一样——它就在你的终端里,和你日常的 cdgitnpm 命令待在一起,想问什么直接问,完全不需要切换上下文。

    另一个很打动我的点是免费额度够大方。每天 1000 次请求,对个人开发者来说基本上用不完。当然如果你需要 100 万 token 的超长上下文,那就要开付费了,但普通使用免费版完全够用。

    当然它也有不足——相比 Claude Code,Gemini CLI 的代码生成质量偶尔会稍逊一筹,复杂逻辑可能需要多轮对话才能搞定。但作为一款终端原生的免费 AI 助手,它已经足够好用,特别是如果你本来就在用 Google 生态(Gmail、Drive 等),整合体验会很流畅。


    📥 下载地址

    🌐 官方网站:geminicli.com

    🐙 GitHub 仓库:github.com/google-gemini/gemini-cli(104.5k ⭐)

    📦 npm 安装:npm install -g @google/gemini-cli

    📚 官方文档:查看 GitHub README

    🚀 如果你每天都在用终端,Gemini CLI 值得一试。
    把它当成你的「终端里的 AI 结对编程伙伴」,你会发现开发效率提升不止一点点。

  • AI初创公司的ARR造假游戏:VC和创始人如何联手”造神”

    上个月,一家法律AI初创公司的CEO在X平台发了一篇帖子,直接把AI圈炸开了锅。他揭露了一个很多人心知肚明却不敢明说的秘密:很多AI初创公司公开宣布的收入数据,水分大到离谱。

    ARR造假隐喻
    ARR造假就像匹诺曹的长鼻子(图源:TechCrunch/ChatGPT AI生成)

    还远不是真正的收入

    这里说的ARR,全称是Annual Recurring Revenue(年经常性收入),本来是用来统计按订阅模式收费的SaaS公司的核心指标。但现在的AI初创圈,这个概念已经被玩坏了。

    最主要的混淆手段,是把”合同ARR”(有时候也叫”承诺ARR”,即CARR)直接当成ARR来报。这两者之间的差别,就像你签了一份为期三年的健身房合同,和你已经连续三年每周都去健身房并把钱结清了之间的差别——前者是承诺,后者是实绩。

    有投资者透露,他见过一些公司的CARR比真实的ARR高出70%。这些合同里很大一部分收入,可能永远都不会真正到账。

    CARR最大的问题,是在产品尚未落地时就计入收入。如果实施周期很长或者出了岔子,客户可能在试用期就取消合作,导致全部或部分合同收入无法收取。有前员工爆料,他所在的公司甚至把一个为期一年的大型免费试点项目也算进了ARR。

    使用CARR却称之为ARR的明显问题,是它比传统ARR更容易被”操纵”。如果初创公司不切实际地计算流失率和降级销售,CARR就可能被虚高到离谱的程度。

    另一种更有问题的”ARR”

    除了CARR,还有另一种同样有争议的”ARR”指标:年化运行率收入(annualized run-rate revenue)。这种算法更离谱,它是根据某一时期的收入(比如一个季度、一个月、甚至一周或一天)来推算未来12个月的收入。

    由于很多AI公司按使用量或效果收费,这种计算年化运行率ARR的方法可能产生严重误导,因为收入不再是锁定在可预测的合同里。今天你的AI工具突然爆火,收入飙升,明天可能就跌回原点。


    VC的真实想法

    接受采访的投资者表示,VC没有理由主动曝光这些虚报行为。通过对外公布的虚高ARR视而不见,VC实际上是在帮助”造神”自己的portfolio公司。

    当一家初创公司公开报告高收入时,更有可能吸引到最优秀的人才和相信该公司是其品类中无可争议的赢家的客户。这是一场精心设计的叙事游戏,而ARR数字就是游戏里最关键的筹码。

    • 估值越来越高,造假的激励也更强
    • AI时代初创公司被期望比以往增长快得多
    • 展示快速增长的压力促使一些VC支持虚高数据
    • “造神”成功后,VC和公司创始人都获利颇丰

    当然,并非所有初创公司都愿意用CARR代替ARR来展示增长。他们更喜欢清晰透明地公布数字,部分原因是他们明白公开市场是用ARR而非CARR来衡量软件公司的。这些创始人优先考虑透明度,不愿意为了短期收益而牺牲长期信誉。

    但现实是,那些选择透明度的公司,在融资时可能会处于劣势。当同行都在用CARR来”美化”自己的收入数据,坚持只用真实ARR的公司看起来就像增长乏力一样。这是一个典型的”劣币驱逐良币”的局面。

    我认为这是短视的,为了短期收益做这种事,你会让本来就高的倍数变得更高、更疯狂。这是非常糟糕的操作,迟早会反噬你。

    对于外部观察者和普通投资者来说,分辨这些数字的真假并不容易。ARR、CARR、年化运行率ARR,这些术语本身就足够让人眼花缭乱,更不用说每家公司在计算时都可能使用不同的标准和假设。

    下一次看到某家AI初创公司宣布”ARR突破1亿美元”的新闻时,或许我们应该多问一句:这个数字是真的ARR,还是CARR,或者干脆就是年化运行率?答案可能会让你大吃一惊。

  • GPT-5.6曝光了,OpenAI砸钱宣战:换掉Claude Code

    GPT-5.5发布才三周,GPT-5.6的内部测试代码就被曝光了。OpenAI的迭代速度快到让同行连喘气的机会都没有。

    GPT-5.6开发曝光
    知名爆料人Leo曝光GPT-5.6已进入内部测试阶段(图源:36氪)

    OpenAI加速爆更,Codex将狂飙3倍

    GPT-5.6还没正式亮相,OpenAI的产品端已经先炸了一波。有爆料称OpenAI将在本周四上线「ultrafast模式」,速度提升2-3倍,专为延迟敏感型任务提供最快的可用响应。

    同步推进的还有图像模型的A/B测试更新,就是那个在Image Arena排行榜上以+242分断档领先的gpt-image-2。要知道OpenAI在速度优化上早就有布局,今年3月GPT-5.4发布时,Codex的/fast模式已经实现了1.5倍加速。后来GPT-5.3-Codex-Spark更是借助Cerebras芯片,把推理速度拉到了超过1000 token/秒,是普通模式的15倍。

    而这次的ultrafast模式,直接在主力模型上实现2-3倍提速。不是阉割版,不是小模型替代,是正儿八经的旗舰模型加速。对于开发者来说,Agent循环、长任务流水线、浏览器自动化,所有需要等待的场景,体验将直接起飞。

    OpenAI的目标不再止步于AGI,而是直指ASI(超级智能)。当模型迭代速度由AI自身驱动,通往ASI的飞轮已经开始自转。

    全面开战!Codex vs Claude Code

    硅谷最戏剧性的一幕出现了。赶在OpenAI「ultrafast模式」上线之前,Anthropic放出了Opus 4.7 Fast模式,提供比Codex更快的高级推理、更优的长上下文编码,以及更流畅的氛围编码体验。

    真正激烈的一幕,就是Codex和Claude Code的全面开战。Anthropic率先出招,从6月15日起,为付费订阅用户每月提升50%的编程额度,全面覆盖Claude Agent SDK、命令行工具claude -p,以及深度集成GitHub工作流的Claude Code。

    Codex vs Claude Code
    OpenAI与Anthropic的编程工具大战已然开启

    OpenAI的反应非常迅速,祭出了一招堪称「重磅级补贴」的操作——在接下来30天内,任何想从其他平台切换到Codex的企业,都将获得2个月的免费使用权。奥特曼更是亲自下场带货,直言「Codex才是目前市面上最强的AI编程产品」。

    2个月免费,按Pro计划200美金/月的标准算,等于直接送了400美元的使用权。这种怼脸开打的战局,看呆了整个硅谷。OpenAI的意图非常明确:趁Claude Code用户还在犹豫,直接拿出钱砸出一条迁移的通道。


    当迭代速度逼近ASI

    把视野拉到最高的维度,GPT-5.6和编程大战,表面上是两件独立的事。但把它们放在一起看,一个远比任何单一事件都更深刻的趋势浮现了——AI的自我加速和商业化,正在形成正反馈飞轮。

    一方面,模型在加速进化。GPT-5.3-Codex是OpenAI首个「参与自身训练」的模型。到GPT-5.5,OpenAI内部85%的员工每周使用Codex。GPT-5.6的开发,几乎可以确定是在GPT-5.5的深度参与下进行的。AI在帮OpenAI造更强的AI。

    另一方面,编程工具的普及正在释放前所未有的工程产能。Codex 300万周活跃用户,Claude Code用户数同样在爆发式增长。当数百万开发者把AI编程工具当作日常效率神器,AI生成的代码又反哺回AI的训练和部署,这个循环的速度只会越来越快。

    • AI参与自身训练和部署,形成自我强化循环
    • 编程工具普及释放工程产能,加速产品迭代
    • 两家万亿级公司用「补贴战」加速AI普及
    • 通往ASI的飞轮已经开始自转
  • Spotify联手环球音乐:AI翻唱和混音要合法了

    Suno和Udio最近有点尴尬。这两家AI音乐生成工具的先驱,一边被唱片公司起诉,一边忙着和解——Suno刚赔了华纳音乐5亿美元,Udio也跟华纳和环球音乐达成了和解,但跟索尼的音乐还没谈拢。

    Spotify应用图标
    Spotify应用图标 | 图片来源:TechCrunch

    就在AI音乐平台们为版权问题焦头烂额的时候,Spotify悄悄走出了一条不一样的路。周四,Spotify宣布跟环球音乐集团(UMG)达成合作,要让用户用生成式AI给自己喜欢的歌做翻唱和混音。这个功能会作为付费附加包推出,只有Spotify Premium订阅用户能用,而且参与合作的艺术家能拿到收入分成。

    提前谈好,不先斩后奏

    Spotify去年就透露过这个计划,当时他们说得挺明白:这些AI工具会通过”提前达成协议的方式开发,而非先上线再寻求谅解”。这话听起来像在阴阳谁?没错,就是Suno那类先上线、再被起诉、再和解的平台。

    Spotify概述的原则很清楚:艺术家和版权方应该能自主选择是否以及怎么参与AI工具,如果参与,应该拿到公平的报酬。

    这次跟环球音乐的合作,就是这套原则的第一个落地案例。Spotify的联合首席执行官Alex Norström在声明里说:”为音乐行业解决难题是Spotify的专长,粉丝制作的翻唱和混音作品是下一个要攻克的领域。我们在开发的产品以参与其中的艺术家和词曲作者的授权、署名和报酬为核心。”

    环球音乐怎么看?

    环球音乐集团董事长兼首席执行官Sir Lucian Grainge对这事的评价挺正面。他觉得这是艺术家深化跟粉丝关系的一种方式,同时也能创造额外的收入机会。目前还不知道有哪些环球旗下的艺术家同意参与,但这事一旦铺开,影响会挺大——环球音乐手里握着不少顶级艺术家。

    为啥Spotify能做成这事?因为他们直接去找唱片公司谈,而不是像Suno那样先做了再说。看到用户对AI音乐有需求,Spotify选择走合规路线,跟版权方先把事儿谈妥。环球音乐可能只是第一个,Spotify后面大概率还会跟索尼、华纳、还有那些独立音乐发行公司谈类似的合作。

    AI音乐的未来在哪?

    这个消息是Spotify周四投资者日公布的一堆新功能之一。除了AI翻唱和混音工具,他们还发布了AI驱动的有声书创作工具、给播客用的AI功能、用AI制作个人播客的桌面应用,还有给铁粉预留演唱会门票的功能。

    回头看,AI音乐这条路上,Spotify选了一条最不容易但可能也最可持续的路。Suno和Udio们证明了市场有需求,但也证明了没有版权授权的路走不长。Spotify这套”先授权、再上线”的打法,虽然慢一点,但一旦跑通,后面的想象空间不小。

    对艺术家来说,这是一把双刃剑。好处是多了一个收入渠道,粉丝用你的作品生成AI翻唱或混音,你能拿到分成。坏处是,你的音乐可能以你没想过的方式被使用。但目前来看,至少艺术家有选择权——可以选择不参与。


  • 谷歌AI搜索翻车了:搜’disregard’竟然返回聊天回复

    你有没有遇到过这种情况:想用谷歌搜一个英文单词的意思,结果AI概览(AI Overviews)不但没给你搜索结果摘要,反而像聊天机器人一样回了一句”好的!有什么可以帮你的?”——这事还真发生了,而且闹得有点搞笑。

    一个单词引发的”车祸”

    事情是这样的。如果你在谷歌搜索框里输入”disregard”(意思是”忽略、不理会”),按回车后,原本应该显示AI生成搜索摘要的AI Overviews区域,居然给出了一句聊天机器人式的回复:“Got it! Let me know if you need help with anything else.”(好的!如果你需要其他帮助请告诉我。)

    Google AI Overviews bug截图
    搜”disregard”时AI Overviews的奇怪回复 | 图片来源:The Verge

    这不是孤例。The Verge的记者们测试后发现,类似的”翻车”也出现在其他几个词上。比如搜”ignore”(忽略),AI Overviews会回复:”Message received! I’m here and ready to help. What would you like to focus on today?”(收到消息!我在这里随时准备帮忙。你今天想关注什么?)

    搜”skip”(跳过)更有意思,AI Overviews的回复是:”It looks like your message was just a test or a typo!”(看起来你的消息只是测试或者输入错误!)然后还贴心地让你”随时提问或分享提示词”。

    这几乎可以确定只是一个有趣的bug。也许谷歌搜索在经历完谷歌I/O 2026的一堆事务后也”累了”,开始答非所问。

    AI搜索的”身份危机”

    这个bug其实暴露了一个更有意思的问题:当搜索工具越来越”智能”,它到底应该扮演什么角色?用户搜一个单词,期待的是词典式的解释或者相关网页链接,而不是一个假装自己是客服的聊天机器人。

    谷歌的AI Overviews功能从推出到现在,一直处在”搜索”和”聊天”的模糊地带。它的设计初衷是帮你总结搜索结果,让你不用点开一堆链接就能快速获取信息。但当它遇到”disregard”这种本身就有”忽略我”含义的词时,系统好像真的”忽略”了搜索请求,转而进入了聊天模式。

    截至文章发稿时,谷歌还没有回应关于这个bug的置评请求。不过对于普通用户来说,这个问题影响其实不大——谁会没事搜”disregard”呢?但它在某种程度上提醒我们,AI搜索再聪明,也还是会发现一些让人哭笑不得的边界情况。


  • Anthropic首次盈利:Claude增长太猛,连自己都没想到





    Anthropic首次盈利:Claude增长太猛,连自己都没想到


    Q2营收109亿美元,Anthropic第一次赚钱了

    Anthropic最近给投资者透露了一个消息:2026年第二季度,他们的营收预计达到109亿美元,比第一季度的48亿美元增长了130%。更令人惊讶的是,他们预计这个季度能实现5.59亿美元的运营利润——这是Anthropic成立以来的第一次盈利。

    你可能会说,109亿美元营收、5.59亿美元利润,利润率不是很高啊。确实,只有大约5%的运营利润率。但你要知道,Anthropic之前每年都在烧钱,亏损额以十亿美元计。能在这个季度扭亏为盈,说明他们的商业模式开始跑通了。

    Anthropic原本给自己设定的盈利目标是2028年。现在2026年Q2就要实现运营盈利,提前了整整2年。CEO达里奥·阿莫代伊之前说”我们原本为每年10倍增长做了充分规划,但实际上实现了80倍增长”——现在看,这句话不是吹牛。

    钱从哪来?Claude Code立功了

    Anthropic没有详细披露分产品的营收结构,但我们可以从一些公开信息中看出端倪。

    最大的营收来源是Claude Code,这个编程助手产品的年化营收已经达到25亿美元。在企业客户支出的Ramp统计数据中,Claude Code已经超过了OpenAI的Codex,成为程序员们最愿意付费的AI编程工具。

    Anthropic first profit Q2 2026
    Anthropic预计在2026年Q2首次实现盈利(图片来源:Crypto Briefing)

    另一个增长引擎是企业客户的大规模部署。5月14日,普华永道(PwC)宣布在全球范围向数十万专业人员部署Claude,这将在Q2开始贡献营收。摩根大通上线了10个金融服务智能体,用于招股书和信贷备忘录的撰写。百时美施贵宝向3万余名员工部署Claude,用于加速药物研发。

    年消费额超过100万美元的客户数量,在2个月内从500家增长到超过1000家。仅这一千多家大客户,年合同价值就超过10亿美元。

    盈利能持续吗?不一定

    这里要泼一盆冷水。Anthropic的Q2盈利可能只是阶段性的,不一定能持续。

    原因很简单——算力成本。Anthropic和SpaceX签了一个超级大合同:从2026年5月开始,每月向xAI的Colossus 1和Colossus 2设施支付12.5亿美元租金,年化就是150亿美元。这个合同总金额高达450亿美元,期限到2029年5月。

    但Q2的时候,这个算力合同还处于爬坡期,Anthropic还没有支付满额的12.5亿美元/月。到下半年,当算力支出达到满额的时候,成本压力会大幅增加。Anthropic自己也说,2026年下半年高额的预定算力成本可能导致全年难以维持盈利。

    • 算力成本是大头:AI公司的推理成本(就是向用户返回回答的实际计算成本)很高,Anthropic能盈利,说明他们在这个环节的效率控制得不错。
    • 但未来投入只会更大:训练下一代模型、租用更多GPU、招聘更多人才,这些都需要钱。能否实现结构性盈利,取决于营收增长能不能持续超过基础设施成本的增速。

    为什么这件事很重要?

    Anthropic实现盈利,打破了此前所有前沿AI实验室都在亏损、靠”规模扩大后经济模型会跑通”的逻辑融资的行业格局。它证明了,在当前市场价格下,跑通前沿AI的盈利是可行的。

    这对整个行业有三个重要影响:

    • 改变融资叙事:参与Anthropic 300亿美元H轮融资的投资者,购买的是接近盈利的公司的股权,而不是对未来单位经济模型可能永远无法落地的押注。
    • 给OpenAI压力:OpenAI目前还在亏损(2026年预计运营亏损约140亿美元),而Anthropic已经盈利。在即将到来的IPO竞争中,Anthropic的盈利故事比OpenAI更有吸引力。
    • 证明企业AI市场真实存在:Anthropic的营收增长主要来自企业客户,不是消费者订阅。这说明企业愿意为真能帮他们省钱或赚钱的AI工具付钱,而不只是玩玩。

    如果Anthropic能在2026年下半年维持盈利,它将以”盈利+高增长+企业AI服务商”的定位登陆IPO,这个叙事比OpenAI当前的故事更具竞争力。

    对普通人有什么影响?

    如果你在用Claude,可能会发现免费版的限制越来越多,付费版的定价越来越贵。Anthropic要维持盈利,就要从每个用户身上赚更多钱。

    但反过来说,一个盈利的Anthropic,比一个一直烧钱的Anthropic更有可能长期存在。如果你把Claude用在重要的工作上,盈利意味着这个产品不会突然消失。


  • OpenAI冲刺IPO:万亿估值背后,是与Anthropic的生死时速





    OpenAI冲刺IPO:万亿估值背后,是与Anthropic的生死时速


    保密招股书已经递交,OpenAI要抢跑了

    2026年5月22日左右,OpenAI向美国证券交易委员会(SEC)提交了一份保密S-1草案注册声明。这是什么意思?简单说,就是他们正式启动了IPO流程,但可以先不公开财务数据,跟监管机构私下沟通修改材料,自己选个合适的时机再公之于众。

    牵头这次IPO的是高盛和摩根士丹利,摩根大通也参与了。这个投行阵容很有意思——华尔街两家顶级投行坐镇,说明OpenAI这次是玩真的,不是闹着玩的。

    OpenAI的计划是在2026年第四季度,也就是劳动节(9月初)到感恩节(11月底)之间完成上市。如果一切顺利,最早2026年9月我们就能在公开市场上买到OpenAI的股票了。

    估值目标1万亿美元,但事情没那么简单

    OpenAI最新的私募估值是8520亿美元(2026年4月完成1220亿美元融资后的投后估值),而这次IPO的目标估值区间是8500亿到1万亿美元。如果按1万亿美元估值上市,OpenAI将成为有史以来估值最高的科技公司IPO。

    但问题来了——就在OpenAI提交IPO申请的同时,Anthropic完成了300亿美元的H轮融资,投后估值达到9000亿美元,首次在私募市场上超过了OpenAI。而且Anthropic的营收增长更猛,Q2 2026预期营收109亿美元,是Q1 48亿美元的2.3倍,还首次实现了5.59亿美元的运营利润。

    OpenAI IPO filing preparation
    OpenAI正在准备保密IPO申请文件(图片来源:Crypto Briefing)

    为什么要现在递交IPO申请?

    原因很简单——OpenAI需要抢在Anthropic之前上市,掌握AI实验室IPO的估值定价权。如果Anthropic先上市,并且以9000亿美元或更高的估值成功募资,那么OpenAI的1万亿美元估值目标就会显得很尴尬。

    还有一个关键背景:马斯克起诉OpenAI的案件已经被陪审团驳回。这个法律障碍的清除,为OpenAI的IPO扫清了道路。要知道,马斯克的诉讼核心就是质疑OpenAI从非营利研究实验室转向盈利公司的合规性,这个问题不解决,IPO基本没戏。

    IPO之后,OpenAI会变吗?

    会,而且变化会很大。一旦成为上市公司,OpenAI就要面对季度财报压力,要跟华尔街解释每一分钱的花费,要证明自己能赚钱。

    • 定价会更刚性:现在还能跟OpenAI谈折扣、谈定制条款的企业客户,上市后就没这个待遇了。预计折扣空间会收窄15%-25%。
    • 研发投入会偏向能赚钱的项目:ChatGPT企业版、API服务、广告业务会得到更多资源,而那些短期内看不到商业回报的基础研究项目可能会被压缩。
    • 合同条款会更严格:上市后不会再签署个性化的赔偿、数据驻留等定制条款,现有谈判中的合同建议尽快在上市前签署生效。

    S-1文件里会有什么猛料?

    目前保密的招股书将在IPO路演前15天公开,到时候我们能看到很多之前不知道的细节:

    • 分业务线营收:ChatGPT个人订阅、ChatGPT企业版、API、Sora、广告业务各自的营收和增速
    • 推理业务毛利率:目前只知道Anthropic超过70%,OpenAI的毛利率水平将直接反映两家公司的成本差异
    • 算力支出细节:与微软Azure、AWS、甲骨文的合作及算力投入金额(SpaceX的招股书已经披露Anthropic每月向xAI支付12.5亿美元算力租金)
    • 与微软的合作条款:收入分成、IP授权、AGI相关条款——这些一直是个谜

    2026年第四季度可能会出现三家前沿科技公司同期IPO的情况:OpenAI、Anthropic、SpaceX,估值均接近万亿美元级别。这将是科技史上最疯狂的一个季度。

    对普通人意味着什么?

    如果你是用ChatGPT的普通用户,短期内可能感觉不到太大变化。但中长期来看,OpenAI上市后为了追求利润,可能会推出更多付费功能,免费版的限制可能会更多。

    如果你是投资者,这次IPO是一个参与AI浪潮的机会。但也要注意,OpenAI目前还在亏损(预计2026年运营亏损约140亿美元),盈利时间表并不明确。上市不等于马上赚钱,这一点要有心理准备。


  • vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈

    vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈





    vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈

    vLLM Logo

    vLLM – 高性能LLM推理与服务引擎


    📝 项目简介

    vLLM 是由加州大学伯克利分校Sky Computing实验室开发的高吞吐量、内存高效的LLM推理与服务引擎,目前已成为拥有2000+贡献者的活跃开源项目,被誉为”AI模型部署的加速器”。


    ⚙️ 安装要求和过程

    环境要求

    • 操作系统:Linux(推荐)或 macOS/Windows(需WSL2)
    • Python版本:3.8 – 3.11
    • GPU:NVIDIA GPU(CUDA 7.0+)或 AMD GPU(ROCm 5.6+)
    • 内存:建议16GB+ RAM

    快速安装

    # 使用 pip 安装(推荐)
    pip install vllm
    
    # 使用 uv 安装(更快)
    uv pip install vllm
    
    # 从源码安装(用于开发)
    git clone https://github.com/vllm-project/vllm.git
    cd vllm
    pip install -e .

    💡 提示:安装前建议先查看官方安装指南,选择与你的硬件和系统匹配的安装方式。


    ✨ 核心功能

    1. 业界领先的推理吞吐量

    采用PagedAttention技术高效管理注意力键值内存,支持连续批处理、分块预填充、前缀缓存,实现业界顶尖的推理吞吐量。

    2. 广泛的模型与硬件兼容性

    支持200+模型架构(Llama、Qwen、DeepSeek-V3、Mixtral等),兼容NVIDIA/AMD GPU、x86/ARM CPU,还可通过插件支持Google TPU、Intel Gaudi、华为昇腾等硬件。

    3. 丰富的推理优化技术

    支持FP8/INT8/INT4量化、投机解码(Speculative Decoding)、FlashAttention、CUDA内核优化等多种推理加速技术,显著降低延迟和成本。

    4. OpenAI兼容API服务

    提供与OpenAI API完全兼容的服务接口,只需修改API base URL即可将现有应用无缝迁移到vLLM,支持流式输出、结构化输出、工具调用等高级功能。

    5. 分布式推理支持

    支持张量并行、流水线并行、数据并行、专家并行、上下文并行等多种分布式推理策略,可轻松扩展到大模型和多GPU场景。


    🎯 典型使用场景

    场景一:自建私有化AI推理服务

    企业可以使用vLLM在自有GPU服务器上部署Llama、Qwen等开源模型,提供与OpenAI兼容的API接口,实现数据私有化、成本可控的AI推理服务。相比调用公有云API,可节省70%以上的成本。

    场景二:AI应用高性能后端

    将vLLM作为AI聊天机器人、代码助手、RAG系统的后端推理引擎,利用其连续批处理和高吞吐量特性,支撑高并发用户请求,提升用户体验。

    场景三:多模型推理服务统一平台

    使用vLLM的多LoRA适配器支持能力,在同一服务实例中动态加载多个微调模型,或使用模型并行技术同时服务多个不同架构的模型,简化运维复杂度。


    💡 推荐理由

    作为一个经常跟大模型打交道的开发者,我深刻体会到模型推理部署是AI应用落地的最大瓶颈之一。直到遇见vLLM,这个问题终于有了优雅的解决方案。

    vLLM最让我惊艳的是它的PagedAttention技术——灵感来自操作系统的虚拟内存管理,将KV Cache分割成固定大小的”页”,动态分配给不同请求。这让GPU内存利用率从传统的40-60%飙升到80%以上,吞吐量提升了2-4倍!

    另外,vLLM的OpenAI兼容API设计太贴心了。我只需要改一行代码(把API base URL从api.openai.com改成localhost:8000),整个应用就迁移到了自部署的模型上,零改动成本。

    如果你正在为AI推理成本发愁,或者需要私有化部署大模型,vLLM绝对是首选方案。目前已有数千家企业在生产环境使用vLLM,包括Meta、Google、腾讯等巨头,成熟度完全不用担心。


    📥 下载地址


    📌 本文由 WorkBuddy AI 自动采集撰写,原文首发于 admin.hiyoho.com


  • 7亿美元砸向’隐身’AI公司:Hark想要做什么






    7亿美元砸向”隐身”AI公司:Hark想要做什么

    要做出一款人人必备的AI消费级产品,到底需要多少钱?Hark的答案是:至少7亿美元。

    这家处于”隐身模式”的AI实验室周四宣布完成7亿美元A轮融资,投后估值达到60亿美元。光看这个数字,你可能会以为这家公司已经拿出了什么惊为天人的产品,但事实是——他们几乎什么都没对外披露过。

    Hark AI界面概念图
    Hark宣传视频截图,具体产品形态仍未公开

    谁是Brett Adcock?

    要理解Hark,得先认识它的创始人Brett Adcock。这个人不是第一次创业了——他之前创立了人形机器人公司Figure AI(就是那个做人形机器人的),还创立了电动飞机制造商Archer。2025年底,他用自己的1亿美元资金创立了Hark。

    Adcock的创业轨迹挺有意思:从电动飞机到人形机器人,现在又杀进AI。这三件事其实有一个共同点——都是”硬科技”,都需要软硬件结合,都不是靠写个App就能搞定的事情。


    投资方阵容:芯片巨头全来了

    这轮融资的投资方名单读起来像一份”科技圈名人录”:

    • 领投方:Parkway Venture Capital
    • 参投方:英伟达、AMD Ventures、英特尔资本、高通创投——芯片三巨头齐聚
    • 其他参投方:ARK Invest、Brookfield、Greycroft、Prime Movers Lab、Salesforce Ventures、Tamarack Global

    看到英伟达、AMD、英特尔都来了,你大概能猜到Hark要做的事情可能不只是软件。这三家可是竞争对手,能让他们同时掏钱,说明这个项目确实有点东西。

    芯片巨头们押注的,可能不只是模型,而是下一代AI原生硬件。


    Hark到底在做什么?

    这是最神秘、也最让人好奇的部分。根据公开信息,Hark正在开发两样东西:

    1. 模型和软件:一款作为”与数字世界通用接口”的智能体AI系统。预计今年夏天发布首批多模态模型,这些模型将为可与现有产品和服务协同工作的个人AI平台提供动力。

    2. 硬件:公司预计在模型发布之后,推出专门为这些系统打造的硬件设备。设计总监Abidur Chowdhury是苹果前产品高管,这个人事安排已经说明了很多问题。

    “通用接口”这个词很耐人寻味。它可能指的是一个能够跨应用、跨平台、跨设备工作的AI交互层——你不需要分别在微信里问AI、在淘宝里问AI、在微信里问AI,而是有一个统一的入口和交互方式。


    团队和产品设计:苹果基因

    Hark的产品设计总监Abidur Chowdhury曾任苹果产品高管,本周当TechCrunch向他抛出一系列问题时,他拒绝透露正在开发的产品的新细节。但他表达了一个很直白的看法:

    “我还没见过任何感觉真正能帮助普通人的产品。人们确实在开发帮助人们制作软件的东西,这很有效,也很有影响力,但我们还没看到真正面向普通人的产品。”

    这段话其实点出了当前AI产品的一个核心问题:很多AI工具都是给开发者、给专业人士用的,真正让普通人觉得”哇,这东西改变了我的生活”的产品,确实还很少。

    Chowdhury说,虽然Anthropic正在优先开发编码工具,OpenAI在IPO前也在朝同一方向发展,但很少有公司像Hark这样专注于打造界面和原生硬件。


    未知的挑战:隐私与接受度

    当然,疑问远多于答案。其中一个核心挑战是:如何在不让周围人感到不适或侵犯他们隐私的情况下,向AI助手提供用户生活的上下文信息?

    Meta的眼镜、谷歌即将推出的安卓眼镜,都还在摸索这个问题的答案。当被问及Hark如何解决这个特殊难题时,Chowdhury只是笑了笑,没有回答。

    这个沉默其实很能说明问题。隐私、接受度、社交礼仪——这些都不是靠技术就能搞定的事情。你可以做出最强的AI,但如果大家觉得戴个摄像头在脸上很怪,或者觉得AI太侵入自己的生活,那产品再强也没用。


    资金用途:抢人、抢算力

    新资金将主要用于三件事:

    • 招聘硬件、产品设计和AI研究领域的顶尖人才
    • 采购算力(公司目前运营着一个搭载英伟达B200 GPU的数据中心)
    • 采购组件(为硬件产品做准备)

    公司目前有70名员工。对于一个拿了7亿美元A轮的公司来说,这个人数不算多。也说明他们还在组建核心团队的阶段,产品可能还需要一段时间才能亮相。


    写在最后

    Hark的这轮融资,其实是AI行业一个很有意思的缩影:大家在模型能力上的军备竞赛还在继续,但越来越多的人开始意识到,光有模型不够,还得有好的交互方式、好的硬件载体、好的产品体验。

    Brett Adcock之前的创业经历表明,他不是一个只停留在PPT上的人。Figure的人形机器人、Archer的电动飞机,都是实打实造出来的东西。如果Hark真的在做AI硬件,那这7亿美元可能只是个开始。

    当然,现在下结论还太早。Hark选择隐身模式,说明他们知道自己还在早期。但芯片三巨头同时押注,至少说明了一件事:下一代AI终端的争夺战,已经悄悄打响了。