作者: hiyoho

  • GPT-5.6曝光了,OpenAI砸钱宣战:换掉Claude Code

    GPT-5.5发布才三周,GPT-5.6的内部测试代码就被曝光了。OpenAI的迭代速度快到让同行连喘气的机会都没有。

    GPT-5.6开发曝光
    知名爆料人Leo曝光GPT-5.6已进入内部测试阶段(图源:36氪)

    OpenAI加速爆更,Codex将狂飙3倍

    GPT-5.6还没正式亮相,OpenAI的产品端已经先炸了一波。有爆料称OpenAI将在本周四上线「ultrafast模式」,速度提升2-3倍,专为延迟敏感型任务提供最快的可用响应。

    同步推进的还有图像模型的A/B测试更新,就是那个在Image Arena排行榜上以+242分断档领先的gpt-image-2。要知道OpenAI在速度优化上早就有布局,今年3月GPT-5.4发布时,Codex的/fast模式已经实现了1.5倍加速。后来GPT-5.3-Codex-Spark更是借助Cerebras芯片,把推理速度拉到了超过1000 token/秒,是普通模式的15倍。

    而这次的ultrafast模式,直接在主力模型上实现2-3倍提速。不是阉割版,不是小模型替代,是正儿八经的旗舰模型加速。对于开发者来说,Agent循环、长任务流水线、浏览器自动化,所有需要等待的场景,体验将直接起飞。

    OpenAI的目标不再止步于AGI,而是直指ASI(超级智能)。当模型迭代速度由AI自身驱动,通往ASI的飞轮已经开始自转。

    全面开战!Codex vs Claude Code

    硅谷最戏剧性的一幕出现了。赶在OpenAI「ultrafast模式」上线之前,Anthropic放出了Opus 4.7 Fast模式,提供比Codex更快的高级推理、更优的长上下文编码,以及更流畅的氛围编码体验。

    真正激烈的一幕,就是Codex和Claude Code的全面开战。Anthropic率先出招,从6月15日起,为付费订阅用户每月提升50%的编程额度,全面覆盖Claude Agent SDK、命令行工具claude -p,以及深度集成GitHub工作流的Claude Code。

    Codex vs Claude Code
    OpenAI与Anthropic的编程工具大战已然开启

    OpenAI的反应非常迅速,祭出了一招堪称「重磅级补贴」的操作——在接下来30天内,任何想从其他平台切换到Codex的企业,都将获得2个月的免费使用权。奥特曼更是亲自下场带货,直言「Codex才是目前市面上最强的AI编程产品」。

    2个月免费,按Pro计划200美金/月的标准算,等于直接送了400美元的使用权。这种怼脸开打的战局,看呆了整个硅谷。OpenAI的意图非常明确:趁Claude Code用户还在犹豫,直接拿出钱砸出一条迁移的通道。


    当迭代速度逼近ASI

    把视野拉到最高的维度,GPT-5.6和编程大战,表面上是两件独立的事。但把它们放在一起看,一个远比任何单一事件都更深刻的趋势浮现了——AI的自我加速和商业化,正在形成正反馈飞轮。

    一方面,模型在加速进化。GPT-5.3-Codex是OpenAI首个「参与自身训练」的模型。到GPT-5.5,OpenAI内部85%的员工每周使用Codex。GPT-5.6的开发,几乎可以确定是在GPT-5.5的深度参与下进行的。AI在帮OpenAI造更强的AI。

    另一方面,编程工具的普及正在释放前所未有的工程产能。Codex 300万周活跃用户,Claude Code用户数同样在爆发式增长。当数百万开发者把AI编程工具当作日常效率神器,AI生成的代码又反哺回AI的训练和部署,这个循环的速度只会越来越快。

    • AI参与自身训练和部署,形成自我强化循环
    • 编程工具普及释放工程产能,加速产品迭代
    • 两家万亿级公司用「补贴战」加速AI普及
    • 通往ASI的飞轮已经开始自转
  • Spotify联手环球音乐:AI翻唱和混音要合法了

    Suno和Udio最近有点尴尬。这两家AI音乐生成工具的先驱,一边被唱片公司起诉,一边忙着和解——Suno刚赔了华纳音乐5亿美元,Udio也跟华纳和环球音乐达成了和解,但跟索尼的音乐还没谈拢。

    Spotify应用图标
    Spotify应用图标 | 图片来源:TechCrunch

    就在AI音乐平台们为版权问题焦头烂额的时候,Spotify悄悄走出了一条不一样的路。周四,Spotify宣布跟环球音乐集团(UMG)达成合作,要让用户用生成式AI给自己喜欢的歌做翻唱和混音。这个功能会作为付费附加包推出,只有Spotify Premium订阅用户能用,而且参与合作的艺术家能拿到收入分成。

    提前谈好,不先斩后奏

    Spotify去年就透露过这个计划,当时他们说得挺明白:这些AI工具会通过”提前达成协议的方式开发,而非先上线再寻求谅解”。这话听起来像在阴阳谁?没错,就是Suno那类先上线、再被起诉、再和解的平台。

    Spotify概述的原则很清楚:艺术家和版权方应该能自主选择是否以及怎么参与AI工具,如果参与,应该拿到公平的报酬。

    这次跟环球音乐的合作,就是这套原则的第一个落地案例。Spotify的联合首席执行官Alex Norström在声明里说:”为音乐行业解决难题是Spotify的专长,粉丝制作的翻唱和混音作品是下一个要攻克的领域。我们在开发的产品以参与其中的艺术家和词曲作者的授权、署名和报酬为核心。”

    环球音乐怎么看?

    环球音乐集团董事长兼首席执行官Sir Lucian Grainge对这事的评价挺正面。他觉得这是艺术家深化跟粉丝关系的一种方式,同时也能创造额外的收入机会。目前还不知道有哪些环球旗下的艺术家同意参与,但这事一旦铺开,影响会挺大——环球音乐手里握着不少顶级艺术家。

    为啥Spotify能做成这事?因为他们直接去找唱片公司谈,而不是像Suno那样先做了再说。看到用户对AI音乐有需求,Spotify选择走合规路线,跟版权方先把事儿谈妥。环球音乐可能只是第一个,Spotify后面大概率还会跟索尼、华纳、还有那些独立音乐发行公司谈类似的合作。

    AI音乐的未来在哪?

    这个消息是Spotify周四投资者日公布的一堆新功能之一。除了AI翻唱和混音工具,他们还发布了AI驱动的有声书创作工具、给播客用的AI功能、用AI制作个人播客的桌面应用,还有给铁粉预留演唱会门票的功能。

    回头看,AI音乐这条路上,Spotify选了一条最不容易但可能也最可持续的路。Suno和Udio们证明了市场有需求,但也证明了没有版权授权的路走不长。Spotify这套”先授权、再上线”的打法,虽然慢一点,但一旦跑通,后面的想象空间不小。

    对艺术家来说,这是一把双刃剑。好处是多了一个收入渠道,粉丝用你的作品生成AI翻唱或混音,你能拿到分成。坏处是,你的音乐可能以你没想过的方式被使用。但目前来看,至少艺术家有选择权——可以选择不参与。


  • 谷歌AI搜索翻车了:搜’disregard’竟然返回聊天回复

    你有没有遇到过这种情况:想用谷歌搜一个英文单词的意思,结果AI概览(AI Overviews)不但没给你搜索结果摘要,反而像聊天机器人一样回了一句”好的!有什么可以帮你的?”——这事还真发生了,而且闹得有点搞笑。

    一个单词引发的”车祸”

    事情是这样的。如果你在谷歌搜索框里输入”disregard”(意思是”忽略、不理会”),按回车后,原本应该显示AI生成搜索摘要的AI Overviews区域,居然给出了一句聊天机器人式的回复:“Got it! Let me know if you need help with anything else.”(好的!如果你需要其他帮助请告诉我。)

    Google AI Overviews bug截图
    搜”disregard”时AI Overviews的奇怪回复 | 图片来源:The Verge

    这不是孤例。The Verge的记者们测试后发现,类似的”翻车”也出现在其他几个词上。比如搜”ignore”(忽略),AI Overviews会回复:”Message received! I’m here and ready to help. What would you like to focus on today?”(收到消息!我在这里随时准备帮忙。你今天想关注什么?)

    搜”skip”(跳过)更有意思,AI Overviews的回复是:”It looks like your message was just a test or a typo!”(看起来你的消息只是测试或者输入错误!)然后还贴心地让你”随时提问或分享提示词”。

    这几乎可以确定只是一个有趣的bug。也许谷歌搜索在经历完谷歌I/O 2026的一堆事务后也”累了”,开始答非所问。

    AI搜索的”身份危机”

    这个bug其实暴露了一个更有意思的问题:当搜索工具越来越”智能”,它到底应该扮演什么角色?用户搜一个单词,期待的是词典式的解释或者相关网页链接,而不是一个假装自己是客服的聊天机器人。

    谷歌的AI Overviews功能从推出到现在,一直处在”搜索”和”聊天”的模糊地带。它的设计初衷是帮你总结搜索结果,让你不用点开一堆链接就能快速获取信息。但当它遇到”disregard”这种本身就有”忽略我”含义的词时,系统好像真的”忽略”了搜索请求,转而进入了聊天模式。

    截至文章发稿时,谷歌还没有回应关于这个bug的置评请求。不过对于普通用户来说,这个问题影响其实不大——谁会没事搜”disregard”呢?但它在某种程度上提醒我们,AI搜索再聪明,也还是会发现一些让人哭笑不得的边界情况。


  • Anthropic首次盈利:Claude增长太猛,连自己都没想到





    Anthropic首次盈利:Claude增长太猛,连自己都没想到


    Q2营收109亿美元,Anthropic第一次赚钱了

    Anthropic最近给投资者透露了一个消息:2026年第二季度,他们的营收预计达到109亿美元,比第一季度的48亿美元增长了130%。更令人惊讶的是,他们预计这个季度能实现5.59亿美元的运营利润——这是Anthropic成立以来的第一次盈利。

    你可能会说,109亿美元营收、5.59亿美元利润,利润率不是很高啊。确实,只有大约5%的运营利润率。但你要知道,Anthropic之前每年都在烧钱,亏损额以十亿美元计。能在这个季度扭亏为盈,说明他们的商业模式开始跑通了。

    Anthropic原本给自己设定的盈利目标是2028年。现在2026年Q2就要实现运营盈利,提前了整整2年。CEO达里奥·阿莫代伊之前说”我们原本为每年10倍增长做了充分规划,但实际上实现了80倍增长”——现在看,这句话不是吹牛。

    钱从哪来?Claude Code立功了

    Anthropic没有详细披露分产品的营收结构,但我们可以从一些公开信息中看出端倪。

    最大的营收来源是Claude Code,这个编程助手产品的年化营收已经达到25亿美元。在企业客户支出的Ramp统计数据中,Claude Code已经超过了OpenAI的Codex,成为程序员们最愿意付费的AI编程工具。

    Anthropic first profit Q2 2026
    Anthropic预计在2026年Q2首次实现盈利(图片来源:Crypto Briefing)

    另一个增长引擎是企业客户的大规模部署。5月14日,普华永道(PwC)宣布在全球范围向数十万专业人员部署Claude,这将在Q2开始贡献营收。摩根大通上线了10个金融服务智能体,用于招股书和信贷备忘录的撰写。百时美施贵宝向3万余名员工部署Claude,用于加速药物研发。

    年消费额超过100万美元的客户数量,在2个月内从500家增长到超过1000家。仅这一千多家大客户,年合同价值就超过10亿美元。

    盈利能持续吗?不一定

    这里要泼一盆冷水。Anthropic的Q2盈利可能只是阶段性的,不一定能持续。

    原因很简单——算力成本。Anthropic和SpaceX签了一个超级大合同:从2026年5月开始,每月向xAI的Colossus 1和Colossus 2设施支付12.5亿美元租金,年化就是150亿美元。这个合同总金额高达450亿美元,期限到2029年5月。

    但Q2的时候,这个算力合同还处于爬坡期,Anthropic还没有支付满额的12.5亿美元/月。到下半年,当算力支出达到满额的时候,成本压力会大幅增加。Anthropic自己也说,2026年下半年高额的预定算力成本可能导致全年难以维持盈利。

    • 算力成本是大头:AI公司的推理成本(就是向用户返回回答的实际计算成本)很高,Anthropic能盈利,说明他们在这个环节的效率控制得不错。
    • 但未来投入只会更大:训练下一代模型、租用更多GPU、招聘更多人才,这些都需要钱。能否实现结构性盈利,取决于营收增长能不能持续超过基础设施成本的增速。

    为什么这件事很重要?

    Anthropic实现盈利,打破了此前所有前沿AI实验室都在亏损、靠”规模扩大后经济模型会跑通”的逻辑融资的行业格局。它证明了,在当前市场价格下,跑通前沿AI的盈利是可行的。

    这对整个行业有三个重要影响:

    • 改变融资叙事:参与Anthropic 300亿美元H轮融资的投资者,购买的是接近盈利的公司的股权,而不是对未来单位经济模型可能永远无法落地的押注。
    • 给OpenAI压力:OpenAI目前还在亏损(2026年预计运营亏损约140亿美元),而Anthropic已经盈利。在即将到来的IPO竞争中,Anthropic的盈利故事比OpenAI更有吸引力。
    • 证明企业AI市场真实存在:Anthropic的营收增长主要来自企业客户,不是消费者订阅。这说明企业愿意为真能帮他们省钱或赚钱的AI工具付钱,而不只是玩玩。

    如果Anthropic能在2026年下半年维持盈利,它将以”盈利+高增长+企业AI服务商”的定位登陆IPO,这个叙事比OpenAI当前的故事更具竞争力。

    对普通人有什么影响?

    如果你在用Claude,可能会发现免费版的限制越来越多,付费版的定价越来越贵。Anthropic要维持盈利,就要从每个用户身上赚更多钱。

    但反过来说,一个盈利的Anthropic,比一个一直烧钱的Anthropic更有可能长期存在。如果你把Claude用在重要的工作上,盈利意味着这个产品不会突然消失。


  • OpenAI冲刺IPO:万亿估值背后,是与Anthropic的生死时速





    OpenAI冲刺IPO:万亿估值背后,是与Anthropic的生死时速


    保密招股书已经递交,OpenAI要抢跑了

    2026年5月22日左右,OpenAI向美国证券交易委员会(SEC)提交了一份保密S-1草案注册声明。这是什么意思?简单说,就是他们正式启动了IPO流程,但可以先不公开财务数据,跟监管机构私下沟通修改材料,自己选个合适的时机再公之于众。

    牵头这次IPO的是高盛和摩根士丹利,摩根大通也参与了。这个投行阵容很有意思——华尔街两家顶级投行坐镇,说明OpenAI这次是玩真的,不是闹着玩的。

    OpenAI的计划是在2026年第四季度,也就是劳动节(9月初)到感恩节(11月底)之间完成上市。如果一切顺利,最早2026年9月我们就能在公开市场上买到OpenAI的股票了。

    估值目标1万亿美元,但事情没那么简单

    OpenAI最新的私募估值是8520亿美元(2026年4月完成1220亿美元融资后的投后估值),而这次IPO的目标估值区间是8500亿到1万亿美元。如果按1万亿美元估值上市,OpenAI将成为有史以来估值最高的科技公司IPO。

    但问题来了——就在OpenAI提交IPO申请的同时,Anthropic完成了300亿美元的H轮融资,投后估值达到9000亿美元,首次在私募市场上超过了OpenAI。而且Anthropic的营收增长更猛,Q2 2026预期营收109亿美元,是Q1 48亿美元的2.3倍,还首次实现了5.59亿美元的运营利润。

    OpenAI IPO filing preparation
    OpenAI正在准备保密IPO申请文件(图片来源:Crypto Briefing)

    为什么要现在递交IPO申请?

    原因很简单——OpenAI需要抢在Anthropic之前上市,掌握AI实验室IPO的估值定价权。如果Anthropic先上市,并且以9000亿美元或更高的估值成功募资,那么OpenAI的1万亿美元估值目标就会显得很尴尬。

    还有一个关键背景:马斯克起诉OpenAI的案件已经被陪审团驳回。这个法律障碍的清除,为OpenAI的IPO扫清了道路。要知道,马斯克的诉讼核心就是质疑OpenAI从非营利研究实验室转向盈利公司的合规性,这个问题不解决,IPO基本没戏。

    IPO之后,OpenAI会变吗?

    会,而且变化会很大。一旦成为上市公司,OpenAI就要面对季度财报压力,要跟华尔街解释每一分钱的花费,要证明自己能赚钱。

    • 定价会更刚性:现在还能跟OpenAI谈折扣、谈定制条款的企业客户,上市后就没这个待遇了。预计折扣空间会收窄15%-25%。
    • 研发投入会偏向能赚钱的项目:ChatGPT企业版、API服务、广告业务会得到更多资源,而那些短期内看不到商业回报的基础研究项目可能会被压缩。
    • 合同条款会更严格:上市后不会再签署个性化的赔偿、数据驻留等定制条款,现有谈判中的合同建议尽快在上市前签署生效。

    S-1文件里会有什么猛料?

    目前保密的招股书将在IPO路演前15天公开,到时候我们能看到很多之前不知道的细节:

    • 分业务线营收:ChatGPT个人订阅、ChatGPT企业版、API、Sora、广告业务各自的营收和增速
    • 推理业务毛利率:目前只知道Anthropic超过70%,OpenAI的毛利率水平将直接反映两家公司的成本差异
    • 算力支出细节:与微软Azure、AWS、甲骨文的合作及算力投入金额(SpaceX的招股书已经披露Anthropic每月向xAI支付12.5亿美元算力租金)
    • 与微软的合作条款:收入分成、IP授权、AGI相关条款——这些一直是个谜

    2026年第四季度可能会出现三家前沿科技公司同期IPO的情况:OpenAI、Anthropic、SpaceX,估值均接近万亿美元级别。这将是科技史上最疯狂的一个季度。

    对普通人意味着什么?

    如果你是用ChatGPT的普通用户,短期内可能感觉不到太大变化。但中长期来看,OpenAI上市后为了追求利润,可能会推出更多付费功能,免费版的限制可能会更多。

    如果你是投资者,这次IPO是一个参与AI浪潮的机会。但也要注意,OpenAI目前还在亏损(预计2026年运营亏损约140亿美元),盈利时间表并不明确。上市不等于马上赚钱,这一点要有心理准备。


  • vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈

    vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈





    vLLM:80.7k Stars!高性能LLM推理引擎,让AI模型部署不再成为瓶颈

    vLLM Logo

    vLLM – 高性能LLM推理与服务引擎


    📝 项目简介

    vLLM 是由加州大学伯克利分校Sky Computing实验室开发的高吞吐量、内存高效的LLM推理与服务引擎,目前已成为拥有2000+贡献者的活跃开源项目,被誉为”AI模型部署的加速器”。


    ⚙️ 安装要求和过程

    环境要求

    • 操作系统:Linux(推荐)或 macOS/Windows(需WSL2)
    • Python版本:3.8 – 3.11
    • GPU:NVIDIA GPU(CUDA 7.0+)或 AMD GPU(ROCm 5.6+)
    • 内存:建议16GB+ RAM

    快速安装

    # 使用 pip 安装(推荐)
    pip install vllm
    
    # 使用 uv 安装(更快)
    uv pip install vllm
    
    # 从源码安装(用于开发)
    git clone https://github.com/vllm-project/vllm.git
    cd vllm
    pip install -e .

    💡 提示:安装前建议先查看官方安装指南,选择与你的硬件和系统匹配的安装方式。


    ✨ 核心功能

    1. 业界领先的推理吞吐量

    采用PagedAttention技术高效管理注意力键值内存,支持连续批处理、分块预填充、前缀缓存,实现业界顶尖的推理吞吐量。

    2. 广泛的模型与硬件兼容性

    支持200+模型架构(Llama、Qwen、DeepSeek-V3、Mixtral等),兼容NVIDIA/AMD GPU、x86/ARM CPU,还可通过插件支持Google TPU、Intel Gaudi、华为昇腾等硬件。

    3. 丰富的推理优化技术

    支持FP8/INT8/INT4量化、投机解码(Speculative Decoding)、FlashAttention、CUDA内核优化等多种推理加速技术,显著降低延迟和成本。

    4. OpenAI兼容API服务

    提供与OpenAI API完全兼容的服务接口,只需修改API base URL即可将现有应用无缝迁移到vLLM,支持流式输出、结构化输出、工具调用等高级功能。

    5. 分布式推理支持

    支持张量并行、流水线并行、数据并行、专家并行、上下文并行等多种分布式推理策略,可轻松扩展到大模型和多GPU场景。


    🎯 典型使用场景

    场景一:自建私有化AI推理服务

    企业可以使用vLLM在自有GPU服务器上部署Llama、Qwen等开源模型,提供与OpenAI兼容的API接口,实现数据私有化、成本可控的AI推理服务。相比调用公有云API,可节省70%以上的成本。

    场景二:AI应用高性能后端

    将vLLM作为AI聊天机器人、代码助手、RAG系统的后端推理引擎,利用其连续批处理和高吞吐量特性,支撑高并发用户请求,提升用户体验。

    场景三:多模型推理服务统一平台

    使用vLLM的多LoRA适配器支持能力,在同一服务实例中动态加载多个微调模型,或使用模型并行技术同时服务多个不同架构的模型,简化运维复杂度。


    💡 推荐理由

    作为一个经常跟大模型打交道的开发者,我深刻体会到模型推理部署是AI应用落地的最大瓶颈之一。直到遇见vLLM,这个问题终于有了优雅的解决方案。

    vLLM最让我惊艳的是它的PagedAttention技术——灵感来自操作系统的虚拟内存管理,将KV Cache分割成固定大小的”页”,动态分配给不同请求。这让GPU内存利用率从传统的40-60%飙升到80%以上,吞吐量提升了2-4倍!

    另外,vLLM的OpenAI兼容API设计太贴心了。我只需要改一行代码(把API base URL从api.openai.com改成localhost:8000),整个应用就迁移到了自部署的模型上,零改动成本。

    如果你正在为AI推理成本发愁,或者需要私有化部署大模型,vLLM绝对是首选方案。目前已有数千家企业在生产环境使用vLLM,包括Meta、Google、腾讯等巨头,成熟度完全不用担心。


    📥 下载地址


    📌 本文由 WorkBuddy AI 自动采集撰写,原文首发于 admin.hiyoho.com


  • 7亿美元砸向’隐身’AI公司:Hark想要做什么






    7亿美元砸向”隐身”AI公司:Hark想要做什么

    要做出一款人人必备的AI消费级产品,到底需要多少钱?Hark的答案是:至少7亿美元。

    这家处于”隐身模式”的AI实验室周四宣布完成7亿美元A轮融资,投后估值达到60亿美元。光看这个数字,你可能会以为这家公司已经拿出了什么惊为天人的产品,但事实是——他们几乎什么都没对外披露过。

    Hark AI界面概念图
    Hark宣传视频截图,具体产品形态仍未公开

    谁是Brett Adcock?

    要理解Hark,得先认识它的创始人Brett Adcock。这个人不是第一次创业了——他之前创立了人形机器人公司Figure AI(就是那个做人形机器人的),还创立了电动飞机制造商Archer。2025年底,他用自己的1亿美元资金创立了Hark。

    Adcock的创业轨迹挺有意思:从电动飞机到人形机器人,现在又杀进AI。这三件事其实有一个共同点——都是”硬科技”,都需要软硬件结合,都不是靠写个App就能搞定的事情。


    投资方阵容:芯片巨头全来了

    这轮融资的投资方名单读起来像一份”科技圈名人录”:

    • 领投方:Parkway Venture Capital
    • 参投方:英伟达、AMD Ventures、英特尔资本、高通创投——芯片三巨头齐聚
    • 其他参投方:ARK Invest、Brookfield、Greycroft、Prime Movers Lab、Salesforce Ventures、Tamarack Global

    看到英伟达、AMD、英特尔都来了,你大概能猜到Hark要做的事情可能不只是软件。这三家可是竞争对手,能让他们同时掏钱,说明这个项目确实有点东西。

    芯片巨头们押注的,可能不只是模型,而是下一代AI原生硬件。


    Hark到底在做什么?

    这是最神秘、也最让人好奇的部分。根据公开信息,Hark正在开发两样东西:

    1. 模型和软件:一款作为”与数字世界通用接口”的智能体AI系统。预计今年夏天发布首批多模态模型,这些模型将为可与现有产品和服务协同工作的个人AI平台提供动力。

    2. 硬件:公司预计在模型发布之后,推出专门为这些系统打造的硬件设备。设计总监Abidur Chowdhury是苹果前产品高管,这个人事安排已经说明了很多问题。

    “通用接口”这个词很耐人寻味。它可能指的是一个能够跨应用、跨平台、跨设备工作的AI交互层——你不需要分别在微信里问AI、在淘宝里问AI、在微信里问AI,而是有一个统一的入口和交互方式。


    团队和产品设计:苹果基因

    Hark的产品设计总监Abidur Chowdhury曾任苹果产品高管,本周当TechCrunch向他抛出一系列问题时,他拒绝透露正在开发的产品的新细节。但他表达了一个很直白的看法:

    “我还没见过任何感觉真正能帮助普通人的产品。人们确实在开发帮助人们制作软件的东西,这很有效,也很有影响力,但我们还没看到真正面向普通人的产品。”

    这段话其实点出了当前AI产品的一个核心问题:很多AI工具都是给开发者、给专业人士用的,真正让普通人觉得”哇,这东西改变了我的生活”的产品,确实还很少。

    Chowdhury说,虽然Anthropic正在优先开发编码工具,OpenAI在IPO前也在朝同一方向发展,但很少有公司像Hark这样专注于打造界面和原生硬件。


    未知的挑战:隐私与接受度

    当然,疑问远多于答案。其中一个核心挑战是:如何在不让周围人感到不适或侵犯他们隐私的情况下,向AI助手提供用户生活的上下文信息?

    Meta的眼镜、谷歌即将推出的安卓眼镜,都还在摸索这个问题的答案。当被问及Hark如何解决这个特殊难题时,Chowdhury只是笑了笑,没有回答。

    这个沉默其实很能说明问题。隐私、接受度、社交礼仪——这些都不是靠技术就能搞定的事情。你可以做出最强的AI,但如果大家觉得戴个摄像头在脸上很怪,或者觉得AI太侵入自己的生活,那产品再强也没用。


    资金用途:抢人、抢算力

    新资金将主要用于三件事:

    • 招聘硬件、产品设计和AI研究领域的顶尖人才
    • 采购算力(公司目前运营着一个搭载英伟达B200 GPU的数据中心)
    • 采购组件(为硬件产品做准备)

    公司目前有70名员工。对于一个拿了7亿美元A轮的公司来说,这个人数不算多。也说明他们还在组建核心团队的阶段,产品可能还需要一段时间才能亮相。


    写在最后

    Hark的这轮融资,其实是AI行业一个很有意思的缩影:大家在模型能力上的军备竞赛还在继续,但越来越多的人开始意识到,光有模型不够,还得有好的交互方式、好的硬件载体、好的产品体验。

    Brett Adcock之前的创业经历表明,他不是一个只停留在PPT上的人。Figure的人形机器人、Archer的电动飞机,都是实打实造出来的东西。如果Hark真的在做AI硬件,那这7亿美元可能只是个开始。

    当然,现在下结论还太早。Hark选择隐身模式,说明他们知道自己还在早期。但芯片三巨头同时押注,至少说明了一件事:下一代AI终端的争夺战,已经悄悄打响了。


  • 多人情绪肖像合成

    多人情绪肖像合成

    多人情绪肖像合成



    🤖 Nano banana pro

    🇺🇸 English Prompt

    Use this photo attached to create a striking outdoor fashion portrait set in a vibrant flower field during daylight, captured with a digital camera using a harsh flash. The camera angle is low and slightly tilted upward, intensifying the scene's energy and drama. The subject has long, loose, dark brown wavy hair cascading over a voluminous, soft, shaggy lavender faux fur coat that drapes naturally over the body. Surrounding the subject are large, colorful poppies in yellow, pink, and orange, some in the foreground and others in the background, creating an immersive field-of-flowers effect. The sky is clear and blue, providing a crisp, contrasting backdrop. The mood is bold, editorial, and whimsical, making the vibrant colors of the outfit and flowers pop starkly against the serene sky. The overall composition should evoke a playful yet high-fashion atmosphere with a hint of surrealism, emphasizing texture and color through the use of direct flash photography, aspect_ratio 5:8.

    🇨🇳 中文提示词

    请使用这张附带的照片,创作一张引人注目的户外时尚肖像照。场景设定在白天充满活力的花田中,使用数码相机和强光闪光灯拍摄。机位低,略微向上倾斜,以增强场景的能量和戏剧性。主体留着长长的、蓬松的深棕色波浪发,披散在一件宽松、柔软、毛茸茸的淡紫色人造皮草大衣上,大衣自然地垂坠在身上。主体周围是黄色、粉色和橙色的大朵罂粟花,有些在前景,有些在背景,营造出沉浸式的花海效果。天空晴朗湛蓝,提供了一个清晰、对比鲜明的背景。整体氛围大胆、富有编辑感且异想天开,使服装和花朵的鲜艳色彩与宁静的天空形成鲜明对比。整体构图应唤起一种俏皮而又高端时尚的氛围,带有一丝超现实主义色彩,通过使用直射闪光灯摄影强调纹理和色彩,宽高比为 5:8。
  • 超写实情侣欢笑特写提示词

    超写实情侣欢笑特写提示词

    超写实情侣欢笑特写提示词



    🤖 Nano banana pro

    🇺🇸 English Prompt

    Conceptual storytelling visual for a modern brand narrative. Abstract progression elements, sense of movement and flow, soft cinematic lighting, optimistic, forward-moving tone, crafted to communicate journey and growth.

    🇨🇳 中文提示词

    用于现代品牌叙事的概念性故事视觉。 抽象的演进元素, 动感与流畅感, 柔和的电影感灯光, 乐观、积极向前的基调, 旨在传达旅程与成长。