标签: AI技术

  • 谷歌I/O 2026的尴尬:AI智能体这么强,为啥普通人无感?

    谷歌I/O 2026的尴尬:AI智能体这么强,为啥普通人无感?

    谷歌I/O 2026大会上周落幕,整场活动最值得期待的新功能之一,是面向消费者的AI智能体(AI agents)。但说实在的,这也是整场发布会里最让人摸不着头脑的部分。

    信息智能体(information agents)正式亮相,这是老牌Google Alerts服务的AI升级版。这类智能体可以7×24小时在后台运行,帮你跟进感兴趣的主题——市场趋势、价格追踪、恶劣天气预警之类的。

    还有Gemini Spark,这是一款”个人”AI智能体,可以集成Gmail、Google Docs、Google Workspace等谷歌产品,帮你管理数字生活。谷歌说,这个助手可以处理日常任务:整理通讯邮件主题、清点家庭库存、记录需要补货的物品,或者帮你规划和协调朋友的组团旅行。

    “谷歌在演示中举了一个非常偏向工程师思维的例子:你可以用它组织社区街区派对——好像这种事除了群聊或者发几封邮件之外还需要什么管理一样。”

    功能很多,但得先掏钱

    上面说的这些产品,很多还没正式上线,至少不会立刻向大众开放。目前谷歌的目标用户是重度用户:也就是订阅了每月100美元的Google Ultra计划的”AI信仰者”。

    美国地区的Google Pro和Ultra订阅用户今年夏天就可以用上信息智能体,Spark很快会向Ultra订阅用户开放。Halo(追踪Spark通知的功能)将在”今年晚些时候”推送给安卓用户。Daily Brief(每日简报)正在向美国的Ultra、Pro和Plus订阅用户逐步推出。

    Google I/O 2026 AI Agents
    Google I/O 2026 展示的AI智能体功能(图片来源:TechCrunch)

    这么多功能陆续上线之后,我们可以用AI智能体的入口会多到让人不知道从哪里开始用。但这得先付费。

    普通消费者为什么不买账?

    谷歌在这场活动上没能挽回口碑。每个演讲者上台间隙都在闪一些傻乎乎的AI生成图像,还放了一段很尬的AI生成动画,里面有类似肉桂Toast Crunch的会说话的Tensor芯片。

    在安卓眼镜的演示中,谷歌展示了这款设备(后续会支持拍照功能)如何用AI把用户拍的照片改成别的内容。演示内容是,演讲者拍了一张台下观众的照片,然后修改成头顶有一艘飞艇的样子,再发给自己的安卓手表。

    好吧,是有点意思,但为了给数据中心建新的输电线,有人家的房子要被强制征收拆掉,这值得吗?


    人们真正需要的是什么?

    人们需要的可不止是这些花里胡哨的小功能,才会接受如此剧烈的社会变化。

    往年的谷歌I/O会推出新的消费电子设备,比如Pixel手机、Nest Hub,还有新的安卓功能,比如2018年让所有人惊叹的餐厅、沙龙预订服务。那些技术都被定位成解决日常生活小麻烦的工具。

    现在这家科技巨头展示的是新模型(不过还没准备好发布的Gemini Pro 3.5没亮相),还有开发者平台,却基本忘了自己做的这些东西是给谁用的:普通老百姓。他们不想去记这东西叫Gemini还是Spark、Halo还是信息智能体,也不想知道要去哪里才能用上。

    这些人有真正想要解决的问题:他们要付账单、交房租,要加油、买groceries,还要在AI招聘系统因为一点技术细节就拒掉简历的环境里找工作。他们要平衡充满压力的生活,而最近科技的发展反而成了负担。

    AI智能体的真正价值是什么?

    如果谷歌真的调研过消费者的真实想法,就会发现,AI智能体其实可以降低屏幕使用时间。也就是说,不用花时间调研、整理、追踪信息和新闻,智能体可以接管这些日常任务,让用户离线去好好过现实生活。

    这个信息其实会引起消费者的共鸣,尤其是年轻人,他们现在正在追捧怀旧复古技术,通过”老人式”的爱好和手工艺来缓解压力,还正在通过放弃约会软件、参加线下活动来重新发现现实社交的力量。

    简单来说,谷歌没能成功推销AI智能体有多酷,原因有两个:一是没有演示智能体能为普通用户解决什么问题,二是把这些工具放在付费墙后面,限制了触达范围。

  • 发改委出手了:人工智能立法研究启动,”人工智能+”正在加速落地

    发改委出手了:人工智能立法研究启动,”人工智能+”正在加速落地

    5月22日,国家发改委召开5月份新闻发布会,新闻发言人李超透露了一个重要信号:官方正在开展人工智能立法研究,要强化安全治理能力建设,让人工智能朝着有益、安全、公平的方向发展。

    这话听起来有点宏观,但实际影响会很深远。想想看,AI现在到处都是,从手机里的语音助手到医院的辅助诊断,从自动驾驶到金融风控,到处都在用。但规则跟不上技术,就会出问题——数据泄露、算法歧视、AI生成内容乱七八糟……所以立法不是”要不要”的问题,是”什么时候出台、怎么制定才合理”的问题。

    “这也是中国人工智能发展的一大突出特征——在保持快速发展的同时,确保自主可控、向善发展、行稳致远,让全体人民共享人工智能发展成果。”

    “人工智能+”已经在路上

    发布会上还介绍了”人工智能+”行动的进展。目前官方已经出台了制造、医疗、能源等十多个行业的专项政策文件,政策体系正在不断完善。

    更有意思的是,国家发改委会同有关部门在制造、医疗、交通等领域布局了一批国家人工智能应用中试基地。这些基地是干嘛的?简单说,就是让AI技术从实验室走到试验场、从工厂走到市场的”中转站”,提供算力、数据、场景这些关键要素支撑,大幅缩短转化周期、降低落地成本。

    国家发改委新闻发布会
    国家发改委5月份新闻发布会现场(图片来源:中国新闻网)

    已经有落地案例了

    举个具体的例子:医疗领域的中试基地孵化出了一款叫“蚂蚁阿福”的AI应用,可以提供就医陪诊、辅助诊断、家医随访等智能服务。这款应用已经在十多个省市的医疗机构落地,让更多居民享受到智能、优质、便利的健康体验。

    你看,AI不是只在大厂实验室里跑模型、刷榜单,它真的在走进医院、走进社区,开始影响普通人的生活。这才是”人工智能+”想要达到的效果。


    接下来还要做什么?

    李超还透露了两个重要计划:

    • 出台配套文件:官方正在谋划出台加快”人工智能+”落地的配套文件,进一步加大要素保障。
    • 打造标杆应用:持续推动央国企开放高价值应用场景,面向各行业领域和各地方打造人工智能标杆应用,加快引导人工智能融入生产、经营、管理等各方面各环节。

    这意味着什么?意味着接下来会有更多实际的应用场景被开放出来,AI技术会更快地渗透到各行各业。对于做AI应用的创业公司来说,这是个好消息——有政策支持、有场景开放、有要素保障,落地会更容易。

    回过头看,人工智能立法研究、”人工智能+”行动、应用中试基地、配套文件……这一套组合拳打下来,中国AI的发展路径已经很清晰了:既要快,也要稳;既要创新,也要安全;既要技术突破,也要普惠共享。

  • 2026年5月大模型排行:Kimi K2.6登顶,国产模型强势崛起

    排行榜出来了

    CSDN和稀土掘金刚发布了2026年5月AI大模型全景报告,结果有点意思。国产模型Kimi K2.6(月之暗面)以94.3分登顶榜首,DeepSeek V4以93.8分紧随其后。OpenAI的GPT-5排在第三,得分93.5。

    前六名依次是:Kimi K2.6(94.3分)、DeepSeek V4(93.8分)、OpenAI GPT-5(93.5分)、Claude 4 Opus(93.1分)、Google Gemini Ultra 3.0(92.7分)、阿里Qwen3-235B(92.4分)。

    国产模型在数学推理、长上下文和中文处理方面优势明显。Kimi K2.5在TaxEval v2税务评估准确率达到74.2%,超越OpenAI和Anthropic旗下所有模型。

    竞争激烈到什么程度

    排名靠前的15个模型在各项基准测试中性能差距只有3个百分点。这意味着什么?意思是大家的水平越来越接近,哪怕一分两分的差距都可能改变排名。

    中国AI日均词元调用量已经突破140万亿,较年初增长超过40%。这个数据说明,国产大模型的规模化落地正在加速。不只是榜单上的分数好看,实际使用量也在快速增长。

    一个新的趋势:端侧AI

    榜单之外,还有一个值得关注的趋势:端侧AI。小米刚开源了MiMo-V2.5,支持手机端本地运行百亿参数大模型。这会降低对云端算力的依赖,也让AI在手机上的应用变得更实用。

    端侧AI的好处很明显:响应速度快、不需要一直联网、隐私数据不需要传到云端。当然,手机上的算力有限,能跑的模型大小和复杂度也受限。这是一个平衡。


    这意味着什么

    国产大模型在这份榜单上的表现,说明一个事实:在AI这个赛道上,中国公司已经不是追赶者,而是竞争者,甚至在某些领域已经是领跑者。

    数学推理、长上下文处理、中文理解,这些原本是GPT和Claude的强项,现在国产模型不仅追上来了,还在某些 Benchmark 上超过了他们。这对国内做AI应用的开发者来说,是个好消息——你可以选择一个更懂中文、更便宜、性能还不错的国产模型。

    至于端侧AI的兴起,可能会改变未来AI应用的形态。不是所有任务都需要传到云端处理,手机本地能搞定的,就本地搞定。这会催生一批新的应用场景和硬件创新。

  • 谷歌I/O 2026:Gemini Spark来了,AI智能体时代正式开启

    谷歌的AI大跃进

    昨天凌晨1点,谷歌I/O大会又在加州山景城拉开帷幕。CEO皮查伊开场就甩出一组数字:过去12个月,谷歌处理的Token量达到3.2千万亿个,同比增长7倍。Gemini应用的月活用户突破9亿。这些数字背后,是谷歌把AI智能体全面塞进所有产品的野心。

    这场发布会的核心逻辑很清楚:Gemini不再只是那个你打开对话框才能聊天的助手,它要变成一个持续运行、跨应用执行任务的智能代理。你可以理解为,谷歌想把AI从”工具”升级为”同事”。

    Gemini将从一个对话助手进化为持续运行的全天候AI代理,可以替你追踪信息、生成内容、调用工具,甚至直接完成下单和操作流程。

    几个值得关注的发布

    AskYouTube功能会在YouTube里加入聊天机器人式交互界面。你可以通过自然语言找到符合搜索意图的视频片段,直接跳转过去。这个功能预计今年夏天在美国扩大推广范围。

    DocsLive功能支持用户通过语音与Google Docs互动,不需要输入提示词。演示中,Gemini可以自动提取演讲要点,还能从Google Drive和Gmail调取信息,辅助用户高效创建和编辑文档。

    Gemini 3.5 Flash模型是这次发布的重头戏。谷歌称其生成速度是其他前沿模型的四倍,专为复杂任务和现实开发场景设计。在AI代理和编码工具领域,这个速度优势会让它更有竞争力。

    Gemini Spark是基于Gemini 3.5运行的全天候个人AI助手。即使你的电脑关闭,它也可以继续工作。这是谷歌对OpenAI的ChatGPT和Anthropic的Claude直接发起的挑战。


    硬件和基础设施布局

    谷歌在AI基础设施上的投入也在加速。2026年,谷歌AI相关支出预计达到1800亿-1900亿美元。最新一代TPU(张量处理单元)TPU8分为两类,分别用于大规模AI训练和快速响应用户请求。

    还有AndroidXR智能眼镜,谷歌预告会与GentleMonster、WarbyParker和三星合作推出这款硬件。分为语音交互和信息投影两种形式,用户可以通过眼镜完成导航、下单等操作。

    这意味着什么

    谷歌这次发布会传递的信号很明确:AI智能体不再是概念,而是要全面落地到每个人的日常工作中。从搜索、文档、视频到购物,谷歌想把AI渗透进你数字生活的每一个角落。

    对于用户来说,这意味着更便捷的体验。但对于谷歌的竞争对手来说,这意味着更激烈的竞争。OpenAI、Anthropic、Meta,大家都在抢这个”AI智能体”的入口。2026年的AI赛道,会比去年更精彩。

  • 阿里千问Qwen3.7-Max发布:从对话模型到工程代理的关键一跃

    三个月连更三次,千问在争什么

    5月20日,阿里巴巴在杭州发布了千问新一代旗舰模型Qwen3.7-Max。如果只看标题,这像是一次常规的模型迭代——但从最近三个月的节奏来看,千问正在以不太常见的速度连续推出新版本。

    3月20日,Qwen3.5-Max-Preview亮相;4月20日,Qwen3.6-Max-Preview发布;5月20日,Qwen3.7-Max正式登场。三个月、三个大版本,这个节奏即便放在全球大模型厂商里也不算慢。背后反映的是一个明确判断:模型竞争的重点正在转移,从”谁的参数大、榜单分数高”,转向”模型能不能真正进入工作流,稳定执行复杂任务”。

    Agent能力成了新的主战场

    Qwen3.7-Max延续了千问3.x系列的一个明显转向:强化Agent能力。这不是一个抽象的方向——具体体现在编程、长上下文、工具调用、跨框架兼容和长程任务处理这几个维度上。

    在第三方机构Arena的全球大模型盲测总榜中,Qwen3.7-Max超过了Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini等国际顶尖模型接近,位列国产模型第一。

    Qwen3.7-Max在MCP-Atlas、MCP-Mark、SkillBench等现实能力测试中表现优异,超过GLM-5.1、Kimi-K2.6等模型,创下国产模型新高。

    编程智能体能力的提升尤为明显。在SWE-Pro、SWE-Multilingual、Terminal Bench 2.0-Terminus等测评中,Qwen3.7-Max较Qwen3.6-Plus有大幅提升,并超过了DeepSeek-v4-pro-Max、Claude-Opus4.6、Kimi-K2.6等模型。

    一次完整的工程任务:35小时、上千次工具调用

    阿里内部做了一个挺有说服力的测试:把千问3.7放到一个陌生的新硬件平台上(平头哥真武M890),任务是优化一个生产级注意力内核算子。

    模型没有现成的性能profile,没有硬件文档,也没有示例实现——只拿到了任务描述、SGLang+Triton参考代码和评测脚本。在这个环境中,千问3.7连续工作了35小时,执行了数百次内核评估和上千次工具调用,完成了代码编写、编译、性能分析和迭代优化的完整流程。最终,内核速度在参考实现基础上提升了一个数量级。

    更值得注意的细节是:在连续运行30小时后,模型仍然能发现新的优化空间。这说明它并不是在完成一次性的指令执行,而是在较长时间内保持了目标感,能根据反馈调整路径。

    这个测试背后的意图很明显:当大模型具备较强的推理、编程和工具调用能力,并被放入真实的工程环境中,它有机会承担过去需要专业工程师长时间推进的复杂任务。

    阿里的真正优势:场景和基础设施

    千问的特殊性在于,阿里拥有大量真实的业务和基础设施场景。芯片(平头哥)、云(阿里云)、数据库、电商、物流、支付、出行、本地生活——这些都可以为Agent提供复杂的任务环境。场景既能测试模型,也能为模型迭代提供反馈数据。

    2026年3月,阿里成立了Alibaba Token Hub(ATH),由吴泳铭直接负责。这个调整的背景是:企业使用AI的方式正在变化。过去买的是算力时长,现在消耗的是Token——模型处理任务、生成内容、调用工具、完成工作的能力,最终都会体现在Token使用上。

    公开信息显示,阿里AI模型和应用服务ARR已突破80亿元,百炼MaaS开发平台客户数截至2026年3月同比增长8倍,覆盖电商、金融、制造等多个行业。

    在这个布局里,Qwen3.7-Max不只是一次模型能力更新,而是阿里把”芯—云—模型—推理”这条链路进一步打通的一个节点。模型越强、推理越快、成本越低,Agent越容易在企业中规模化应用——这个逻辑决定了下一阶段大模型竞争的重心。


  • Spotify牵手环球音乐,AI翻唱正式「合法化」了

    AI翻唱、AI remix这件事,之前一直游走在灰色地带。Suno和Udio这些工具虽然火,但一路被告——华纳、环球、索尼轮番上阵,版权官司打得没完。

    Spotify决定不走这条路。2026年5月21日,它宣布跟环球音乐集团(UMG)达成授权协议,要让用户用生成式AI合法地翻唱和混音自己喜欢的歌。

    “Solving hard problems for music is what Spotify does, and fan-made covers and remixes are next. What we’re building is grounded in consent, credit, and compensation for the artists and songwriters that take part.”

    —— Alex Norström, Spotify co-CEO

    这个功能会以付费插件的形式推出,仅限Spotify Premium订阅用户使用。更关键的是,参与计划的艺人能从中获得分成——这是Suno和Udio一直没做到的。

    Spotify去年就透露过这个方向,当时的表述就很耐人寻味——说要做”先谈授权、再上线”的产品,而不是”先上线、再求原谅”。这话明显是在暗戳戳地戳Suno。


    Suno们的官司还没打完

    Suno和Udio算是AI音乐生成赛道的先行者,但法律地位一直很尴尬。2024年,各大唱片公司集体起诉,Suno后来跟华纳以5亿美元和解,Udio也跟华纳、环球达成了和解——但Suno至今还在被环球和索尼追着告。

    消费者确实有这个需求,这点从Suno的用户量就能看出来。但需求归需求,版权归版权,之前的AI音乐工具基本是在没有授权的情况下”先干了再说”。Spotify的做法相反——先拿到牌再上桌。

    艺人的态度是关键

    环球音乐集团董事长兼CEO Sir Lucian Grainge对这件事的态度很积极,说这能让艺人与粉丝的关系更深,还能创造额外的收入机会。但目前还不清楚有哪些环球旗下的艺人已经同意参与。

    这也合情合理——让粉丝用AI翻唱自己的歌,对有些艺人是加分项,对另一些可能就不是。所以这个功能必须是”选择加入”的,不能强制。

    不只是AI翻唱

    这次AI翻唱功能的官宣,是Spotify投资者日(Investor Day)一系列公告中的一项。同一天,Spotify还发布了几个其他AI功能:

    • 基于ElevenLabs的AI有声书创作工具
    • 面向播客的AI问答和摘要生成功能
    • 桌面端AI个人播客生成应用
    • 为头部粉丝预留演唱会门票的功能

    看得出来,Spotify在AI这个方向上是真的打算全面铺开,不只是试试水。但跟其他公司不一样的是,它选择先搞定版权方,再推产品。


    这件事对整个AI音乐行业来说,可能是个转折点。之前大家都在摸着石头过河,现在Spotify把”先授权、再上线”这个模板立起来了。接下来,看索尼和其他平台跟不跟吧。

  • 谷歌这次把AI科学家搞出来了,7个智能体自己跑实验,还登了Nature

    谷歌DeepMind最近搞了个大动作,直接把AI科研助手的水平拉到了《Nature》正刊的级别——他们推出的Co-Scientist系统,现在已经能自主完成从提假设到验证的全科研流程,而且在肝纤维化、衰老这些之前啃不动的生命科学领域,已经拿出了实打实的成果。

    谷歌Co-Scientist系统登顶Nature
    谷歌DeepMind Co-Scientist系统架构图(来源:新浪财经)

    Co-Scientist的核心是基于Gemini大模型的7大智能体体系,模拟完整科学研究循环(提出假设→质疑修正→迭代完善)。

    7大智能体怎么分工?

    这7个智能体各有分工,合起来就是一个不用休息的科研团队:生成代理负责基于已有文献提初步假说;邻近性代理给这些假说分类,避免漏了潜在的研究路径;反思代理相当于虚拟同行评审,专门挑假设的错误;排名代理让假说两两比拼,筛选出最有前景的方向;进化代理对排名靠前的假说迭代优化;元评审代理汇总结果,生成完整研究方案给人类科学家审阅;监督代理是总指挥,拆解大目标为具体任务,协调所有智能体并行工作。

    为了保证质量,系统还借鉴了AlphaGo的博弈逻辑,让假说之间“打擂台”,把大部分算力投入假设验证环节——反复核对假设和现有文献、数据的一致性,确保假设有依据、逻辑通顺、能实验验证。另外还能调用ChEMBL、UniProt这些专业数据库,以及AlphaFold等第三方AI工具,吸收多维度的知识。

    已经在哪些领域出了成果?

    目前这个系统优先在生命科学领域落地,已经搞出了不少突破:肝纤维化治疗方向,筛选出的老药新用候选药物,在实验室里能抑制91%的纤维化相关反应,效果比传统方案好得多;渐冻症(ALS)研究,整合了几十年的领域文献,提出了全新的RNA疗法思路,现在已经在推动跨实验室联合攻关;细胞衰老逆转研究,精准锁定了关键基因靶点,把原本需要数月的数据处理工作压缩到了数天完成。

    其他方向也有进展:肝病机制研究,解析出了不同药物疗效差异的核心原因,结论经实验100%验证;新发传染病研究,能快速锁定致病关键氨基酸,把原本需要数年的实验周期缩短到数周;衰老生物学研究,提出了应激反应的全新假设,已经经过多家实验室独立验证。

    AI for Science成巨头新战场

    谷歌这次突破之后,AI for Science赛道已经成了科技巨头和初创公司都在抢的香饽饽:2025年12月FutureHouse推出AI科学家Robin,首轮融资就拿了7000万美元;英伟达和礼来宣布未来5年共同投资10亿美元,共建全球首个AI药物共创实验室;科学智能公司Lila Sciences刚完成3.5亿美元A轮融资,估值就超过了13亿美元。

    以前搞科研靠天才的灵感和运气,现在有了这套系统,相当于给每个科学家配了一个24小时不睡觉、能读完所有文献、还能自己设计实验的助手——科研效率的革命,真的要来了。


  • Figma悄悄上线AI设计助手,直接在画布里帮你改图

    设计工具Figma最近做了一个挺有意思的更新:在画布里直接内置了一个AI设计助手(Figma Agent)。不用切工具,不用把设计文件导出到别的AI工具里处理,直接在Figma里面就能让AI帮你生成、修改设计,还能自动化那些重复性的琐碎工作。

    Figma AI Agent
    Figma官方发布的AI Agent功能示意图

    不是外接插件,是原生内置的助手

    这次Figma做的AI助手,不是那种通过API外接的第三方工具,而是直接嵌进画布和左侧工具栏的原生功能。你选中一个图层,直接就能给它发提示词,让它帮你改颜色、调布局、换组件,甚至从零生成一整个设计模块。

    Figma这个AI助手最聪明的地方在于:它知道你的设计系统。你用的是什么组件库、什么设计令牌(design tokens)、什么规范,它都清楚,生成出来的东西不会和你的设计体系”两张皮”。

    三个实用场景

    场景1:快速探索设计方向
    以前你要做一个新页面,得自己先画几个草图,或者让AI在外围工具里生成几个方案,再手动搬进Figma。现在直接在设计文件里让AI出3个不同风格的方案,你觉得哪个方向对了,再手动细化。效率高了不少,而且不会因为”AI生成感”太重而显得廉价。

    场景2:批量处理重复工作
    设计系统维护、全局替换组件、调整所有页面的间距、批量把占位图换成真实图片……这些琐碎但耗时的工作,现在可以让AI助手批量搞定。比如你突然决定把所有按钮改成圆角风格,以前要一页一页手动改,现在一句话的事。

    场景3:处理设计反馈
    设计评审后,反馈通常散落在评论里,要一条条看、一条条改。AI助手可以直接读取文件里的所有评论,帮你归纳主题、整理成可执行的修改清单,甚至能模拟不同角色(比如”假设你是产品总监,你会怎么挑这个设计的刺”)给你压力测试。

    目前还在Beta阶段

    这个功能目前还在逐步开放Beta测试,Professional、Organization、Enterprise套餐的Full seat用户优先,Collab和Dev seat用户也能在草稿里用。Beta期间不消耗AI积分,正式上线后就开始计费了。

    想体验的话可以去Figma官网加入等待列表,不过中选率不知道有多高。从Figma这次的动作来看,设计工具的AI化已经从”能不能生成图”进化到”能不能融入工作流”的阶段了。下一步,可能就是AI直接帮你做完整的Design Review了。


  • 英伟达Q1财报炸场:数据中心营收飙涨92%,AI芯片需求太疯狂

    英伟达刚交出的2027财年第一季度成绩单,数字夸张到有点不真实。整体营收816亿美元,其中数据中心营收就占了752亿美元,同比增长92%。这个涨幅意味着什么?简单说,全球AI数据中心对英伟达芯片的需求,已经到了一种近乎疯狂的状态。

    AI数据中心的”军备竞赛”远没结束

    英伟达这份财报的核心驱动力,就是AI数据中心芯片。从ChatGPT引爆大模型浪潮到现在,三年过去了,算力需求不仅没降温,反而越烧越旺。微软、谷歌、Meta、亚马逊这些巨头,每季度在AI基础设施上的投入都是上百亿美元,而英伟达的H100、H200就是这场”军备竞赛”里最抢手的武器。

    752亿美元,这是英伟达一个季度数据中心业务的营收。去年同期这个数字是391亿美元。一年时间翻了近一倍,这种增长速度在半导体历史上是极为罕见的。

    Vera Rubin芯片如期推进,Q3亮相

    财报会议上,英伟达确认了下一代Vera Rubin AI芯片的进展:”按计划将在今年下半年推出,从第三季度开始。”这款在CES 2026上亮相的新架构芯片,被认为是H200的继任者,性能会有大幅提升。对于等待算力的AI公司来说,这是一个重要信号。

    不过英伟达也不是全线飘红。受内存短缺和价格上涨影响,PC端销量有所下滑。这个细节提醒我们,半导体供应链的脆弱性依然存在,内存短缺可能会成为下一个制约因素。

    AI泡沫论?数字说话

    关于AI是否存在泡沫的争论一直没停过。但英伟达的财报给了一个很硬的答案:只要大模型的训练和投资还在加速,对算力的需求就不会停。即便有些AI创业公司可能会倒下,但那些真正在训练大模型的巨头们,还在疯狂采购芯片。

    这份财报也间接说明,AI行业目前还处于”堆算力”的阶段。哪天英伟达的增速放缓了,那可能才是AI泡沫真的要破的时候。现在看,至少还得等一阵子。


  • 谷歌Gemini要进Siri了,苹果的AI牌终于亮出来

    苹果和谷歌这两个老对手,在AI这件事上居然握手了。2026年4月,谷歌云CEO Thomas Kurian在Google Cloud Next大会上亲口确认:谷歌正在作为苹果的首选云供应商,合作开发基于Gemini技术的下一代苹果基础模型,用来驱动未来的Apple Intelligence功能,包括那个大家都等了很久的新版Siri。

    每年10亿美元,苹果买了个什么样的Gemini

    2026年1月,苹果和谷歌签了一份多年协议,苹果每年支付大约10亿美元,授权使用1.2万亿参数的定制Gemini模型来支撑苹果自己的基础模型。这个价格不便宜,但苹果看重的是Gemini的多模态能力和谷歌在AI基础设施上的积累。

    隐私规则没变——Apple Intelligence仍然在设备端或者苹果自己的私有云上运行,不会把用户数据送到谷歌的服务器去。苹果在这件事上很谨慎,引入Gemini的能力,但数据流自己掌控,相当于用谷歌的”大脑”,但”记忆”和”执行”还是苹果自己的地盘。

    谷歌云CEO Thomas Kurian在大会上说得很直接:Gemini将驱动新一代Siri,带来更个性化的AI助手体验。预计2026年内上线。

    新版Siri到底变了什么

    WWDC 2026定于6月8日至12日在Apple Park举行,主题演讲在北京时间6月9日凌晨1点。苹果已经罕见地在3月就预告会带来”AI新进展”,外界普遍预期这届WWDC是苹果近年来战略意义最重大的一次。

    新版Siri最大的变化是从”系统附件”变成了一款真正的独立App。以前Siri是依附在系统界面里的,现在用户可以像打开ChatGPT那样,随时随地一键开启Siri聊天界面。支持文字和语音两种交互方式,还能直接上传文件——这个在以前的Siri上是不可想象的。

    对话记录的管理也更像一款正经的AI助手了:你可以选择类似ChatGPT的单次对话视图,也可以切换到类似iMessage的聊天列表视图,方便回溯和延续之前的对话线程。隐私设置里还可以自主决定聊天记录的存活周期——30天、一年或者永久保留,数据生命周期完全由用户自己掌控。

    苹果的AI时间表

    按照目前的节奏:2026年春季的iOS 26.4会先上线Gemini支撑的Siri上下文感知能力;9月iPhone 18发布时,推出支持多轮对话、复杂任务完成的全对话式Siri;6月8日的WWDC上,应该会展示iOS 27里相关的功能预览。

    这个项目曾经延期了整整两年。苹果在AI上的节奏确实比竞争对手慢了一拍,但一旦决定押注,投入的资源也不小。每年10亿美元给谷歌,再加上自己的私有云基础设施,苹果显然是把AI助手这件事当成了下一个十年的核心战场。

    6月9日凌晨1点,库克主题演讲见分晓。