标签: 大模型

  • Google I/O 2026本周开幕,但真正值钱的不是Gemini 4.0

    模型版本只是开胃菜

    按约3到4个月一轮的节奏算,2月刚发布Gemini 3.1 Pro,这次I/O更可能看到Gemini 3.2或3.5。Gemini 4.0不是没可能,只是概率没那么高。对投资者来说,模型叫什么名字不重要,重要的是Gemini能不能进更多核心服务,比如Gmail、Maps,还有Genie 3、Gemma 4这些周边生态能不能跟上。

    Google还可能更新Gemini Health、Android XR智能眼镜,把旅行场景塞进Google Canvas。这些产品要是能拧成一个统一入口,Gemini就不再是聊天或者生成工具,而是变成操作层——这个定位比模型版本号值钱多了。

    过去两年,Google陆续推出Gemini 1.0 Pro、1.5 Pro、2.0 Flash、2.5 Pro、3 Pro和3.1 Pro。截至2026年一季度末,Google产品套件订阅用户达到3.5亿。

    AI搜索的算盘

    搜索依然是Google估值的核心。这次I/O最值得盯的是AI-O、AI-M和Gemini搜索体验怎么融合,还有Chrome在这个框架里站什么位置。Google管理层在一季度业绩会上提到,来自这些新入口的更长、更复杂查询,提供了更多基于意图的数据——这句话直接关系广告价值。

    传统上约20%的查询具备商业属性。如果AI搜索能让更多查询变成可识别、可匹配、可投放的商业意图,搜索广告的天花板就会往上走。对广告主来说,问题不在于AI功能是否先进,而在于同样CPA下能不能带来更多转化。

    一季度Google查询量创历史新高。2026年4月,Google全球搜索份额90.0%,环比增加10个基点。Chrome全球份额68.0%,环比增加130个基点。这些入口如果继续扩大,AI搜索的商业化基础会更稳。

    Gemini发布节奏相关配图
    Gemini模型迭代节奏(图源:网络)

    广告变现才是重头戏

    如果Google I/O回答”AI能力到哪里”,5月21日的Google Marketing Live就回答”AI怎么赚钱”。目前AI驱动的广告活动已经占搜索广告支出的30%以上,覆盖了AI Max、P-Max、Demand Generation等工具。

    AI Max将是GML上最关键的观察点。这个工具在2026年4月结束beta测试,计划在9月完全取代Dynamic Search Ads。早期结果显示,AI Max完整功能组合带来14%更多转化;通过更宽的搜索词匹配,在相近CPA下带来7%更多转化。

    • AI Max for Shopping、Search Campaigns for Travel等垂直优化工具正在推进
    • Ads Advisor提供代理式辅助,Smart Bidding Exploration在搜索活动中带来约27%更多转化
    • Campaign Total Budgets减少约66%的手动预算调整

    代理式购物瞄准交易闭环

    Google的购物业务正在从商品发现入口,向更深的交易链路延伸。UCP、Direct Offers、Agentic Checkout,以及Google Shopping和Chrome中的代理式购物体验,将是I/O和GML共同的观察点。这个变化不是简单增加购物按钮,而是减少从搜索、比较、选择到结账之间的摩擦。

    Google近期把合作伙伴扩展到若干大型电商公司,还有Meta、Microsoft、Stripe,之后又加入Klarna和Affirm。支付、分期、结账和广告投放如果被串联起来,Google Shopping的商业角色会更重。Chrome在全球68%的份额(美国50%)如果嵌入代理式购物和个性化推荐,Google将在搜索之外获得新的商业入口。

    云业务正在改写估值逻辑

    Alphabet过去的估值核心是搜索广告,但Google Cloud正在成为更重要的变量。一季度Google Cloud收入200.28亿美元,同比增长63.4%;backlog达到4623亿美元,环比接近翻倍,同比增长400.3%。同期token消耗环比增长60%。

    Google Cloud收入有望从2025年的587.05亿美元增至2026年的945.29亿美元,再到2027年的1465.21亿美元和2028年的2095.25亿美元。云业务在总收入中的占比预计从2025年的14.6%,升至2026年的19.5%,并在2028年达到30.6%。

    利润率同样在改善。Google Cloud 2025年经营利润率23.7%,2026年预计升至33.8%。这意味着云业务不再只是高增长板块,而是开始对Alphabet整体利润率形成支撑。I/O上,Gemini Code Assist、Google AI Studio中的”vibe coding”工具,以及TPU销售策略也值得关注。


  • 微软与OpenAI终止独家云协议——AI版图重新划分

    2026年4月27日,微软和OpenAI悄无声息地改写了过去几年的AI版图。双方 restructured 了合作关系——Azure不再是OpenAI的独家云供应商,同时去掉了与AGI(通用人工智能)相关的条款。这件事的意义,比表面上看起来要大得多。

    独家协议为什么说不续就不续了?

    其实不难理解。OpenAI想要更大的基础设施选择权,而微软也不想被绑定在一个越来越贵的合作协议上。去掉AGI条款更是关键——之前的说法是,一旦OpenAI实现AGI,某些合作协议会自动失效,现在这条被拿掉了,双方的绑定关系变得更加”务实”。

    Azure仍将是OpenAI的”主要”云伙伴,但不再是”独家”。这给了OpenAI和其他云厂商(比如Google Cloud、AWS)合作的空间,也意味着微软在AI基础设施上的垄断地位被打破了。

    AI阵营正在重新划分

    这件发生的同一时间段,另一个信号同样值得关注:Google计划向Anthropic投资最高400亿美元。也就是说,微软-OpenAI这对老搭档的关系在松动,而Google-Anthropic这对”反OpenAI阵营”却在加深绑定。

    站在OpenAI的角度,摆脱Azure独家限制之后,可以更加灵活地选择基础设施伙伴,这对训练和部署下一代模型至关重要。站在微软的角度,Azure依然是OpenAI的优先选择,但不再有排他性保护,这也意味着微软需要在AI服务上靠实力竞争,而不是靠合同。


    这对普通开发者和企业意味着什么

    短期内可能感受不明显,但中长期来看,OpenAI的API和模型部署会有更多基础设施选项,成本和延迟都有可能优化。而对整个行业来说,AI基础设施的”阵营化”正在减弱,更加市场化的竞争对所有人都有好处。

  • AI五月风暴:模型军备竞赛、Agent落地与电力危机

    四月刚过,AI圈没有丝毫放缓的迹象。GPT-5.5-Cyber开始推送,Claude Mythos在约50家合作伙伴中只有受限预览,DeepSeek V4带着开源权重和低价策略强势入场——模型竞赛正在进入一个新阶段:不再比谁的模型最通用,而是比谁更专业、更便宜、更能落地。

    专业模型来了,通用模型不香了?

    GPT-5.5-Cyber的发布释放了一个清晰信号:厂商开始针对特定高价值场景推出专业模型,而不再只靠一个通用大模型打天下。网络安全、漏洞发现、防御分析——这些场景正在成为前沿AI厂商的必争之地。

    Claude Mythos的神秘感更是拉满。现在只有约50家机构能用到它,传言说它在高级推理、编码和漏洞发现上有巨大飞跃。Anthropic这种”限量供应”的打法,摆明了要把下一个阶段的AI变成门槛更高、管控更严的游戏。

    DeepSeek V4则是另一条路——它把前沿级别的性能直接拉到低价+开源的组合上。对企业来说,成本改变 adoption 曲线,成本改变哪些应用场景变得经济可行。

    Agent从概念到落地,2026是分水岭

    Gartner有个预测被反复引用:到2026年底,40%的企业应用将嵌入AI Agent,而2025年这个数字还不到5%。先不管这个预测准不准,它反映出的行业共识是真实的——Agent正在从demo走向生产环境。

    开发者社区里的讨论也在变。大家不再争论Agent有没有用,而是开始认真讨论:用什么框架?CrewAI还是LangGraph?MCP协议怎么接入?怎么防止Agent乱跑把事情搞砸?这些是非常实操的问题,说明这个品类真的在进入落地阶段。


    电力危机:6500亿美元也买不来的瓶颈

    最有意思的矛盾来了:大型科技公司今年在AI基础设施上的资本开支合计超过6500亿美元,但约一半的美国数据中心项目却因为电力基础设施短缺而被推迟或取消。钱不是问题,电才是问题。

    AI数据中心 campus 动辄需要几百兆瓦的电力容量,变电站、变压器、电网接入——这些现实世界的物理约束,比发布一个大模型要慢得多。Gartner还预测,到2027年,电力短缺将限制约40%的AI数据中心。这意味着,AI的下一个瓶颈不是芯片,不是模型,而是现实世界的部署能力。

  • DeepSeek V4 发布:1.6万亿参数开源,百万上下文成标配,价格比 GPT-4 便宜70倍

    DeepSeek 这次真的把天花板给顶破了。4月24日,他们正式发布 DeepSeek-V4 预览版,同步全量开源,上线 Hugging Face 和 ModelScope,附带580G 开源权重。消息一出,资本市场立刻有了反应——SMIC 和华虹半导体在香港双双大涨。

    1M 上下文,标配了

    V4 系列最直观的升级是上下文窗口直接拉到100万 token,所有官方服务默认配置。用大白话讲,就是你扔给它一部长篇小说让它分析,它一口气全吞下去,中间不需要你翻页或者重新喂。

    但这还不是最厉害的。他们搞了一套 Token-wise 压缩加上 DSA 稀疏注意力机制,推理时的 FLOPs 直接降低了73%,KV 缓存大小减少了90%。说白了,不是粗暴地堆算力,而是在工程层面做了精细优化。

    DeepSeek V4
    DeepSeek-V4 发布,百万上下文成标配

    两个版本怎么选?

    V4-Pro 总参数1.6万亿,激活参数490亿,性能定位是”开源最强、接近顶级闭源”。内部员工体验说比 Sonnet 4.5 强,交付质量接近 Opus 4.6 的非思考模式。API 价格做到了 GPT-4 的七十分之一,每百万 token 输入0.14美元、输出3.48美元。

    V4-Flash 走的是经济路线,2840亿总参数、130亿激活参数,API 价格低到离谱——输入每百万 token 只要3美分,比 Claude Opus 4.7 便宜99%以上。简单任务用它完全够用,高难度任务建议开思考模式、强度拉满。

    国产算力这波秀肌肉

    更值得关注的是 DeepSeek V4 对国产算力的适配程度。官方数据显示,在华为昇腾 950PR 上推理速度比 V3 版本快了整整35倍,能耗还降低了40%。他们还适配了寒武纪芯片,MXFP4 低精度格式降低了对 NVIDIA CUDA 生态的依赖。

    这意味着什么?DeepSeek 不再只是”开源模型里很强”,而是真正在国产硬件上跑出了能打的体验。对国内企业来说,部署成本和使用门槛都在大幅下降。开源协议用的是 MIT,完全开放商用。


    DeepSeek V4 把百万上下文、开源和低成本三个事情同时做到位了。开源社区等了这么久的东西,终于来了。

  • GPT-6来了:代号”土豆”,5万亿参数,OpenAI这次玩真的

    北京时间4月14日,OpenAI正式发布GPT-6,内部代号”Spud(土豆)”。这个号称”AGI最后一公里”的模型,耗时18个月研发、烧了超过20亿美元、用了约10万张H100 GPU——光是听听这些数字,你就知道这次不是小打小闹的版本迭代。

    GPT-6正式发布
    OpenAI CEO山姆·奥特曼在GPT-6发布会上(来源:凤凰网)

    一颗”土豆”的技术野心

    代号”Spud”来自OpenAI研究团队的一个内部梗——越是貌不惊人的东西,内里越丰富。奥特曼在发布会上称GPT-6为”划时代产品”,是AGI的最后一公里。这话听着大,但看看参数:5到6万亿参数,200万Token上下文窗口,相当于能一口气读完两部完整的《三体》三部曲。

    最让我感兴趣的是Symphony架构。这个架构把文本、图像、音频、视频统一在同一个向量空间进行联合编码,实现了真正意义上的原生多模态。以前AI看到图片再理解文字,中间总有一道门槛,现在感知和推理直接打通了。

    GPT-6首次采用”Symphony双系统推理”:System-1负责快速响应(日常对话、内容生成),System-2负责深度推导(逻辑校验、代码审查)。两个系统切换由模型自主判断,无需手动干预。

    性能暴涨40%,但价格没涨

    具体数据方面,GPT-6在数学推理准确率上提升47%,代码生成与调试提升42%,三大核心任务(代码、推理、智能体)综合性能较GPT-5.4提升超过40%。这个跃升幅度,在AI模型发展史上算是比较猛的一代。

    更有意思的是定价策略。API输入每百万Token 2.5美元,输出12美元,跟GPT-5.4基本持平。OpenAI内部戏称这是”神话级智能,Sonnet级定价”。你想想,性能提升了40%,价格却没涨——这明显是在跟Anthropic和Google打价格战。

    • 5-6万亿参数(MoE架构,激活约10%)
    • 200万Token上下文(约150万中文字)
    • 综合性能提升40%(vs GPT-5.4)
    • API定价持平(2.5美元/百万Token输入)

    产品整合:从三个工具到一个超级应用

    OpenAI这次还干了一件事:把ChatGPT(对话)、Codex(编程)、Atlas(浏览器)整合为统一的桌面级超级应用。这意味着你以后不用在不同AI工具之间跳来跳去了,一个界面搞定所有事情。

    市场反应也很直接。发布当天,软银股价上涨4.2%,微软Azure上涨1.8%。而Anthropic和Google选择了沉默,估计正在连夜评估GPT-6的技术细节。


    这颗”土豆”能不能打,市场会在接下来的几个月里给出答案。但有一点可以确定:AI能力军备赛,仍在加速。一个新的标杆,刚刚被确立。

  • 一周翻倍、一个月涨四倍:中国大模型五强格局彻底成型

    一周翻倍、一个月涨四倍:中国大模型五强格局彻底成型

    2026年5月第二周,中国AI圈上演了一场史无前例的资本狂欢。

    短短七天,月之暗面、阶跃星辰、DeepSeek三家未上市公司密集传出巨额融资,而已登陆港股的智谱和MiniMax则以堪称暴力的股价涨幅刷新认知。中国大模型赛道的”五强”格局,就此彻底成型:DeepSeek、智谱、MiniMax、月之暗面、阶跃星辰

    大模型五强

    先说数字。DeepSeek这轮融资敲定后,估值已经到了3000到3500亿元区间,换算成美元大概300到515亿。智谱更猛——5月13日单日暴涨36.9%,市值直接冲破5000亿港元大关,一举超越了许多人印象中”很赚钱”的传统科技公司。做个对比你就懂了:科大讯飞去年营收271亿、净利润8.39亿,市值大概1187亿。而智谱呢?2025年营收才7.24亿元,市值却是讯飞的四倍多。这估值逻辑,你说它疯狂也好、泡沫也罢,但市场就是这么定价的。

    投资方结构根本性变化

    有意思的是,这轮行情的投资方结构发生了根本性变化。过去中国AI企业背后的金主主要是美元VC和互联网巨头,现在呢?月之暗面引入了中国移动,阶跃星辰拉来了华勤、龙旗、豪威这些产业链资本,连DeepSeek的潜在领投方都传出了国家集成电路产业投资基金的身影。用一位一级市场业内人士的话说:“大模型不再只是一个商业故事,它正在上升为国家科技竞争力的关键筹码。”

    从”美元+互联网”到”国资+产业链”,投资方的迭代本身就折射出大模型产业地位的变化。

    DeepSeek的故事尤其值得细说。创始人梁文锋在这轮融资里直接掏出200亿元,真金白银砸进去。他个人持股从之前的1%一路提升到34%,加上间接持股合计控制约84.29%股权。这种创始人自己押重注的操作,在行业内并不多见。有分析师评价说,DeepSeek的融资标志着中国AI产业进入新阶段——过去我们靠商业模式创新,现在开始在基础技术层面与美国巨头正面竞争。

    估值暴涨不等于躺赢

    当然,估值暴涨不等于躺赢。行业里有个说法:“百模大战”正在收敛为”千亿竞赛”——谁能率先证明自己的商业化能力,谁才能真正活下去。目前各家都在跑马圈地,但收入规模跟估值比起来还差得远。智谱的MaaS API平台ARR是17亿元,同比提升60倍,听着吓人,但距离支撑5000亿港元市值需要的营收体量,还早着呢。

    总之,这轮大模型资本盛宴,你怎么看?是”对下一代通用智能平台的信仰定价”,还是泡沫堆积前的最后疯狂?时间会给出答案。


  • 21天估值翻4.5倍!DeepSeek首轮融资500亿,梁文锋自己掏200亿押注

    DeepSeek融apital这事,我盯了快一周,今天终于可以好好聊聊了。简单说:DeepSeek正在搞史上最大规模的首轮融资,目标500亿元人民币,而创始人梁文锋自己就要掏200亿——占整轮的40%。

    21天,估值从100亿美元涨到450亿美元

    你可能还记得,DeepSeek V4是4月24日才发布的。那时候公司估值大概100亿美元出头。结果不到一个月,现在已经飙到450亿美元了——21天翻了4.5倍。这增速,放在整个AI行业都是炸裂的存在。

    梁文锋个人出资200亿,这什么概念?相当于他把大半身家押在了DeepSeek身上。这种创始人all-in的架势,投资人不心动才怪。

    国家队也下场了

    据The Information透露,国家集成电路产业投资基金(大基金)正在洽谈领投。这是正儿八经的国家队信号——说明DeepSeek的战略价值已经被顶层认可。毕竟,能在大模型领域跟OpenAI、Anthropic正面掰手腕的中国公司,屈指可数。

    腾讯、阿里也都在谈。虽然阿里之前有消息说没谈拢,但DeepSeek现在估值涨成这样,筹码只会越来越厚——想进的抓紧,想谈条件的恐怕要吃亏了。

    V4.1定档6月,多模态终于来了

    技术层面,DeepSeek V4.1已经官宣6月发布。相比V4,这次最大的升级是两点:

    • 多模态能力:V4.1将首次支持同时处理图像和音频,真正意义上的”全能选手”
    • MCP协议深度支持:对标Anthropic的Model Context Protocol,企业接入更方便

    还有个细节:DeepSeek准备把发布节奏”加速到接近行业常规速度”。之前V4憋了大半年才出,现在6月就要跟V4.1,说实话有点卷——但对用户来说是好事,迭代越快,能力越强。

    理想主义者要变成重资产公司了

    DeepSeek之前给我的印象一直是”技术宅”——埋头搞研究,不怎么谈商业化。但这次融资说明,梁文锋想明白了:光靠理想留不住人。

    文章提到好几位明星研究员已经离职跳槽:郭达雅、王炳宣、魏浩然……融资的钱,很大一部分就是要拿来”买人心”的——用期权定价,让核心人才真正绑在船上。

    算力、人才、产品、渠道……DeepSeek正在从一家”实验室”变成一家真正的”重资产AI公司”。这条路很难,但我倒挺看好——毕竟技术再牛,也得有人买单才能持续下去。


  • GPT-5.5卖180刀,DeepSeek只收0.28刀:大模型价格战到底卷到了什么程度

    最近看到一个数据,差点把咖啡喷出来——GPT-5.5每百万token要180美元,而DeepSeek V4 Flash只要0.279美元。算一下,价差645倍。这什么概念?相当于一辆法拉利和一辆五菱宏光的差距。但问题在于,五菱宏光在日常通勤里可能比法拉利好使。

    有人做了个实验,把同一个任务分别扔给GPT-5.5、Claude Opus、Gemini 3.1 Flash和DeepSeek V4 Flash跑了一遍。结果挺有意思:写复杂代码、做多步推理、处理那种模糊需求的时候,GPT-5.5确实强得离谱,能读懂你话里的潜台词。但换成整理文档、写周报、翻译邮件、分析数据这些日常活儿,四个模型基本看不出区别。

    2024年同等水平的推理成本是20美元/百万token,两年后的今天降到了0.07美元。两年内下降了280倍。

    五强模型,差距越来越小

    现在市面上的头部模型——GPT-5.4、Claude Opus 4.6、Gemini 3.1 Pro、DeepSeek V3和Kimi K2.5,在Elo评分榜上的差距已经压缩到只有2.7%。说实话,这个差距在大多数使用场景下根本感知不到。以前大家比的是”谁更聪明”,现在核心问题变成了:这个模型适合我的场景吗?预算用得起吗?跟我现有的工具链能接上吗?

    训练成本的变化也挺魔幻的。DeepSeek V3的训练成本是557万美元,而GPT-4的训练据说超过1亿美元。差了将近16倍。但输出质量呢?日常使用几乎拉不开差距。我觉得DeepSeek赢的不只是价格,更是证明了”够用”这个概念的商业价值。

    选模型的新逻辑

    现在业内的共识已经变了——不是找最强的,是找最对口的。通用任务和自动化工作流用GPT-5.4,长文档处理和高质量代码用Claude Opus 4.6,多模态理解用Gemini 3.1 Pro,成本敏感和中文场景用DeepSeek V3,超长上下文需求就上Kimi K2.5。

    • Claude的百万级上下文不是噱头,整个代码库扔进去分析是真的好用
    • DeepSeek V4 Flash的100万token窗口能塞进大型代码仓库
    • GLM-4.7在华为昇腾上训练,直接把推理价格压到行业最低的0.11美元
    • Claude Token消耗比GPT高出55%,长文档场景要掂量钱包

    老话说得好,你不会开法拉利去买菜,同样也没必要用GPT-5.5写周报。对普通团队来说,以前调一次API几块钱,做大项目光模型成本就上百万。现在一个中小团队花几千块能用一年。这种成本的崩塌速度,说实话超出了我去年最乐观的预期。


    2026年的AI行业像极了2010年的智能手机市场。还在拼参数的公司可能被讲性价比的公司打得找不着北。真正的战场已经不是模型本身了,而是Agent、工具链和工作流整合。模型只是基础设施,谁能让AI真正干活,谁才是赢家。