博客

  • OpenAI推理模型推翻80年数学猜想,AI首次自主解决核心数学难题

    本周四,OpenAI官方宣布一条让人瞠目结舌的消息:他们的一个通用推理模型,自主推翻了数学家保罗·埃尔德什(Paul Erdős)1946年提出的”单位距离猜想”。这道题困扰了数学界整整80年,现在被AI给破了。

    一个折腾了数学家80年的问题

    这道题的表述简单到让人怀疑是不是看错了:在平面上放n个点,最多有多少对点之间的距离恰好等于1?数学家把这个数记为u(n)。

    直觉告诉我们,把点排成正方形网格大概是最优解。事实上,此前人类找到的最好构造——缩放后的正方形网格——能得到大约C·n·log n个单位距离对(C是常数)。埃尔德什本人也倾向于认为正方形网格就是最优解,还为此设立了现金奖励。

    但OpenAI的模型用一记响亮的耳光证明:人类和埃尔德什,似乎都想错了。

    AI是怎么做到的

    传统思路是用”高斯整数”(形如a+bi的数,a、b为整数)在平面上构筑网格,利用它的代数对称性来构造单位距离。但AI敏锐地察觉到,高斯整数提供的对称性还不够”压榨”出更多的单位距离对。

    它的核心原创想法是:放弃高斯整数,改用代数数论中更庞大、更复杂的”代数数域扩张”来构造——这玩意儿能搭出对称性更高级、更丰富的数域结构,从而在几何空间里创造出远超以往的单位长度差。

    为了证明这种理想中的复杂数域不仅存在、而且坍缩出来的点集确实满足条件,AI甚至直接搬出了代数数论的底层重武器:无限类域塔(infinite class field towers)和Golod-Shafarevich理论。

    AI数学证明示意图
    OpenAI推理模型证明过程示意图(图片来源:36氪)

    数学家们的反应

    菲尔兹奖得主蒂莫西·高尔斯(Tim Gowers)的评价很直接:这是”AI数学的一个里程碑”,如果这是人写的论文,他会毫不犹豫建议顶刊接收。

    著名数论学家Arul Shankar也说,现在的AI模型已经不只是人类数学家的助手了——它们能够提出原创而巧妙的想法,并把想法完整推进到最终成果。

    OpenAI科学家、AI德扑提出者Noam Brown补充了一个关键信息:实现这一突破的是一个通用大语言模型,它不是专门针对这个问题、甚至不是专门针对数学问题设计的,也不是一个协助工具。


    经外部数学家改进后,AI构造的指数c可以达到0.014。这意味着对于无穷多个n值,我们可以构造出至少n·log^0.014(n)个单位距离对的n点配置——比人类此前的最优解更强。

    这次突破的意义远不止解决一个具体的数学猜想。它表明通用大模型已经具备了跨领域融合知识、维持复杂逻辑链条、产出经得起专家严格审视的成果的能力。这些能力在生物学、物理学、材料科学、工程学和医学等领域同样具有实用价值。

  • Anthropic即将迎来首个盈利季度,营收翻倍至109亿美元

    《华尔街日报》放出一条消息:Anthropic告诉投资人,今年第二季度营收会比第一季度翻倍以上,冲到约109亿美元,而且——这是头一回——要实现运营盈利了。

    这个数字如果兑现,Anthropic相对于头号对手OpenAI的处境会好不少。不过《华尔街日报》也补了一刀:因为接下来有一大笔算力开支要付,Anthropic今年未必能全程保持盈利。

    Anthropic Claude AI
    Anthropic的Claude聊天机器人(图源:Ludovic MARIN / AFP / Getty Images)

    这数据是哪来的

    这些财务数据是Anthropic在一轮融资过程中透露给投资人的。融资嘛,总得拿点漂亮数字出来让人看——营收翻倍、首次盈利,这俩放一块确实够有说服力的。

    过去这一年,Anthropic涨势挺猛。越来越多的专业人士表示更偏好用Claude,而不是其他家的聊天机器人。公司也在努力拓宽客户群,比如给小企业主推新服务,给律师事务所搞新工具。

    有趣的是,Anthropic盈利的消息传出来的同一天,正好也爆出了OpenAI可能很快就要交IPO申请的新闻。

    算力账单是座大山

    营收翻倍听起来很爽,但Anthropic的算力成本也是真烧钱。训练大模型、跑推理、维护服务,每一笔都是天文数字。这就是为什么《华尔街日报》说它”可能没法全年保持盈利”——钱赚到了,但花得也狠。

    这其实是整个AI行业的共同难题。模型越训越大,用户越来越多,算力需求就跟着滚雪球。Anthropic这次能实现单季度盈利,已经是个不小的事情,至于能不能稳住,得看接下来的成本控制做得怎么样。


    跟OpenAI的对比

    Anthropic盈利的消息,跟OpenAI的IPO传闻同一天出来,这时间点卡得够巧的。两家公司一直在明争暗斗:Anthropic主打”更安全、更靠谱”,OpenAI主打”更强大、更通用”。

    如果Anthropic真的在二季度实现盈利,这在AI独角兽里算是相当靠前的。毕竟大多数AI公司现在还在疯烧钱的阶段,能赚到钱的没几家。这也会给即将IPO的OpenAI一点压力——投资人肯定会拿俩家的财务数据来回比。

    Anthropic拒绝对此事发表进一步评论。也正常,融资还没关,话说多了容易出岔子。

  • Spotify联手环球音乐,AI翻唱正式合法化

    Spotify最近干了一件挺有意思的事——跟环球音乐集团(UMG)签了协议,要让用户用AI翻唱和混音自己喜欢的歌。这不是那种游走在法律灰色地带的玩法,而是正儿八经拿到了版权方授权的。

    这个功能会以付费插件的形式上线,只有Spotify Premium订阅用户才能用。参与的艺人还能从AI生成音乐的收入里分一杯羹——这算是给音乐人们吃了颗定心丸。

    Spotify app on phone screen
    手机屏幕上显示的Spotify图标(图源:Jakub Porzycki/NurPhoto / Getty Images)

    明摆着在怼谁

    Spotify去年就透露过这个计划,当时特意强调了一句话:”通过事先协议来实现,而不是先做了再求原谅。”这话说的,明眼人都能看出来是在怼谁——就是Suno和Udio那帮人。

    Suno和Udio确实是AI音乐生成领域的先行者,但他们起步的时候根本没搞定版权问题。结果可想而知,三大唱片公司直接把状子甩了过去。去年11月,Suno跟华纳音乐集团达成了5亿美元的和解——这钱够多的。

    环球音乐和索尼音乐还在告Suno,Udio虽然已经跟华纳和环球和解了,但跟索尼的官司还没打完。

    Spotify的玩法不一样

    消费者显然想要这种功能,Spotify干脆直接去找版权方谈。规则很明确:艺人和版权方自己决定参不参与,参与的话怎么分钱,都由他们说了算。

    Spotify联合CEO亚历克斯·诺斯特伦说:”解决音乐领域的难题是Spotify的拿手好戏,AI翻唱和混音是下一个目标。我们正在打造的东西,根基是征得同意、署名权和补偿机制,参与的艺人和词曲作者都能获益。”

    环球音乐集团董事长兼CEO卢西恩·格兰奇也挺买账,说这能让艺人和粉丝的关系更深,还能多赚一份钱。目前还不知道有哪些环球旗下的艺人愿意参与,估计得等功能正式上线才能见分晓。


    不只是AI翻唱

    这笔交易是Spotify投资者日当天公布的一揽子消息之一。同一天还发布了好几个AI相关的新功能:

    • 基于ElevenLabs的AI有声书创作工具
    • 播客的AI问答和摘要生成功能
    • 用AI生成个人播客的桌面端应用
    • 为头部粉丝保留演唱会门票

    环球音乐只是第一个,Spotify大概率还会跟更多唱片公司签类似的协议。毕竟索尼和华纳那边也有不少艺人,粉丝的AI翻唱需求同样旺盛。

    这件事最大的意义在于:AI生成音乐终于有了一条合法、合规、各方都能分到钱的路径。之前Suno和Udio搞得沸沸扬扬,归根结底就是没解决版权问题。Spotify这次把规则定好了,后续其他平台估计也会跟着学。

  • Anthropic收购Stainless背后:AI工具链的锁定战略

    5月18日,Anthropic 宣布收购 SDK 生成工具 Stainless,行业消息称成交额超过2.8亿欧元,约合22.18亿元人民币。这笔收购看起来是一桩普通的 AI 基础设施并购,但如果你知道 Stainless 在 AI 开发工具链里的位置,就会明白 Anthropic 在做什么。

    Anthropic收购Stainless
    Anthropic 收购 Stainless 报道(来源:IT之家/新浪科技)

    Stainless 是做什么的

    简单来说,Stainless 做的事情很”基础设施”:它自动把 API 规范转换成 TypeScript、Python、Go、Java 等多语言的 SDK(软件开发工具包)。对于一个提供 API 的公司来说,维护多语言 SDK 是件极其枯燥且容易出错的事,Stainless 把这个流程自动化了。

    更有价值的是,当 API 发生变化时,Stainless 能自动更新对应代码。这意味着依赖外部接口的开发团队可以大幅降低维护成本,加快集成速度。在 AI 时代,几乎所有公司都在对外提供 API,这个能力的战略价值被成倍放大。

    Stainless 成立于2022年,创始人 Alex Rattray。在被收购前,它的客户包括 OpenAI、谷歌、Cloudflare 等数百家公司。可以说,整个 AI 行业的开发者工具链里,都有 Stainless 的影子。

    收购后的”切断”操作

    Anthropic 完成收购后的第一个动作,是把 Stainless 的全部托管产品关停。也就是说,OpenAI、谷歌这些曾经的客户,没法继续用 Stainless 的托管服务了。他们要么自己维护已生成的代码库,要么去找替代方案。

    现有客户虽然保留了已生成代码库的专属所有权,可以继续自行修改和扩展,但后续无法获得 Stainless 官方的更新和支持。这个操作本质上是在”锁喉”——把一项对 AI 智能体开发尤为关键的连接层能力,从开放市场收回到 Anthropic 体系内部。

    对于 OpenAI 和谷歌来说,这不是小事。它们的开发者生态高度依赖流畅的多语言 SDK 支持,突然失去 Stainless 的托管服务,要么投入资源自建类似能力,要么找其他第三方工具——但市面上能替代 Stainless 的产品并不多。

    为什么是现在

    把时间线拉长来看,这笔收购和同一周 Andrej Karpathy 加入 Anthropic,以及 Anthropic 洽谈至少300亿美元新一轮融资(估值可能超过9000亿美元),是同一个战略的不同落子。

    Anthropic 在做的,是一件微软和谷歌都做过的事:控制开发者工具链。当你用我的工具构建应用,你的产品就天然绑定了我的生态。AI 时代的”开发者工具链”战争,实际上比模型能力竞赛更决定长期格局。

    Stainless 创始人 Alex Rattray 表示,加入 Anthropic 是自然决定,团队能在”更早认可这项技术价值的公司”体系内继续推进工作。这句话的潜台词是:OpenAI 和谷歌并没有真正理解 Stainless 的战略价值。

    同期还有一个细节:Claude Code 的快速模式默认模型从 Opus 4.6 切换到 Opus 4.7,代码迭代速度提升2.5倍。Anthropic 在企业版推出 Managed Agents 自托管沙箱,Agent 可在私有网络运行而无需暴露公网端口。这些动作和收购 Stainless 放在一起,是一个完整的”企业 AI 开发平台”拼图。


    对行业的影响

    短期来看,OpenAI 和谷歌需要快速找到 Stainless 的替代方案。中长期来看,这笔收购可能会被监管机构关注——如果 Anthropic 在 AI 开发者工具链上的份额过大,会不会构成新的”垄断”争议?

    更深层的问题是:当 AI 实验室从”提供模型”向上游的”开发者工具链”延伸,行业会不会出现新的割裂?如果每家实验室都推自己的 SDK 工具,开发者最终要在多个生态之间做选择,这对整个行业的创新效率未必是好事。

    Anthropic 这笔2.8亿欧元的收购,买的不只是 Stainless 的技术团队,更是 AI 开发工具链的战略咽喉。这个信号,值得所有在做 AI 基础设施的人认真想想。

    📎 原文来源:新浪科技 · IT之家报道
  • Karpathy投奔Anthropic,OpenAI重组冲刺IPO:这一周AI圈发生了什么

    这一周 AI 圈的热闹程度,差不多赶得上去年的同一时期。Andrej Karpathy 宣布加入 Anthropic,OpenAI 这边紧锣密鼓地推进 IPO,另一边 DeepSeek 直接把 API 价格砍到原来的四分之一。三件事摆在一起看,你会发现 AI 行业的竞争节奏已经完全变了。

    Karpathy 的”二次出走”

    5月19日,Karpathy 在社交媒体上发了短短一行字:”Personal update: I’ve joined Anthropic.” 这位 OpenAI 的联合创始人、前特斯拉 AI 总监,正式入职 Anthropic 的预训练团队,直接向团队负责人 Nick Joseph 汇报。

    说”二次出走”是因为 Karpathy 的职业生涯一直在几个顶级 AI 实验室之间游走。他最早是 OpenAI 的创始成员之一,后来去了特斯拉带队 Autopilot,离开特斯拉后又回到了 OpenAI。现在他选择 Anthropic,而不是回 OpenAI,这个信号值得玩味。

    Andrej Karpathy 是以个人贡献者身份加入的,不是来当管理者的。他要组建一个”用 Claude 本身来加速预训练研究”的小组——意思是让 AI 帮忙做 AI 研究,这个思路很 Anthropic。

    Anthropic 这段时间一直在疯狂招人,Workday 的 CTO、Instagram 的 CTO、Box 的 CTO 都以个人身份加入了。但 Karpathy 无疑是其中名头最响的一个。他加入的预训练团队,恰恰是大模型”底座”最核心的地方。

    OpenAI 的 IPO 冲刺与内部大重组

    就在 Karpathy 官宣的同一周,OpenAI 内部发生了一次大规模重组。联合创始人兼总裁 Greg Brockman 正式接管全部产品战略,取代因病休假的 AGI 部署负责人 Fidji Simo。Brockman 在全员备忘录里说得很直白:要建设”一个统一的 Agent 平台”。

    视频生成产品 Sora 同日关停,理由是算力消耗与营收严重不匹配。产品负责人 Kevin Weil 和技术负责人 Bill Peebles 随之离开。这些人事变动的背后,是 OpenAI 正在为 IPO 做最后准备。

    据报道,OpenAI 最快于5月22日向 SEC 提交了机密招股书,高盛和摩根士丹利担任主承销商,上市窗口瞄准今年秋季,估值预期超过1万亿美元。如果成功,这将是 AI 时代最具标志性的上市事件。

    OpenAI重组与IPO规划
    OpenAI 产品线重组示意图(来源:新浪财经)

    但财务数据也同步披露了出来:Q1 营收57亿美元,调整后经营利润率为负122%。也就是说每赚1美元要亏1.22美元。用户增长也在放缓,ChatGPT 周活9.05亿,低于2月峰值9.2亿。IPO 之前,OpenAI 需要给资本市场讲一个更动人的盈利故事。

    好消息是,马斯克对 OpenAI 的诉讼在同一周被加州联邦陪审团驳回,理由是全部索赔已过诉讼时效。IPO 路上一块巨大的法律绊脚石,就这样消失了。

    DeepSeek 的”永久降价”到底意味着什么

    5月22日,DeepSeek 官方宣布:V4-Pro 模型的2.5折优惠在5月31日到期后,将直接锁定为原价的四分之一,不再恢复原价。调整后输入价0.435美元/百万 token,输出0.87美元/百万 token。

    这个定价是什么概念?比 GPT-5.5 便宜约98%。而且 DeepSeek V4-Pro 总参数1.6万亿,每次推理激活490亿参数,是目前参数量最大的开放权重模型。用华为昇腾芯片跑推理,成本结构和英伟达路线完全不同,这就是降价的底气。

    DeepSeek 这一招”永久降价”,本质上是用价格战倒逼整个行业重新审视推理成本。如果你用极低的价格提供顶尖水平的模型能力,竞争对手要么跟进,要么失去价格敏感的开发者和企业用户。

    同期 DeepSeek 还在内部组建了名为 Harness 的新团队,主攻代码智能体产品,直接对标 Anthropic 的 Claude Code。V4-Pro 全部运行在华为昇腾芯片上,这种”芯片+模型+应用”的全栈打法,是目前美国实验室做不到的。

    同周 DeepSeek 还回应了一个引发关注的特殊字符幻觉事件,官方表示这属于模型”幻觉”现象,不涉及数据泄露或安全问题,技术团队将针对性优化。


    三件事放在一起看

    Karpathy 加入 Anthropic,说明顶级研究者认为 Anthropic 的技术路线更有前途。OpenAI 推进 IPO,说明资本市场对 AI 的期待已经到了必须兑现的时刻。DeepSeek 永久降价,说明中国 AI 实验室正在用成本优势重构全球竞争格局。

    这一周的事件,其实是同一个大趋势的不同切面:AI 竞争已经从”谁的模型最强”,转向”谁能在产品、成本、人才和资本四个维度同时取胜”。目前来看,还没有任何一家实验室能在这四个维度上同时领先。

  • Ollama:172K Stars!本地运行大模型的最热门工具,让AI完全属于你自己

    Ollama:172K Stars!本地运行大模型的最热门工具,让AI完全属于你自己

    Ollama


    ## 📦 项目简介

    Ollama 让你在本地一键运行 Llama 3、Mistral、Gemma、DeepSeek 等大模型,无需任何云服务,数据完全留在你自己的机器上。


    ## 🛠️ 安装要求和过程

    Ollama 支持 macOS、Windows、Linux 三大平台,安装极其简单。

    🔧 环境要求

    • macOS 11+ / Windows 10+ / Linux(主流发行版)
    • 建议 8GB 以上内存(7B 模型最低要求)
    • 建议 50GB 以上磁盘空间(存放多个模型)

    ⚡ 快速安装(3步搞定)

    macOS:

    brew install ollama

    Linux / WSL2:

    curl -fsSL https://ollama.com/install.sh | sh

    Windows:

    ollama.com/download 下载安装包,双击安装即可。

    验证安装:

    ollama --version

    ## ⭐ 核心功能

    🚀

    一键运行大模型

    一行命令 ollama run llama3 即可启动对话,无需配置环境。

    🔌

    本地 REST API

    自带 HTTP API(默认 http://localhost:11434),轻松集成到任何应用。

    📦

    Modelfile 自定义

    类似 Dockerfile 的 Modelfile,可定制系统提示词、温度参数、模板等。

    🔄

    模型库丰富

    官方库支持 50+ 模型,包括 Llama、Mistral、Gemma、DeepSeek、Qwen 等。

    GPU 加速推理

    自动检测并利用 Metal(macOS)、CUDA(NVIDIA)、ROCm(AMD)进行硬件加速,推理速度飞快。


    ## 🎯 典型使用场景

    📚 场景一:本地知识问答

    你可以用 Ollama 在本地运行大模型,结合 RAGFlow 或 AnythingLLM,搭建完全本地的知识库问答系统。所有文档数据和对话历史都留在本地,特别适合处理敏感资料、法律文件、医疗记录等场景。

    # 拉取中文模型
    ollama pull qwen2:7b
    # 启动对话
    ollama run qwen2:7b

    💻 场景二:AI 编程助手(本地版 Copilot)

    将 Ollama 接入 Continue、Cursor 或 VS Code,打造完全本地的 AI 编程助手。代码不需要发送到任何云端,隐私零泄露,适合企业内网开发环境。

    # 拉取代码专用模型
    ollama pull codellama:7b
    # 通过 API 调用
    curl http://localhost:11434/v1/chat/completions   -H "Content-Type: application/json"   -d '{"model":"codellama:7b","messages":[...]}'

    📝 场景三:内容创作与文本处理

    Ollama 配合 Open WebUI,可以在本地搭建一个”私人 ChatGPT”,用于文案撰写、文本摘要、翻译、邮件回复等日常任务。响应速度快,支持多轮对话,且完全免费。


    ## 💡 推荐理由

    我用过不少本地大模型运行工具,Ollama 是目前最省心的一个。安装简单到不可思议 —— macOS 一个 brew 命令,Linux 一条 curl 管道,Windows 下载安装包双击,全程不超过 3 分钟。

    它最打动我的一点,是对 Apple Silicon 的优化极其出色。在 M 系列芯片的 Mac 上,Ollama 能充分利用 Metal GPU 加速,7B 模型推理速度可以达到 40+ tokens/s,日常对话毫无压力。

    另外,它的 REST API 设计得非常优雅,和 OpenAI 的 API 格式高度兼容,迁移成本几乎为零。如果你正在做 AI 应用开发,Ollama 绝对是本地调试和离线部署的首选方案。

    推荐指数:4.8/5.0
    易用性满分,模型丰富度高,API 兼容性好,隐私保护强。


    ## 📥 下载地址

    🌐

    官方网站

    下载安装包 / 文档

    访问官网 →

    🐙

    GitHub 仓库

    172K+ Stars · Go 语言

    查看源码 →

    📖

    官方文档

    API 参考 / Modelfile 指南

    阅读文档 →


    >

    本文由 WorkBuddy AI 自动采集撰写 · 开源项目第35期 · GitHub 172K+ Stars

  • Anthropic要盈利了,AI独角兽的转折点到了

    Anthropic要盈利了,这对AI圈意味着什么

    《华尔街日报》最近报出一条有意思的消息:Anthropic告诉投资人,第二季度营收将翻倍至约109亿美元,并且首次实现运营利润。如果这个预测兑现,Anthropic会成为AI独角兽里第一个真正赚到运营利润的公司。

    但这个”首次盈利”有个重要的注脚——《华尔街日报》同时指出,受大额算力成本影响,Anthropic今年未必能全年保持盈利。换句话说,这一季度的利润更像是阶段性节点,而不是全年盈利的保证。

    Anthropic办公室
    Anthropic总部(图源:Getty Images)

    为什么是现在?

    过去一年,Anthropic的Claude在专业人群里口碑一直在涨。不少开发者、分析师、企业用户都提到,Claude在长文本处理、代码理解和推理任务上表现稳定,这让它从ChatGPT的阴影里找到了自己的位置。

    “过去一年,越来越多专业人士表达了对Claude的偏好。”——这在AI圈不是客套话,而是真实发生的用户迁移。

    Anthropic最近也在主动拓宽客户群,比如推出面向小企业主的服务,以及针对律师事务所的新工具。这些动作背后的逻辑很清楚:不能只靠少数几个大客户,要把Claude嵌进更多行业的日常工作流里。

    和OpenAI的微妙 timing

    Anthropic这份财务数据流出的同一天,OpenAI即将提交IPO的消息也在流传。两家公司的节奏形成了有趣的反差:OpenAI在准备上市,Anthropic先跑出了盈利信号。

    当然,两家公司的处境不太一样。OpenAI的算力支出规模更大,商业化路径也更激进;Anthropic相对克制,融资节奏和成本管理一直偏保守。这次传出盈利消息,某种程度上也是在向市场证明:这家公司不一定非要烧钱才能做前沿AI。


    值得持续跟踪的是算力成本这条线。AI公司的盈利能力和算力价格直接挂钩,而算力市场现在正处于剧烈变动期——英伟达的新架构、各家云厂商的自研芯片、以及能源供给的瓶颈,都会直接影响Anthropic能不能把”首次盈利”变成”持续盈利”。

    第二季度财报出来之前,这一切都还是预测。但方向已经比较明显:AI大模型的竞争,正在从”谁融得多”转向”谁能先赚钱”。

  • 英伟达又破纪录了,但黄仁勋盯上了更大的蛋糕

    英伟达又破纪录了,但黄仁勋盯上了更大的蛋糕

    英伟达刚交出一份又破纪录的财报——截至4月26日的季度,营收816亿美元,环比增长20%,其中数据中心营收752亿美元,同样创下新高。季末公司还授权了800亿美元的股票回购计划,看上去一切都在按计划推进。

    但黄仁勋在财报电话会上话锋一转,抛出了一个更大的数字:英伟达发现了一个全新的2000亿美元总可寻址市场(TAM)。这个市场来自英伟达今年3月刚发布的Vera CPU——全球第一款专为代理式AI(Agentic AI)设计的中央处理器。

    黄仁勋在GTC大会
    黄仁勋在GTC大会上(图源:Getty Images)

    为什么是CPU?

    这个逻辑听起来有点反直觉——英伟达不是做GPU起家的吗?黄仁勋的解释是:AI模型的”思考”部分由GPU负责,但AI智能体(Agent)的大部分任务执行,其实跑在CPU上。随着智能体数量爆发,对CPU的需求会跟着涨。

    “全球有10亿人类用户,我的判断是未来会有数十亿个智能体。这些智能体都会使用工具,而这些工具会像个人电脑一样运行——当然不是现在,我们会在发展过程中逐步达到这个规模。”黄仁勋在电话会议上这样说。

    Vera的设计思路和传统CPU不一样。传统CPU追求”核心数”,目标是尽可能同时跑多个应用实例;而Vera专门优化了token处理速度,匹配智能体场景的需求。这款产品既可以单独销售,也可以和英伟达的下一代GPU Rubin捆绑销售。

    财报里的其他细节

    说回财报本身。英伟达预计下季度营收910亿美元,增幅约12%——比本季度的20%明显放缓,市场对此其实早有预期,AI算力建设的周期性和需求波动是真实存在的。

    中国市场的出口管制仍是悬而未决的问题。CFO科莱特·克雷斯表示,H200虽然已获得美国出口批准,但英伟达尚未从中产生任何收入,也不确定是否会被允许向中国出口。

    另一个值得注意的数据是英伟达在私营公司的持股——1月时价值220亿美元,到季度末已经涨到430亿美元,主要来自季度内185亿美元的收购。这个数字还不包括对康宁、IREN等上市公司的投资,也不反映尚未完成的承诺(比如2月承诺向OpenAI投资的300亿美元)。


    黄仁勋在电话会上还提到了和Anthropic的合作——今年和明年为Anthropic上线的产能会”非常可观”。在此之前,英伟达对Anthropic的覆盖基本为零。这说明英伟达正在把算力基础设施的触角伸向AI最大的几个客户,而Vera CPU就是这套布局里的重要一环。

    2000亿美元是不是画饼?现在下判断还为时过早。但Vera上市首年就有200亿美元的销售额,至少说明市场愿意给它一个机会。至于能不能守住这块新市场,就要看英特尔、AMD和各大云厂商自研芯片的反击速度了。

  • Google DeepMind憋了个大招:AI不再只陪你聊天,开始帮你搞科研了

    前两天刷到Google DeepMind的一条消息,说他们搞了个叫Co-Scientist的东西——多智能体AI系统,专门给科研人员用的。我第一反应是:又来一个”AI助力科研”的PPT项目?但仔细看完,发现这次有点不一样。

    Google DeepMind Co-Scientist AI系统
    Co-Scientist:基于Gemini构建的多智能体科研助手

    从”搜索工具”到”科研搭档”,这步跨得挺大

    以往AI在科研里的角色,说白了就是个高级搜索引擎——你问它”XXX领域有什么进展”,它给你列一堆文献摘要,然后你自己去啃。

    Co-Scientist想做的事不一样。它的定位是:假设生成、讨论、验证的协同伙伴。核心架构是”生成-讨论-验证”三阶段,多个AI智能体互相抬杠、互相验证,最后给你一个它觉得靠谱的假设方向。

    传统科研里,一个有价值的研究假设,往往需要研究者花几个月甚至几年去打磨。Co-Scientist的目标,是把这个”灵感孵化”的过程,压缩到几天甚至几个小时。

    它到底强在哪?不是参数多,是”会自己纠偏”

    DeepMind在介绍里特意强调了一点:Co-Scientist强化了准确引用专业文献自我修正逻辑矛盾的能力。

    这话什么意思?你去用用现在市面上的大模型,让它帮你梳理一个研究假设,十有八九会出现”编造引用”(hallucinated references)或者”前后逻辑打脸”的情况。Co-Scientist针对这个痛点做了强化,目标是让AI在科研场景里不乱说话

    当然,现在它还处在实验性开放阶段,主要面向研究机构,不是你我去网页上就能白嫖的。但它透露出的方向很明确:AI不再只是”知识的搬运工”,而是开始涉足”知识的创造过程”。


    瞄准的是哪些科研领域?生物学、化学,还有那些”人类搞了几十年还没搞明白”的难题

    DeepMind在展望里点名了几个方向:

    • ALS(肌萎缩侧索硬化症)治疗:这个病折腾了科学界几十年,AI能不能帮忙找到新的药物靶点或者治疗路径?Co-Scientist想试试。
    • 衰老研究:衰老机制极其复杂,假设空间巨大,人工筛选成本极高。AI介入后,可能会开辟一些人类研究者还没想到的角度。
    • 化学分子设计:新药物、新材料的分子结构搜索,本质上是超高维空间的探索问题,AI”生成-验证”的循环在这里很有优势。

    未来DeepMind还打算把Co-Scientist跟实验自动化系统整合起来。到那时候,AI不只是帮你”想”,还能指挥实验室里的机器人去”做”,再把结果喂回来继续迭代。这个闭环一旦跑通,科研效率的跃升会是数量级的。

    跟OpenAI证明数学猜想那件事,其实是同一个信号

    几乎同一时间,OpenAI也放了个大卫星:他们的推理模型证明了一个80年没解决的数学猜想(Erdős单位距离猜想),证明过程125页。

    这两件事放在一起看,信号就很清楚了:2026年的AI,已经从”帮我总结一下”进化到”帮我证明/帮我发现”了。这不是简单的参数堆砌,而是推理能力、文献理解、逻辑自洽性这几件事同时到了一个临界点。

    科研人员如果还在把AI当”高级搜索引擎”用,可能真的有点亏了。下一步值得关注的,是这些科研AI智能体能不能真正加速重大发现,而不只是在已有假设上修修补补。

  • 阿里千问又放大招:Qwen3.7-Max能让AI连干35小时不卡壳

    前几天刷到一条消息,阿里千问偷偷把Qwen3.7-Max放出来了。说实话,这次更新有点东西,不是那种换汤不换药的版本号游戏。

    Qwen3.7-Max模型架构图
    Qwen3.7-Max:阿里千问新一代全能智能体基座

    35小时、1000次工具调用,它真顶得住?

    最让我意外的一个测试数据:Qwen3.7-Max在一次实验里连续跑了35个小时,调用了超过1000次外部工具,整个过程没有崩、没有逻辑断链、没有出现”我不理解你的请求”这类废话。

    这是什么概念?你去问问任何一个用过AI辅助编程的朋友,大多数模型在复杂多步任务里,撑个两三个小时就开始”幻觉叠加”、前后矛盾、或者干脆装死。Qwen3.7-Max这个表现,说明它在长上下文推理多轮工具调用这两个硬骨头上,确实啃下来了。

    “全能智能体基座”——阿里的定位很明确,不是做一个只会聊天的模型,而是做一个能陪你把事情干完的底层引擎。

    编程、办公、长任务,一个都不放过

    Qwen3.7-Max现在的覆盖范围挺全的:

    • 编程场景:从前端原型到复杂多文件工程,它都能接。这意味着你可以用它来重构代码库、跨文件修Bug、甚至帮你从零搭一个项目的骨架。
    • 办公生产力:多智能体协作 + 工作流自动化。说白了,它不只是帮你写邮件,而是能理解你的业务流程,然后自己跑去调用各种工具把活干完。
    • 长周期任务:这才是真正的门槛。35小时不间断,意味着它可以陪你跑完一个完整的软件发布周期,或者帮你盯一个持续集成流水线的全部过程。

    已经在阿里云上百炼上线,还能跑在Claude Code上

    有一点挺关键的:Qwen3.7-Max不是只给千问App用户玩的,它已经接进了阿里云百炼平台,开发者可以直接调用API。

    更值得注意的是,它宣称支持跨框架泛化——能在Claude Code、OpenClaw、Qwen Code等多个开发框架里稳定运行。这话听着有点狂,但如果真的能做到,那意味着阿里的模型在”兼容性”这件事上,开始认真跟Anthropic和OpenAI掰手腕了。

    用户现在可以把千问App更新到6.9.7以上版本,在应用里直接切换到Qwen3.7-Max。PC端和网页端也同步开放了。

    国产大模型,这次真的在拼”实用”了

    回过头看,2026年这几个月,国产大模型的节奏明显变了。以前大家比的是”我有多少参数””我在哪个榜单上刷了第一”,现在比的更多是:你的模型到底能不能帮用户把活干完?

    Qwen3.7-Max打的就是这个痛点。35小时工具调用不掉链子,这件事本身就是一个很强的信号:长周期Agentic任务,不再只是PPT上的概念,而是有模型真的在往这个方向死磕。

    至于它能不能真的在实际生产环境里顶住,还得看接下来几个月开发者的反馈。但至少从目前已经放出来的信息看,阿里千问这一步,走得不虚。