标签: 自研模型

  • 微软搞出自家推理模型,不再只靠OpenAI了





    微软搞出自家推理模型,不再只靠OpenAI了

    微软搞出自家推理模型,不再只靠OpenAI了

    2026年6月3日 · IT之家

    微软在Build 2026开发者大会上扔出一个信号:他们不再只做OpenAI的”包装工”了。七款自研AI模型一同亮相,其中最引人注目的是MAI-Thinking-1——微软第一款高级推理模型。

    这款模型有350亿活跃参数,规模不算大,但微软强调它是从零开始用干净数据训练的,没有走捷径去蒸馏第三方模型(这话里带着对谁的不满,大家心里有数)。在软件工程相关的基准测试里,它的成绩能跟业界顶尖模型掰手腕。

    微软AI CEO穆斯塔法·苏莱曼在台上重申了他们的理念——”人文主义超级智能”。这话听着有点虚,但配合这一波模型发布,意思很明确:微软要在AI底层能力上自己掌舵,而不是永远跟在别人后面。

    一口气发了七款模型,覆盖全场景

    除了MAI-Thinking-1,微软这次还端出了覆盖图像、语音、编程的完整的自研模型矩阵:

    • MAI-Image 2.5 和 MAI-Image 2.5 Flash —— 支持文生图和图像编辑,Flash版本主打速度
    • MAI-Transcribe-1.5 —— 语音转写,速度是竞争对手模型的五倍,开会录音整理终于不用等半天
    • MAI-Voice-2 —— 语音合成,新增15种语言支持,Flash版本即将推出
    • MAI-Code-1 —— 编程辅助,推理效率做了优化,已经集成进GitHub Copilot和Visual Studio Code

    这套组合拳打出来,微软在AI模型层的能力版图像是补齐了。过去大家提起微软的AI能力,第一反应是”他们用OpenAI的技术”,现在这个故事要改写了。

    为什么要自己搞模型?

    这个问题其实不难回答。微软跟OpenAI的关系一直以来都有点微妙——既是最大的金主(投了上百亿美元),又是 deepest 的商业合作伙伴,但核心技术却攥在别人手里。

    OpenAI有自己的商业化节奏,有自己的产品规划,微软想做的一些事情不一定跟OpenAI的利益完全对齐。比如微软希望把AI能力深度集成到Windows、Office、Azure里,这种底层整合如果完全依赖外部技术,长期来看是有风险的。

    还有一个更现实的原因:成本。每次调用OpenAI的API都是有成本的,如果微软能把一部分推理 workload 迁移到自家模型上,这笔账长期来看是划算的。


    MAI-Thinking-1到底强在哪?

    微软对这款模型的技术细节还守得比较紧,目前公开的信息有限。可以确定的是:

    • 中等规模(350亿参数),不是那种动辄万亿参数的”暴力美学”路线
    • 专门优化了推理能力,适合需要多步逻辑推导的任务
    • 软件工程基准测试成绩突出,这对微软的基本盘(开发者工具)来说很有意义
    • 干净数据训练,不依赖第三方模型蒸馏——这一点微软特意提了,态度很明确

    这套说辞听起来是不是有点耳熟?Anthropic也说自己”更安全、更负责”,谷歌也说自己”最开放”。各家都在讲自己的故事,最终还是得看实际用起来怎么样。

    对行业意味着什么

    微软这一步,本质上是把”模型层”的主动权往自己手里挪。过去几年AI圈的故事线是”OpenAI发明未来,微软帮忙卖出去”,现在微软想说的是”我们也能发明未来”。

    这对OpenAI来说未必是坏事。微软有了自研模型,反而可能在跟监管、跟合作伙伴谈判的时候有更多筹码,最终对OpenAI也是加分项。但如果哪天微软觉得自研模型够用了,OpenAI失去微软这个最大金主的风险也不是零。

    这场AI大戏,越来越有意思了。


  • 微软干了件迟早要干的事:不再只当OpenAI的经销商

    微软干了件迟早要干的事:不再只当OpenAI的经销商

    6月2日到3日,微软Build 2026开发者大会开完之后,很多人意识到一件事:微软好像真的不打算继续完全依赖OpenAI了。

    这次大会上,微软一口气发布了7款自研MAI系列模型。其中包括他们的首款高级推理模型MAI-Thinking-1。微软在介绍里特意强调了一句话:”完全基于干净数据从零开始训练,没有使用来自第三方模型的蒸馏数据。”这句话翻译过来就是:这是我们自己做的,跟OpenAI没有关系。

    微软投了OpenAI 130亿美元,但Copilot背后跑的还是别人的模型。每调用一次API,就是在给OpenAI送钱。这算什么护城河?

    7款模型,覆盖全部核心场景

    这次发布的MAI模型家族,基本把AI能做的事情全覆盖了:

    • MAI-Thinking-1:首款高级推理模型,350亿活跃参数,在关键软件工程基准测试中达到业界领先水平。定价比OpenAI的同类产品低。
    • MAI-Image 2.5 和 MAI-Image 2.5 Flash:文生图 + 图像编辑,Flash版本是轻量版。
    • MAI-Transcribe-1.5:语音转写,速度是竞争对手模型的5倍,支持43种语言。
    • MAI-Voice-2 和 MAI-Voice-2 Flash:语音合成,新增15种语言支持,提供更多语音选项。
    • MAI-Code-1:编程辅助,具备推理效率优化特性,已经集成到GitHub Copilot和Visual Studio Code中。

    这套模型家族发布之后,微软在AI能力上有了完整的自主权。以前微软要用推理模型,得找OpenAI要API;要用图像生成,也得依赖别人的模型。现在这些能力微软自己都有了。

    MAI-Thinking-1是个什么水平的模型

    微软对MAI-Thinking-1的定位是”中等规模模型”,350亿活跃参数。这个规模比GPT-4o或者Claude Opus要小,但微软的意思是:我们不需要最大的模型,我们需要的是性价比最高的模型。

    从基准测试的成绩来看,MAI-Thinking-1在软件工程相关的测试里达到了业界领先模型的水平。微软没有具体说是哪些模型,但”业界领先”这几个字,指向的应该是OpenAI的o1系列或者Anthropic的Claude。

    有个细节值得注意:微软强调这个模型”没有使用第三方模型的蒸馏数据”。这不是一句客套话。模型蒸馏是指用大型模型(比如GPT-4)的输出去训练小型模型,让小型模型”学会”大型模型的能力。如果微软用了OpenAI模型的蒸馏数据,那么微软的模型本质上还是在依赖OpenAI。现在微软明确说了”没有”,这意味着微软在训练数据层面做到了完全独立。


    微软为什么现在做这件事

    微软和OpenAI的关系在过去几个月里发生了很明显的变化。2026年初,微软和OpenAI结束了独家合作关系,微软被列为OpenAI的竞争对手。Build大会前不久,微软还推出了Scout,一个基于OpenClaw框架的个人AI助理,这个动作本身就说明微软在准备自己的AI产品路线。

    从商业逻辑上看,微软每年给OpenAI付的API费用不是一个小数目。如果微软自己的MAI模型能做到差不多好的效果,但成本只有OpenAI的一半或者三分之一,那么把Copilot背后的模型换成自己的,每年能省下的钱是相当可观的。

    另一个角度是竞争。Google有Gemini,Meta有Llama,Amazon有自己的模型家族。微软是唯一一个大规模推广AI产品(Copilot)但没有完全自主模型能力的巨头。这个短板,Build 2026之后,微软补上了。