标签：自研模型

微软搞出自家推理模型，不再只靠OpenAI了
微软搞出自家推理模型，不再只靠OpenAI了

微软搞出自家推理模型，不再只靠OpenAI了

2026年6月3日 · IT之家

微软在Build 2026开发者大会上扔出一个信号：他们不再只做OpenAI的”包装工”了。七款自研AI模型一同亮相，其中最引人注目的是MAI-Thinking-1——微软第一款高级推理模型。

这款模型有350亿活跃参数，规模不算大，但微软强调它是从零开始用干净数据训练的，没有走捷径去蒸馏第三方模型（这话里带着对谁的不满，大家心里有数）。在软件工程相关的基准测试里，它的成绩能跟业界顶尖模型掰手腕。

微软AI CEO穆斯塔法·苏莱曼在台上重申了他们的理念——”人文主义超级智能”。这话听着有点虚，但配合这一波模型发布，意思很明确：微软要在AI底层能力上自己掌舵，而不是永远跟在别人后面。

一口气发了七款模型，覆盖全场景

除了MAI-Thinking-1，微软这次还端出了覆盖图像、语音、编程的完整的自研模型矩阵：
- MAI-Image 2.5 和 MAI-Image 2.5 Flash —— 支持文生图和图像编辑，Flash版本主打速度
- MAI-Transcribe-1.5 —— 语音转写，速度是竞争对手模型的五倍，开会录音整理终于不用等半天
- MAI-Voice-2 —— 语音合成，新增15种语言支持，Flash版本即将推出
- MAI-Code-1 —— 编程辅助，推理效率做了优化，已经集成进GitHub Copilot和Visual Studio Code
这套组合拳打出来，微软在AI模型层的能力版图像是补齐了。过去大家提起微软的AI能力，第一反应是”他们用OpenAI的技术”，现在这个故事要改写了。

为什么要自己搞模型？

这个问题其实不难回答。微软跟OpenAI的关系一直以来都有点微妙——既是最大的金主（投了上百亿美元），又是 deepest 的商业合作伙伴，但核心技术却攥在别人手里。

OpenAI有自己的商业化节奏，有自己的产品规划，微软想做的一些事情不一定跟OpenAI的利益完全对齐。比如微软希望把AI能力深度集成到Windows、Office、Azure里，这种底层整合如果完全依赖外部技术，长期来看是有风险的。

还有一个更现实的原因：成本。每次调用OpenAI的API都是有成本的，如果微软能把一部分推理 workload 迁移到自家模型上，这笔账长期来看是划算的。

MAI-Thinking-1到底强在哪？

微软对这款模型的技术细节还守得比较紧，目前公开的信息有限。可以确定的是：
- 中等规模（350亿参数），不是那种动辄万亿参数的”暴力美学”路线
- 专门优化了推理能力，适合需要多步逻辑推导的任务
- 软件工程基准测试成绩突出，这对微软的基本盘（开发者工具）来说很有意义
- 干净数据训练，不依赖第三方模型蒸馏——这一点微软特意提了，态度很明确
这套说辞听起来是不是有点耳熟？Anthropic也说自己”更安全、更负责”，谷歌也说自己”最开放”。各家都在讲自己的故事，最终还是得看实际用起来怎么样。

对行业意味着什么

微软这一步，本质上是把”模型层”的主动权往自己手里挪。过去几年AI圈的故事线是”OpenAI发明未来，微软帮忙卖出去”，现在微软想说的是”我们也能发明未来”。

这对OpenAI来说未必是坏事。微软有了自研模型，反而可能在跟监管、跟合作伙伴谈判的时候有更多筹码，最终对OpenAI也是加分项。但如果哪天微软觉得自研模型够用了，OpenAI失去微软这个最大金主的风险也不是零。

这场AI大戏，越来越有意思了。

📎 原文来源：IT之家 · 微软发布其首款高级推理模型 MAI-Thinking-1
2026年6月14日
微软干了件迟早要干的事：不再只当OpenAI的经销商
微软干了件迟早要干的事：不再只当OpenAI的经销商

6月2日到3日，微软Build 2026开发者大会开完之后，很多人意识到一件事：微软好像真的不打算继续完全依赖OpenAI了。

这次大会上，微软一口气发布了7款自研MAI系列模型。其中包括他们的首款高级推理模型MAI-Thinking-1。微软在介绍里特意强调了一句话：”完全基于干净数据从零开始训练，没有使用来自第三方模型的蒸馏数据。”这句话翻译过来就是：这是我们自己做的，跟OpenAI没有关系。

微软投了OpenAI 130亿美元，但Copilot背后跑的还是别人的模型。每调用一次API，就是在给OpenAI送钱。这算什么护城河？

7款模型，覆盖全部核心场景

这次发布的MAI模型家族，基本把AI能做的事情全覆盖了：
- MAI-Thinking-1：首款高级推理模型，350亿活跃参数，在关键软件工程基准测试中达到业界领先水平。定价比OpenAI的同类产品低。
- MAI-Image 2.5 和 MAI-Image 2.5 Flash：文生图 + 图像编辑，Flash版本是轻量版。
- MAI-Transcribe-1.5：语音转写，速度是竞争对手模型的5倍，支持43种语言。
- MAI-Voice-2 和 MAI-Voice-2 Flash：语音合成，新增15种语言支持，提供更多语音选项。
- MAI-Code-1：编程辅助，具备推理效率优化特性，已经集成到GitHub Copilot和Visual Studio Code中。
这套模型家族发布之后，微软在AI能力上有了完整的自主权。以前微软要用推理模型，得找OpenAI要API；要用图像生成，也得依赖别人的模型。现在这些能力微软自己都有了。

MAI-Thinking-1是个什么水平的模型

微软对MAI-Thinking-1的定位是”中等规模模型”，350亿活跃参数。这个规模比GPT-4o或者Claude Opus要小，但微软的意思是：我们不需要最大的模型，我们需要的是性价比最高的模型。

从基准测试的成绩来看，MAI-Thinking-1在软件工程相关的测试里达到了业界领先模型的水平。微软没有具体说是哪些模型，但”业界领先”这几个字，指向的应该是OpenAI的o1系列或者Anthropic的Claude。

有个细节值得注意：微软强调这个模型”没有使用第三方模型的蒸馏数据”。这不是一句客套话。模型蒸馏是指用大型模型（比如GPT-4）的输出去训练小型模型，让小型模型”学会”大型模型的能力。如果微软用了OpenAI模型的蒸馏数据，那么微软的模型本质上还是在依赖OpenAI。现在微软明确说了”没有”，这意味着微软在训练数据层面做到了完全独立。

微软为什么现在做这件事

微软和OpenAI的关系在过去几个月里发生了很明显的变化。2026年初，微软和OpenAI结束了独家合作关系，微软被列为OpenAI的竞争对手。Build大会前不久，微软还推出了Scout，一个基于OpenClaw框架的个人AI助理，这个动作本身就说明微软在准备自己的AI产品路线。

从商业逻辑上看，微软每年给OpenAI付的API费用不是一个小数目。如果微软自己的MAI模型能做到差不多好的效果，但成本只有OpenAI的一半或者三分之一，那么把Copilot背后的模型换成自己的，每年能省下的钱是相当可观的。

另一个角度是竞争。Google有Gemini，Meta有Llama，Amazon有自己的模型家族。微软是唯一一个大规模推广AI产品（Copilot）但没有完全自主模型能力的巨头。这个短板，Build 2026之后，微软补上了。

📎 原文来源：IT之家 – 微软发布其首款高级推理模型 MAI-Thinking-1
2026年6月7日

标签： 自研模型

微软搞出自家推理模型，不再只靠OpenAI了

微软搞出自家推理模型，不再只靠OpenAI了

一口气发了七款模型，覆盖全场景

为什么要自己搞模型？

MAI-Thinking-1到底强在哪？

对行业意味着什么

微软干了件迟早要干的事：不再只当OpenAI的经销商

微软干了件迟早要干的事：不再只当OpenAI的经销商

7款模型，覆盖全部核心场景

MAI-Thinking-1是个什么水平的模型

微软为什么现在做这件事

标签：自研模型