拒绝蒸馏微软发布自研 MAI-Thinking-1 追平 Claude Opus 4.6完全从零训练不沾任何第三方模型输出
2026/6/3 19:26:22 网站建设 项目流程

“我们现在已经基本追平了几个月前的最先进水平。”在 Build 大会前夕,微软 AI 执行副总裁兼 CEO Mustafa Suleyman 在采访中表示。
昨日,微软在 Build 大会上发布了一系列自研的 AI 模型。这标志着微软在模型研发上的一次重要推进,去年该公司才推出了首批自研模型,在此之前微软还主要依赖 OpenAI 的模型。甚至有一些观察人士,将本次大会称为微软的“AI 独立日”。
同时,Suleyman 也登台说明了公司在 AI 发展上的思考。他强调,微软的 AI 工作始终致力于支持人类员工和用户,而非取代他们,微软希望打造的是一种被称为“人本主义超级智能(humanist superintelligence)”的体系。
整体来看,这次 Build 大会的核心信号非常明确:微软正在从“AI 应用整合者”,转向“全栈 AI 基础设施与模型提供者”。
完全从零开始训练,微软推出首个高级推理模型
微软新模型家族的核心是 MAI-Thinking-1,这是微软首个高级推理模型。
据介绍,MAI-Thinking-1 是一款“中等规模模型”,拥有 350 亿活跃参数和 128K 上下文窗口,总参数规模约 1 万亿,在效率与性能之间取得平衡,同时强调低 token 成本。微软开发者市场负责人兼 GitHub 首席运营官 Kyle Daigle 在主题演讲前的媒体沟通会上表示,“MAI-Thinking-1 的设计目标,是擅长处理复杂的多步骤指令、www.ntjrcw.com长上下文推理以及代码生成。”
在过去一年中,推理模型这一类别主要由 OpenAI 的 o 系列、Google 的 Gemini 推理版本,以及 Anthropic 的 Claude 扩展思考模式所主导,另有开源权重阵营的 DeepSeek R1 在 2025 年初一度撼动了这一格局。
MAI-Thinking-1 是微软在这一赛道的新入局产品。在关键的软件工程基准测试中,它可以对标行业领先模型;在 SWE Bench Pro 编程基准上,其表现与 Claude Opus 4.6 持平。同时,该模型展现出先进的数学推理能力;MAI-Thinking-1 在 AIME 2025 中达到 97.0%,在 AIME 2026 中达到 94.5%。在微软进行的盲测人工对比评估中,用户对它的偏好甚至超过了 Anthropic 的 Claude Sonnet 4.6。
目前,微软尚未披露具体的训练方法,例如是否采用了“可验证奖励强化学习”(类似 OpenAI o1 的技术路径)、过程奖励建模或其他方案。但他们明确了一点“否定信息”:模型的训练数据中不包含任何其他已训练 AI 系统的概率分布或输出序列。
微软强调,MAI-Thinking-1 完全从零开始训练,使用的是企业级、干净且具备合规商业授权的数据,并且在预训练阶段排除了 AI 生成内容,也没有使用来自第三方模型的蒸馏数据,这迫使“模型真正学会任务本身”。
而这一“独立训练”的主张,或成为 MAI-Thinking-1 面向企业客户的差异化卖点。对于那些需要“干净知识产权来源”的企业来说,这一点甚至比模型能力本身更关键。对初创公司或非监管场景的开发者而言,这种差异可能显得抽象。但对部署在医疗、金融、国防或任何需要合规采购与数据治理的场景中的 AI 来说,这很可能会变成采购流程中的一个“必选勾选项”。
MAI 模型家族:一个多模态生态系统
微软还发布了另外六款 MAI 系列模型,覆盖图像生成、语音转写、语音合成和编程等方向。
其中,MAI-Code-1-Flash 是一款推理效率极高的智能体编程模型,专为并深度集成于 GitHub Copilot、Visual Studio Code 以及微软整体技术栈而打造。其参数规模为 50 亿(5B),性能可对标 Haiku,但成本更低。
MAI-Image-2.5(包括其超高效的 Flash 版本)同时支持世界级的文生图与图像编辑能力,其 Arena 评分已超过 Nano Banana Pro。MAI Transcribe-1.5 是当前全球最强的语音转录模型之一,达到 SOTA(最先进水平)准确率。它的速度是同类模型的 5 倍,并内置支持 43 种语言的领域专有术语。MAI-Voice-2 提供覆盖 15 种语言的高质量、自然语音生成能力,并支持通过短语音样本进行声音适配,www.iissbbs.com同时具备完善的滥用防护机制。其更高性价比版本 MAI-Voice-2-Flash 也即将推出。
未来,这些模型都将统一接入 Foundry 以及一个新的专用环境 MAI Playground。除了在 Azure AI Foundry 上分发并针对微软一方产品(1P)优化之外,这些模型还将面向开发者广泛开放,并支持在更多平台上使用。首次,开发者将可以对模型权重进行自定义调优。
值得一提的是,所有这些模型都建立在同一个基础之上:从零开始“向上爬升”(hill-climbing),不依赖任何蒸馏方法,共享一致的数据规范、训练基础设施和评估体系。
“升级版 OpenClaw”来了:首日用就能被信任?
2026 年初,OpenClaw 席卷 AI 圈。现在,微软推出了 Scout,这是一款基于 OpenClaw 框架构建的 AI 智能体,可以全天候自主运行,在 Microsoft 365 应用之间独立完成任务。据介绍,Scout 可以连接 Teams、Outlook、OneDrive 和 SharePoint 等应用,并访问聊天、邮件、日历和联系人数据。用户可通过 Teams 调用它,它还可以与用户的浏览器交互,并通过模型上下文协议(MCP)连接外部应用。该工具可在云端、桌面端和网页端运行。
“该智能体会在后台持续运行,理解你的各类应用和系统中工作的运作方式,并在不需要每次提示的情况下主动采取行动。”微软企业副总裁 Omar Shahine 在一篇博客中表示,这类智能体会以用户的身份执行操作,并拥有受治理的 Entra 身份。作为微软资深员工,Shahine 近期还宣布将领导一个新团队,把基于 OpenClaw 的个人助手引入 Microsoft 365 应用。
Shahine 表示,Scout 可以减少办公人员面对的重复性任务,例如与同事协调和安排会议时间,或根据即将到来的工作安排自动在日历中预留时间。“它还可以发现风险,例如决策停滞,从而让你在问题演变成阻碍之前及时处理。”
值得注意的是,由于明显存在安全漏洞,OpenClaw 一度受到审查,但微软承诺 Scout 具备“企业级安全与控制能力,从第一天起就可以在组织中被信任使用”。微软还表示,将向开源 OpenClaw 项目进行上游贡献。
目前,Scout 以“实验性版本”的形式向其 Frontier 项目客户开放,并需要通过 Intune 策略配置以及“主动选择确认(opt-in attestation)”。定价方面,微软暂未公布更多细节,尚不清楚 Scout 是否会包含在 Microsoft 365 Copilot 订阅中,还是作为单独产品收费。
尽管微软大力推进 AI,其仍在努力说服企业客户相信 Microsoft 365 Copilot 的附加费用是值得的。该产品面向大型企业定价为每位用户每月 30 美元。今年 1 月,微软表示约有 3% 的 Microsoft 365 客户为该附加订阅付费,总计约 1500 万付费用户。上月,微软宣布该数字已增长至 2000 万。Scout 是微软在 Microsoft 365 中推出的一系列智能体工具中的最新一项,这些工具还包括 Agent Mode(用户可在 Word、Excel 等应用中与 Microsoft 365 Copilot 交互生成内容)以及 Copilot Cowork(微软版的 Anthropic Claude Cowork 智能体,可独立完成任务)。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询