AI 见闻
精选· 重要性 4/5

微软Build大会发布MAI-Thinking-1等七款新模型,技术报告获好评

Latent Space (Swyx)··约 7 分钟阅读
中文导读

微软在Build大会上推出七款MAI系列模型,涵盖推理、代码、图像、语音等领域,并发布超百页技术报告,因透明度高获研究界好评。

[AINews] Microsoft Build:MAI-Thinking-1和MAI系列模型微软构建回顾,以及新的MAI模型技术详细信息今天是一个重要的日子,尤其是因为我们了解了GitHub vs Agents的情况,

并与No Priors和Satya Nadella一起录制了一个特别的播客-在MS Build上,

Satya和Mustafa宣布了7款新的MAI型号:这是一个令人印象深刻的阵容,特别是考虑到成立MAI的微软与Inflection交易仅发生在两年前,而且这些都是从头开始的预培训。

今天的MAI绝不是一个不合格的前沿实验室,但它是一个很好的2级新实验室,具有支持特定领域微调的明显动力(而不是那些已经全部扼杀微调的前沿实验室)。

该节目的明星是100多页的MAI技术报告,研究界对此给予了热烈的评价:您可以在精彩的Verge回顾中了解所有其余公告内容,以及下面的推文摘要:人工智能新闻2026年1月6日至2026年2月6日。

我们检查了12个subreddits、544个Twitter用户,没有进一步的Discords。AINews的网站允许您搜索所有过去的问题。提醒您的是,AINews现在是潜伏空间的一部分。您可以选择加入/退出电子邮件频率!

人工智能Twitter回顾头条新闻:微软构建回顾,以及新的MAI模型技术详细信息发生了什么微软利用Build将自己定位为一家人工智能平台公司和一家前沿模型实验室,将广泛的产品发布与对其新MAI模型系列异常详细的披露结合起来。

微软AI宣布了七种新的MAI模型,涵盖推理、代码、图像、语音转录和语音,由MAI-Thinking-1、MAI-Code-1-Flash、MAI-Image-2领导。5,MAI-Transcribe-1。

根据@ Microsoft AI和@mustafasuleyman的说法,5和MAI-Voice-2旗舰推理模型MAI-Thinking-1是微软的第一个推理模型,在@mustafasuleyman、@ besten、

@tuhinone和@HannaHajishirzi的帖子中,

采用干净的数据谱系和第三方模型的零蒸馏构建微软发布了一份长达109页的MAI-Thinking-1技术报告,其透明度水平引起了技术导向读者的强烈积极反应,其中包括@eliebakouch、@ethanCaballero、@nrehiew_、

@yacinelearning和@stochasticchasm微软还强调了本地人工智能和代理原生Windows:

构建消息传递强调了代理的安全执行层、新的Surface RTX Spark Dev Box、Windows AI对更广泛的Windows图形处理器安装基础的访问,以及Project Solara/Scout等概念硬件,由@ ysuf_i_mehdi、

@TheTuringPost、

@kimmonismus和@kimmonismus总结构建还包括一个主要的GitHub Copilot应用程序,将其作为“代理原生软件开发的桌面之家”,具有来自@pierceboggan、@lukehoban的画布、跨设备连续性和更严格的GitHub代理工作流程,

以及来自@techgirl1908的反应微软通过@JordiRib1推出了Web IQ,

这是一种新的人工智能代理基础/搜索API栈,声称这些API已经为“当今行业中几乎所有人工智能代理和聊天机器人提供支持,包括Copilot和ChatGPT”Satya Nadella将Build定义为一个生态系统时刻,而不是单一产品的发布,

而Mustafa Suleyman则将其定义为微软内部“爬山机器”的输出,

@satyanadella、@mustafasuleyman以及@nrehiew_的反应MAI模型家族:披露的事实和技术细节MAI-Thinking-1微软在@mustafasuleyman中将MAI-Thinking-1描述为35 B活动参数MoE,

具有256 K上下文窗口@scaling01的单独摘要称该模型是一个1 T@35 B参数模型,在30 T代币上预训练,并使用8192 GB 200图形处理器进行训练;

这似乎是对技术报告的阅读,而不是微软营销副本@kimmonismus类似地将其总结为具有45 B活跃参数的中型MoE,但这与Mustafa自己的35 B活跃数字相冲突;

推文集中更权威的数字是官方的35 B活跃数字微软在AIME 2025上声称97%,在SWE-Bench Pro上声称53%,而Surge上的盲人人类评分者总体上更喜欢它,而不是十四行诗4。

6,来自@mustafasuleyman和@asadovsky微软表示,该模型在MAIA 200上进行了优化,每美元性能提高30%,1. @mustafasuleyman表示,端到端运行MAI型号时,

每瓦性能提高了GB 200的4倍微软及其合作伙伴一再强调不需要第三方蒸馏、“干净的数据谱系”以及企业控制的微调,通过Baseten、@ besten、

@tuhinone和@ Microsoft AI对训练后数据进行“100%视而不见”MAI-Code-1-Flash微软推出了MAI-Code-1-Flash作为VS Code和GitHub Copilot CLI的快速编码模型,

首先由@pierceboggan宣布,后来由@mariorod1强调微软官方消息称,尽管只有5 B参数,Code-1-Flash在SWE-Bench Pro上的表现仍达到了51%,接近俳句级的尺寸/成本@scaling01的一份竞争摘要将其描述为137 B参数MoE,

256 K上下文,在10 T+代币上训练,并且“比Claude 4更强大、更高效”。5俳句。“这可能表明5 B活跃参数而不是总参数;

推文并没有完全调和这种区别,但总的来说意味着在更大的MoE内活跃足迹很小根据@scaling01和@mariorod1,发布时的可用性被强调为GitHub Copilot / VS Code-优先MAI-Image-2。

5微软推出了MAI-Image-2。

5和Flash变体,声称两者都在排行榜上排名第二,@mustafasuleyman表示它们在图像编辑方面超过了Nano Banana 2独立排行榜帐户支持高排名:@arena在Image Edit Arena中排名第2,评分1401,比Nano Banana 2、

Grok Imagine和ChatGPT Image Latest HF +10分@arena进一步说道MAI-Image-2。5“推进帕累托前沿”,这意味着其价格级别的车型在该基准上得分更高分销合作伙伴很快跟进,包括@OpenRouter和@falMAI-转录-1。

5@ JournicialAnlys报告了MAI-Transcribe-1。5作为STT前沿异常强劲的速度/准确性点:~ 276 x实时,2.

4% AA-WER,在其排行榜上排名第三该模型支持43种语言,包括英语,法语,阿拉伯语,日语和中文,并支持对姓名和医学术语等罕见术语的关键字偏置,根据@pacificialAnlys据报道,微软Foundry的定价为每1,000分钟6美元,

网址是@MonicialAnlys。

OpenRouter还在@OpenRouter上列出了同一天发布的三个MAI中的模型MAI-Voice-2MAI-Voice-2出现在微软的“七种型号”保护伞中以及OpenRouter在@OpenRouter上的可用性帖子中除了发布/可用性之外,

推文集几乎没有包含Voice-2本身的技术细节对研究人员重要的技术报告细节为什么该报告脱颖而出主要的技术反应是微软发布了一份异常详细的前沿模型报告:

@eliebakouch称其为“这种规模的模型中最透明的报告之一”,@nrehiew_表示它“确实可以作为当今LLM培训的更新教科书”,@stochasticchasm称其为“金矿”多位读者强调,该报告披露了管道细节、阶梯式方法、数据策展、基础设施指标和MFU数字;

这种具体程度受到了@ethanCaballero、@eliebakouch和@nrehiew_的赞扬预训练和数据评论中重复的一个主要技术主张是,MAI-Thinking-1不仅在后训练中,而且在整个披露的管道中(来自@eliebakouch、

@stochasticchasm和@HannaHajishirzi)没有使用合成数据,

也没有使用蒸馏@eliebakouch表示,该报告明确指出了来自Common Crawl和私人来源的数据,以及针对不同领域的有针对性的子管道、大量提取/删除工作以及故意选择不使用合成数据@eliebakouch将该报告用于扩展决策的内部私有NLL集总结为:50%代码17.

5% STEM17. 5%数学10%常识5% m

原文出处
[AINews] Microsoft Build: MAI-Thinking-1 and MAI Family models

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读