DC娱乐网

MiniMax M3 发布,百万上下文、原生多模态

DoNews6月1日消息,MiniMax 稀宇科技官网今日上线了 MiniMax M3 模型,宣称是首个“Frontie

DoNews6月1日消息,MiniMax 稀宇科技官网今日上线了 MiniMax M3 模型,宣称是首个“Frontier CodingAgentic · 百万上下文 · 原生多模态”三项能力兼备的国产旗舰,第一个把完整前沿能力带进开放世界的模型。

MiniMax M3 在编码与智能体评测中达到“行业顶尖水平”,具备自主任务拆解、工具调用与多步推理能力,宣称写出的代码目标是直接可交付,而不是“能跑但需要人改”。

基于自研 MiniMax Sparse Attention(MSA)架构,MiniMax M3 的 API 最高支持 1M tokens 上下文窗口,保障至少 512K tokens 可用。1M 上下文是长程 Agent、长程 Coding、长视频理解的基础设施。

MiniMax M3 是原生多模态模型,重构整个数据管线将预训练数据规模扩充至百 T 量级,从第零步开始多模态训练,使文本和视觉语义空间高度对齐。

在 BrowseComp 智能体评测中,MiniMax M3 以 83.5 分超越 Opus 4.7(79.3),展现出自主浏览与信息检索能力。

此外,MiniMax M3 宣称是第一个把完整 frontier 能力带进开放世界的模型,能同时跑通编码 SOTA、百万上下文和原生多模态。

MiniMax 官方丢给 M3 一篇 ICLR 2025 杰出论文 — Learning Dynamics of LLM Finetuning,让它独立复现。M3 连续运行近 12 小时,全程自主产出 18 次 commit 与 23 张实验图表,成功跑通核心实验。多模态看懂论文里的图表公式,长上下文保证论文 + 代码 + 实验日志一次性进窗口,编程 + Agent 能力驱动长线程执行。

给 M3 四个只完成预训练的 Base 模型,要求在 12 小时内自主完成数据合成、训练、评测、迭代全流程,让它们在数学推理、代码生成、知识问答等任务上具备能力。整个流程全程无人干预,M3 最终得分 37.1,位列第三,仅次于 Opus 4.7(42.4)和 GPT-5.5(39.3)。