Newsroom
AIEII

MiniMax M2.5:性能媲美 Claude,价格只要二十分之一的中国 AI 黑马

MiniMax M2.5 在 SWE-Bench 上超越 Claude Opus 4.6,API 价格却只要 1/20。MIT 开源许可、100 tokens/秒推理速度。中国 AI 的价格屠夫来了。

2026年03月07日

MiniMax M2.5:性能媲美 Claude,价格只要二十分之一的中国 AI 黑马

先看一组数字:

  • Claude Opus 4.6 输出价格:$25.00 / 百万 tokens
  • MiniMax M2.5 标准版输出价格:$1.20 / 百万 tokens

同样调一次 API,价格差了 20 倍

你可能会说,便宜没好货。但问题在于——M2.5 在 SWE-Bench Verified(当前最权威的代码能力评测)上拿到了 80.2% 的成绩,而 Claude Opus 4.6 是 80.8%,GPT-5.2 是 80.0%。

三者几乎打平。价格却是天壤之别。

当性能不再是壁垒,价格就成了唯一的战场。MiniMax M2.5 正在用行动证明这一点。


MiniMax 是谁?

MiniMax 成立于 2021 年 12 月,总部位于上海。创始人闫俊杰曾在商汤科技担任研究副总裁超过六年,是中国 AI 领域的技术老兵。

你可能没听过 MiniMax 这个名字,但大概率刷到过它的产品——海螺 AI(Hailuo AI),那个在社交媒体上刷屏的 AI 视频生成工具,就是它家的。

2026 年 1 月,MiniMax 在港交所完成 IPO,融资 6.18 亿美元,上市首日股价翻倍。36 岁的闫俊杰身价突破 32 亿美元,成为中国最年轻的 AI 亿万富翁之一。

这不是一家小作坊。它拥有超过 2 亿用户,2025 年前三季度收入同比增长近 159%


M2.5 的硬实力

2026 年 2 月 12 日发布的 M2.5,是 MiniMax 迄今最强的基础模型。我们直接看数据:

基准测试M2.5Claude Opus 4.6GPT-5.2
SWE-Bench Verified80.2%80.8%80.0%
Multi-SWE-Bench51.3%
BrowseComp76.3%

几个值得关注的技术细节:

  • 训练方法:在超过 20 万个真实开发环境中进行强化学习,不是简单刷题,而是让模型在真实 repo 里写代码、修 bug、跑测试。
  • 架构:MoE(混合专家)设计,总参数 2300 亿,但推理时仅激活 100 亿参数,兼顾能力与效率。
  • 语言支持:Go、Python、Rust、TypeScript、C++、Kotlin、Java、Swift、PHP、Ruby 等 10+ 编程语言。
  • 跨平台:Web、Android、iOS、Windows 全覆盖。
  • 许可证MIT 开源,完全自由商用,无任何限制。

MiniMax 自己也在吃自己的狗粮——据官方披露,公司内部 30% 的任务由 M2.5 自主完成,80% 的新代码由 M2.5 生成


Lightning 版本:速度怪兽

M2.5 分为两个版本:

  • 标准版:50 tokens/秒,适合大多数场景
  • Lightning 版100 tokens/秒,推理速度几乎是同级别竞品的两倍

Lightning 版本意味着什么?每小时连续运行的成本仅约 $1。对于需要高吞吐量的应用场景——批量数据处理、实时客服、代码审查流水线——这个速度和价格组合几乎无敌。


价格对比:数字不会说谎

模型输入价格 ($/M tokens)输出价格 ($/M tokens)推理速度
Claude Opus 4.6$5.00$25.00~50 TPS
GPT-5.4$3.00$15.00~80 TPS
Gemini 3 Pro$3.50$10.50~60 TPS
M2.5 标准版$0.15$1.20~50 TPS
M2.5 Lightning$0.30$2.40~100 TPS

算一笔账:假设你每天调用 100 万输出 tokens——

  • 用 Claude Opus 4.6:$25/天 = $750/月
  • 用 M2.5 标准版:$1.20/天 = $36/月

一年省下来的钱,够买一台 Mac Studio 了。

M2.5 不是"便宜的替代品"。在代码生成这个赛道上,它是同级别选手中性价比最高的选择,没有之一。


实际使用场景建议

不是所有场景都该无脑换模型。我们的建议是分场景选模型

  1. 高频 API 调用(客服机器人、数据清洗、格式转换)→ M2.5 标准版。成本低到可以忽略不计,质量完全够用。

  2. 复杂推理任务(学术研究、长文深度分析、多步逻辑链)→ Claude Opus 4.6 仍然是综合最强。M2.5 在纯推理上还有差距。

  3. 代码生成与审查(自动修 bug、代码重构、PR Review)→ M2.5 值得一试。SWE-Bench 80.2% 的成绩是实打实的。

  4. 实时对话应用(聊天机器人、语音助手后端)→ M2.5 Lightning。100 TPS 的速度意味着用户几乎感受不到延迟,而成本只有竞品的十分之一。


中国 AI 的「价格战」意味着什么?

2025 到 2026 年,中国 AI 公司集体发动了一场价格战:

  • DeepSeek 推出 R2,推理模型价格拉到谷底
  • 通义千问(Qwen) 开源 Qwen3.5 系列,覆盖从 0.6B 到 110B 全尺寸
  • 智谱 GLM-4 提供有竞争力的 API 定价
  • MiniMax M2.5 以 MIT 许可 + 极致低价组合拳入局

这四家正在形成中国 AI 的"新四小龙"格局。

对美国公司的影响已经显现——OpenAI 在 2025 年底大幅下调了 GPT-4o 的价格,Anthropic 也推出了更具性价比的 Claude Sonnet 系列。价格战没有输家,至少对开发者来说是这样。

更重要的是开源生态的壮大。M2.5 的 MIT 许可意味着你可以随意修改、部署、商用,不需要向任何人报告。DeepSeek 和 Qwen 也采取了类似策略。当顶级模型免费可得,AI 应用的门槛将被彻底拉平。


我们的建议

2026 年了,还在只用一个模型打天下的开发者,该醒醒了。

学会**模型路由(Model Routing)**才是正确姿势:

  • 80% 的简单任务(摘要、分类、格式化、简单问答)→ 用最便宜的模型,M2.5 标准版或者 Qwen3.5-Flash
  • 15% 的中等任务(代码生成、数据分析、内容创作)→ M2.5 Lightning 或 Claude Sonnet
  • 5% 的硬核任务(复杂推理、科研、安全审计)→ Claude Opus 4.6 或 GPT-5.4

这套组合下来,你的 AI 成本可以降低 70-80%,而质量几乎不受影响。

MiniMax M2.5 不会取代 Claude 或 GPT 成为"唯一的模型"。但它绝对值得放进你的 AI 工具箱,做那匹跑得快、吃得少的主力工作马


本文由 AIEII 编辑部撰写。如果你觉得这篇文章有价值,欢迎分享给你的朋友。

广告合作联系
立即联系 →
加入会员申请
了解详情 →
← MCP 完全指南:AI 的 USB-C 接口,一个协议连接所 … 从零搭建你的第一个 MCP Server:让 AI 操控你的 … →
💬 Comments
4 min read