MiniMax M2.5：性能媲美 Claude，价格只要二十分之一的中国 AI 黑马

先看一组数字：

同样调一次 API，价格差了 20 倍。

你可能会说，便宜没好货。但问题在于——M2.5 在 SWE-Bench Verified（当前最权威的代码能力评测）上拿到了 80.2% 的成绩，而 Claude Opus 4.6 是 80.8%，GPT-5.2 是 80.0%。

三者几乎打平。价格却是天壤之别。

当性能不再是壁垒，价格就成了唯一的战场。MiniMax M2.5 正在用行动证明这一点。

MiniMax 是谁？

MiniMax 成立于 2021 年 12 月，总部位于上海。创始人闫俊杰曾在商汤科技担任研究副总裁超过六年，是中国 AI 领域的技术老兵。

你可能没听过 MiniMax 这个名字，但大概率刷到过它的产品——海螺 AI（Hailuo AI），那个在社交媒体上刷屏的 AI 视频生成工具，就是它家的。

2026 年 1 月，MiniMax 在港交所完成 IPO，融资 6.18 亿美元，上市首日股价翻倍。36 岁的闫俊杰身价突破 32 亿美元，成为中国最年轻的 AI 亿万富翁之一。

这不是一家小作坊。它拥有超过 2 亿用户，2025 年前三季度收入同比增长近 159%。

2026 年 2 月 12 日发布的 M2.5，是 MiniMax 迄今最强的基础模型。我们直接看数据：

基准测试	M2.5	Claude Opus 4.6	GPT-5.2
SWE-Bench Verified	80.2%	80.8%	80.0%
Multi-SWE-Bench	51.3%	—	—
BrowseComp	76.3%	—	—

几个值得关注的技术细节：

MiniMax 自己也在吃自己的狗粮——据官方披露，公司内部 30% 的任务由 M2.5 自主完成，80% 的新代码由 M2.5 生成。

M2.5 分为两个版本：

Lightning 版本意味着什么？每小时连续运行的成本仅约 $1。对于需要高吞吐量的应用场景——批量数据处理、实时客服、代码审查流水线——这个速度和价格组合几乎无敌。

模型	输入价格 ($/M tokens)	输出价格 ($/M tokens)	推理速度
Claude Opus 4.6	$5.00	$25.00	~50 TPS
GPT-5.4	$3.00	$15.00	~80 TPS
Gemini 3 Pro	$3.50	$10.50	~60 TPS
M2.5 标准版	$0.15	$1.20	~50 TPS
M2.5 Lightning	$0.30	$2.40	~100 TPS

算一笔账：假设你每天调用 100 万输出 tokens——

一年省下来的钱，够买一台 Mac Studio 了。

M2.5 不是"便宜的替代品"。在代码生成这个赛道上，它是同级别选手中性价比最高的选择，没有之一。

不是所有场景都该无脑换模型。我们的建议是分场景选模型：

高频 API 调用（客服机器人、数据清洗、格式转换）→ M2.5 标准版。成本低到可以忽略不计，质量完全够用。
复杂推理任务（学术研究、长文深度分析、多步逻辑链）→ Claude Opus 4.6 仍然是综合最强。M2.5 在纯推理上还有差距。
代码生成与审查（自动修 bug、代码重构、PR Review）→ M2.5 值得一试。SWE-Bench 80.2% 的成绩是实打实的。
实时对话应用（聊天机器人、语音助手后端）→ M2.5 Lightning。100 TPS 的速度意味着用户几乎感受不到延迟，而成本只有竞品的十分之一。

2025 到 2026 年，中国 AI 公司集体发动了一场价格战：

这四家正在形成中国 AI 的"新四小龙"格局。

对美国公司的影响已经显现——OpenAI 在 2025 年底大幅下调了 GPT-4o 的价格，Anthropic 也推出了更具性价比的 Claude Sonnet 系列。价格战没有输家，至少对开发者来说是这样。

更重要的是开源生态的壮大。M2.5 的 MIT 许可意味着你可以随意修改、部署、商用，不需要向任何人报告。DeepSeek 和 Qwen 也采取了类似策略。当顶级模型免费可得，AI 应用的门槛将被彻底拉平。

2026 年了，还在只用一个模型打天下的开发者，该醒醒了。

学会**模型路由（Model Routing）**才是正确姿势：

这套组合下来，你的 AI 成本可以降低 70-80%，而质量几乎不受影响。

MiniMax M2.5 不会取代 Claude 或 GPT 成为"唯一的模型"。但它绝对值得放进你的 AI 工具箱，做那匹跑得快、吃得少的主力工作马。

本文由 AIEII 编辑部撰写。如果你觉得这篇文章有价值，欢迎分享给你的朋友。