Newsroom
AIEII

AI 周刊 #11:GPT-5.4 极限推理模式来了

GPT-5.4 百万上下文+极限推理、MiniMax M2.5 价格屠夫、MCP 成行业标准、Wonder 3D 文字生成3D。

2026年03月07日

AI 周刊 #11:GPT-5.4 极限推理模式来了

这周的 AI 圈可以用一个词概括:暴力升级。OpenAI 把上下文窗口拉到 100 万 token,中国公司用十分之一的价格打出同级性能,MCP 悄悄统一了整个 AI 工具链——还有人用文字就能生成 3D 模型了。坐稳了,我们开始。


头条:GPT-5.4 —— 100 万 token 和"极限推理"

OpenAI 本周发布了 GPT-5.4,这次的升级幅度让人有点恍惚:100 万 token 的上下文窗口,意味着你可以把一整本《红楼梦》扔进去,它还能记住林黛玉第三回说了什么。

但真正的重头戏是全新的极限推理模式(Extreme Reasoning)。GPT-5.4 提供了五档推理强度:

档位适用场景响应时间
Light日常对话、简单问答秒级
Medium文章写作、代码生成十秒级
High复杂分析、多步推理分钟级
Extra High研究级问题、数学证明数十分钟
Extreme前沿科研、超复杂工程数小时

没看错,Extreme 模式下模型可以花数小时来推理一个问题。这不再是"聊天机器人"的思路了——更像是你雇了一个研究员,让他坐在那儿啃一个难题,啃完了再告诉你答案。

GPT-5.4 还是首个原生支持 computer-use 的通用模型。换句话说,它不仅能想,还能动手操作你的电脑。编程能力与 GPT-5.3-Codex 持平,但世界知识和推理层面明显更强。

OpenAI 同时还发布了 ChatGPT for Excel 插件和一系列金融数据整合,GPT-5.4 正在从"聊天工具"变成"生产力平台"。


MiniMax M2.5:用十分之一的价格打你

如果说 GPT-5.4 是用技术力碾压,那 MiniMax M2.5 就是用价格锤子砸场子。

这家来自中国的公司发布了 M2.5 模型,MIT 开源许可,SWE-Bench Verified 跑出 80.2% 的成绩——直接超过了 Claude Opus 4.6 的 74.2%。但最炸裂的是价格:

模型输入价格输出价格
MiniMax M2.5 (标准)$0.15/M tokens$1.20/M tokens
Claude Opus 4.6$5/M tokens$25/M tokens
GPT-5.4$2.50/M tokens$10/M tokens

标准版价格是 Claude Opus 4.6 的三十分之一。Lightning 版更夸张:100 tokens/秒的生成速度,每小时成本仅 $1。

MiniMax 是怎么做到的?他们在数十万个真实开发环境中用强化学习训练模型,而不是靠堆参数。M2.5 在港股的母公司 MiniMax Group 股价一度暴涨 30%。

2026 年的 AI 定价格局正在被中国公司重新定义。DeepSeek、Qwen、MiniMax——他们证明了一件事:顶级性能不需要顶级价格。


MCP:从 Anthropic 的小项目到行业标准

还记得 MCP 吗?2024 年 11 月 Anthropic 发布的 Model Context Protocol,当时很多人觉得"又一个协议"。一年多过去了,MCP 已经成了 AI 工具连接的事实标准,堪称"AI 界的 USB-C"。

时间线回顾:

  • 2024.11 — Anthropic 发布 MCP 开源协议
  • 2025.03 — OpenAI 正式采用(ChatGPT Desktop + Agents SDK + Responses API)
  • 2025.08 — Microsoft 集成(Windows + Foundry + Azure)
  • 2025.12 — Anthropic 将 MCP 捐给 Linux Foundation 旗下的 Agentic AI Foundation
  • 2026.03 — 几乎所有主流 AI 平台都已支持

MCP 解决的问题很简单:让 AI 模型能以统一的方式连接外部工具和数据源。以前每个平台都有自己的插件系统,开发者需要为每个平台分别适配。现在,写一次 MCP 服务器,所有支持 MCP 的客户端都能用。

真正伟大的技术标准从来不是靠强推,而是靠解决实际问题。MCP 的成功证明了这一点。


Autodesk Wonder 3D:文字变 3D 模型

Autodesk 在 Flow Studio 中推出了 Wonder 3D 功能——用文字或图片直接生成带纹理的 3D 模型。

这对游戏开发者和设计师来说是个大消息。传统 3D 建模需要专业技能和大量时间,现在你只要描述"一个赛博朋克风格的机械臂",就能得到一个可用的 3D 模型。当然,专业级别的精细调整还是需要人工,但起码初始原型可以在几分钟内完成。

3D 生成是 AI 的最后几个"硬骨头"之一。图像生成和视频生成已经相当成熟,3D 一直因为空间一致性和纹理质量的问题落后。Wonder 3D 的出现说明这个差距正在快速缩小。


本周速报

模型与技术:

  • DeepSeek 正在准备发布新模型,细节尚未公开,但市场预期很高
  • Qwen 3.5 系列推出超小模型,0.8B 版本仅需 500MB 即可在手机端运行
  • PewDiePie(没错,就是那个 YouTuber)训练了自己的 AI 模型,在某些编程基准测试中竟然超过了 ChatGPT

融资与商业:

  • OpenAI 获得 1100 亿美元巨额融资,投资方包括 Amazon、Nvidia 和 SoftBank
  • 这是 AI 行业有史以来最大的单笔融资,OpenAI 的估值已经突破天际

创意工具:

  • Higgsfield AI 推出 Soul Cinema Preview,主打电影级 AI 图像生成
  • 从文字到图像、视频、3D——AI 创意工具链正在以月为单位完善

地缘政治:

  • 伊朗局势持续影响全球能源价格,间接推高数据中心运营成本
  • AI 公司的能源焦虑正在从"未来问题"变成"现在问题"

编辑手记

写了 11 期周刊,这一期让我感触最深的不是哪个模型又刷新了跑分,而是两个趋势的交汇。

第一个趋势是推理时间的拉长。GPT-5.4 的 Extreme 模式允许模型花数小时思考一个问题。这意味着 AI 不再只是"快速回答机器",它开始有了"深度思考"的能力。未来的 AI 使用方式可能是:睡前提一个难题,早上起来看答案。

第二个趋势是成本的断崖式下降。MiniMax M2.5 用 Claude 三十分之一的价格提供了同级甚至更强的编程能力。当顶级 AI 的使用成本降到"几乎免费",真正的普惠 AI 时代才算到来。

这两个趋势叠加在一起,指向一个结论:AI 正在同时变得更深和更广——既能解决更难的问题,又能被更多人使用。

这或许就是 2026 年最值得记住的事。

下周见。


本文由 AIEII 编辑部撰写。如果你觉得这篇周刊有价值,欢迎分享给你的朋友。

广告合作联系
立即联系 →
加入会员申请
了解详情 →
← OpenAI Codex CLI 完全指南:从安装到让 AI … MCP 完全指南:AI 的 USB-C 接口,一个协议连接所 … →
💬 Comments
5 min read