这周的 AI 圈可以用一个词概括:暴力升级。OpenAI 把上下文窗口拉到 100 万 token,中国公司用十分之一的价格打出同级性能,MCP 悄悄统一了整个 AI 工具链——还有人用文字就能生成 3D 模型了。坐稳了,我们开始。
头条:GPT-5.4 —— 100 万 token 和"极限推理"
OpenAI 本周发布了 GPT-5.4,这次的升级幅度让人有点恍惚:100 万 token 的上下文窗口,意味着你可以把一整本《红楼梦》扔进去,它还能记住林黛玉第三回说了什么。
但真正的重头戏是全新的极限推理模式(Extreme Reasoning)。GPT-5.4 提供了五档推理强度:
| 档位 | 适用场景 | 响应时间 |
|---|---|---|
| Light | 日常对话、简单问答 | 秒级 |
| Medium | 文章写作、代码生成 | 十秒级 |
| High | 复杂分析、多步推理 | 分钟级 |
| Extra High | 研究级问题、数学证明 | 数十分钟 |
| Extreme | 前沿科研、超复杂工程 | 数小时 |
没看错,Extreme 模式下模型可以花数小时来推理一个问题。这不再是"聊天机器人"的思路了——更像是你雇了一个研究员,让他坐在那儿啃一个难题,啃完了再告诉你答案。
GPT-5.4 还是首个原生支持 computer-use 的通用模型。换句话说,它不仅能想,还能动手操作你的电脑。编程能力与 GPT-5.3-Codex 持平,但世界知识和推理层面明显更强。
OpenAI 同时还发布了 ChatGPT for Excel 插件和一系列金融数据整合,GPT-5.4 正在从"聊天工具"变成"生产力平台"。
MiniMax M2.5:用十分之一的价格打你
如果说 GPT-5.4 是用技术力碾压,那 MiniMax M2.5 就是用价格锤子砸场子。
这家来自中国的公司发布了 M2.5 模型,MIT 开源许可,SWE-Bench Verified 跑出 80.2% 的成绩——直接超过了 Claude Opus 4.6 的 74.2%。但最炸裂的是价格:
| 模型 | 输入价格 | 输出价格 |
|---|---|---|
| MiniMax M2.5 (标准) | $0.15/M tokens | $1.20/M tokens |
| Claude Opus 4.6 | $5/M tokens | $25/M tokens |
| GPT-5.4 | $2.50/M tokens | $10/M tokens |
标准版价格是 Claude Opus 4.6 的三十分之一。Lightning 版更夸张:100 tokens/秒的生成速度,每小时成本仅 $1。
MiniMax 是怎么做到的?他们在数十万个真实开发环境中用强化学习训练模型,而不是靠堆参数。M2.5 在港股的母公司 MiniMax Group 股价一度暴涨 30%。
2026 年的 AI 定价格局正在被中国公司重新定义。DeepSeek、Qwen、MiniMax——他们证明了一件事:顶级性能不需要顶级价格。
MCP:从 Anthropic 的小项目到行业标准
还记得 MCP 吗?2024 年 11 月 Anthropic 发布的 Model Context Protocol,当时很多人觉得"又一个协议"。一年多过去了,MCP 已经成了 AI 工具连接的事实标准,堪称"AI 界的 USB-C"。
时间线回顾:
- 2024.11 — Anthropic 发布 MCP 开源协议
- 2025.03 — OpenAI 正式采用(ChatGPT Desktop + Agents SDK + Responses API)
- 2025.08 — Microsoft 集成(Windows + Foundry + Azure)
- 2025.12 — Anthropic 将 MCP 捐给 Linux Foundation 旗下的 Agentic AI Foundation
- 2026.03 — 几乎所有主流 AI 平台都已支持
MCP 解决的问题很简单:让 AI 模型能以统一的方式连接外部工具和数据源。以前每个平台都有自己的插件系统,开发者需要为每个平台分别适配。现在,写一次 MCP 服务器,所有支持 MCP 的客户端都能用。
真正伟大的技术标准从来不是靠强推,而是靠解决实际问题。MCP 的成功证明了这一点。
Autodesk Wonder 3D:文字变 3D 模型
Autodesk 在 Flow Studio 中推出了 Wonder 3D 功能——用文字或图片直接生成带纹理的 3D 模型。
这对游戏开发者和设计师来说是个大消息。传统 3D 建模需要专业技能和大量时间,现在你只要描述"一个赛博朋克风格的机械臂",就能得到一个可用的 3D 模型。当然,专业级别的精细调整还是需要人工,但起码初始原型可以在几分钟内完成。
3D 生成是 AI 的最后几个"硬骨头"之一。图像生成和视频生成已经相当成熟,3D 一直因为空间一致性和纹理质量的问题落后。Wonder 3D 的出现说明这个差距正在快速缩小。
本周速报
模型与技术:
- DeepSeek 正在准备发布新模型,细节尚未公开,但市场预期很高
- Qwen 3.5 系列推出超小模型,0.8B 版本仅需 500MB 即可在手机端运行
- PewDiePie(没错,就是那个 YouTuber)训练了自己的 AI 模型,在某些编程基准测试中竟然超过了 ChatGPT
融资与商业:
- OpenAI 获得 1100 亿美元巨额融资,投资方包括 Amazon、Nvidia 和 SoftBank
- 这是 AI 行业有史以来最大的单笔融资,OpenAI 的估值已经突破天际
创意工具:
- Higgsfield AI 推出 Soul Cinema Preview,主打电影级 AI 图像生成
- 从文字到图像、视频、3D——AI 创意工具链正在以月为单位完善
地缘政治:
- 伊朗局势持续影响全球能源价格,间接推高数据中心运营成本
- AI 公司的能源焦虑正在从"未来问题"变成"现在问题"
编辑手记
写了 11 期周刊,这一期让我感触最深的不是哪个模型又刷新了跑分,而是两个趋势的交汇。
第一个趋势是推理时间的拉长。GPT-5.4 的 Extreme 模式允许模型花数小时思考一个问题。这意味着 AI 不再只是"快速回答机器",它开始有了"深度思考"的能力。未来的 AI 使用方式可能是:睡前提一个难题,早上起来看答案。
第二个趋势是成本的断崖式下降。MiniMax M2.5 用 Claude 三十分之一的价格提供了同级甚至更强的编程能力。当顶级 AI 的使用成本降到"几乎免费",真正的普惠 AI 时代才算到来。
这两个趋势叠加在一起,指向一个结论:AI 正在同时变得更深和更广——既能解决更难的问题,又能被更多人使用。
这或许就是 2026 年最值得记住的事。
下周见。
本文由 AIEII 编辑部撰写。如果你觉得这篇周刊有价值,欢迎分享给你的朋友。