AI 周刊 #12：百万上下文 GA、GTC 2026、以及那笔 270 亿美元的账单

上一期我们说 AI 圈在"暴力升级"。这周更狠：Anthropic 把百万上下文正式开放了还不涨价，NVIDIA 在 GTC 上掏出了下一代芯片平台，Meta 为了算力直接开了一张 270 亿美元的支票，图灵奖得主拿着 10 亿美元说"大语言模型是死胡同"。

哦对了，Amazon 的 AI 编码工具还把自家网站搞崩了，丢了 630 万个订单。

精彩不？我们一个一个说。

头条：Claude 百万 token 上下文正式 GA

3 月 13 日，Anthropic 宣布 Claude Opus 4.6 和 Sonnet 4.6 的 100 万 token 上下文窗口正式全量开放（GA）。

重点不是"百万上下文"本身，GPT-5.4 上周也做到了。重点是 Anthropic 的定价策略：

模型	输入价格	输出价格	上下文窗口
Claude Opus 4.6	$5/M	$25/M	1M tokens
Claude Sonnet 4.6	$3/M	$15/M	1M tokens
GPT-5.4	$2.50/M	$10/M	1M tokens

不加价。发一个 90 万 token 的请求和发一个 9000 token 的请求，单价完全一样。没有长上下文溢价。

同时还扩容了媒体处理能力：每次请求最多支持 600 张图片或 PDF 页面，是之前的 6 倍。

几个技术亮点：

Adaptive Thinking：模型根据问题复杂度自动调节推理深度
Compaction API：解决长运行 Agent 的上下文腐蚀问题，在不丢信息的前提下压缩历史对话
Terminal-Bench 2.0 排名第一：Agent 编码评估基准测试中，Opus 4.6 拿下榜首

百万上下文不加价，这在 AI 行业是个新标准。Anthropic 的策略很清晰：让开发者放心用长上下文，不需要因为 token 成本而人为截断输入。

NVIDIA GTC 2026：Vera Rubin 平台登场

3 月 16 日（今天），NVIDIA GTC 2026 在圣何塞开幕，Jensen Huang 发表了 2 小时主题演讲。核心发布：

Vera Rubin 平台 正式亮相，这是 Blackwell 的继任者。虽然具体规格还在逐步披露中，但几个信号已经很明确：

Global AI 宣布将在美国部署首批大规模 Vera Rubin 集群
Meta 与 Nebius 的 270 亿美元协议中，明确包含 Vera Rubin 芯片的首批部署
NVIDIA 自己投了 20 亿美元给 Nebius 用于 AI 数据中心建设

另外传闻 NVIDIA 将发布企业级 AI Agent 开源平台 NemoClaw，直接对标 OpenClaw。

超过 3 万人从 190 多个国家赶来参会。AI 芯片这盘棋，NVIDIA 还是牌桌上的庄家。

Meta 砸 270 亿美元买算力

说到那笔钱。

3 月 16 日，Meta 与 Nebius 签署了一份为期 5 年的 AI 基础设施协议，总价值最高 270 亿美元：

120 亿美元专属计算容量
150 亿美元额外可用算力
包含 NVIDIA Vera Rubin 芯片首批大规模部署

加上去年 11 月的 30 亿美元协议，Meta 与 Nebius 的合同总额达到 300 亿美元。Meta 今年的 AI 相关资本支出预算高达 1350 亿美元。

这是什么概念？差不多是 OpenAI 2025 年全年收入的 20 倍。

当一家社交媒体公司每年花 1350 亿美元在 AI 上的时候，你就知道这已经不是"试试看"了。这是 all in。

Yann LeCun 创办 AMI Labs，种子轮融 10 亿

图灵奖得主、前 Meta 首席 AI 科学家 Yann LeCun 在 3 月 10 日正式发布了他的新公司 AMI Labs（Advanced Machine Intelligence Labs）。

种子轮融资 10.3 亿美元，估值 35 亿美元，创下欧洲创业史上最大的种子轮纪录。

投资方阵容豪华：Cathay Innovation、Jeff Bezos 的 Bezos Expeditions、Eric Schmidt、Mark Cuban 等。

AMI Labs 的方向是世界模型（World Models）。LeCun 一直公开表示大语言模型是"死胡同"，认为 AI 不应该只从文本学习，而是应该从现实世界的物理交互中学习。

AMI Labs 要做的，就是证明另一条路可行。

10 亿美元赌一个与整个 LLM 行业对着干的方向。不管结果如何，这份勇气值得尊敬。

Amazon Kiro 翻车：丢了 630 万个订单

这周最震撼的故事不在发布会上，而是在 Amazon 的事故报告里。

时间线：

2025 年 12 月：Amazon 的 AI 编码工具 Kiro 自主决定删除并重建了一套面向客户的 AWS 环境，导致 AWS 中国区宕机 13 小时。
2026 年 3 月 5 日：Amazon.com 主站宕机 6 小时，结账、定价、账户系统全部瘫痪。结果：丢失 630 万个订单。
3 月 10 日：Amazon SVP Dave Treadwell 召开紧急工程会议，宣布 90 天"代码安全重置"。

新政策：所有 AI 辅助代码部署必须有高级工程师签字。这基本上等于说：AI 写的代码，我们不敢直接部署了。

Twitter 上关于这件事的讨论炸了。一条推文拿了 2.67 万赞：“Amazon forced engineers to use AI coding tools, then it lost 6.3 million orders.”

根因分析：问题不是 AI 本身写了烂代码，而是缺乏权限边界、强制代码审查、以及破坏性操作的黑名单机制。换句话说：不是 AI 不行，是人没管好 AI。

这件事应该成为每个使用 AI 编码工具的团队的必修案例。AI 可以写代码，但谁来审代码、谁来批准部署，这些问题不能省。

Netflix 6 亿收购 AI 电影公司

3 月 11 日，Netflix 以最高 6 亿美元收购了 Ben Affleck 创办的 AI 电影制作公司 InterPositive。这是 Netflix 有史以来最大的收购之一。

InterPositive 做的不是"AI 从零生成电影"，而是一种更务实的路线：基于每天实拍的素材训练 AI 模型，辅助后期制作。

功能包括：混色、重新打光、添加视觉效果。关键限制：必须先有实拍素材。AI 不凭空创造，只在真实素材的基础上增强。

同一周，Steven Spielberg 公开表示"不支持 AI 取代创意工作者"。

两条新闻放在一起看很有意思：一边是资本在加速 AI 进入影视产业，一边是行业巨头在划红线。这个拉锯会持续很久。

a16z：2026 年 Top 100 AI 消费应用

a16z 发布了第六版 Gen AI 消费应用排行榜，几个有意思的数据：

ChatGPT 遥遥领先：网页流量是第二名 Gemini 的 2.7 倍，移动 MAU 是 2.5 倍
ChatGPT 周活跃用户过去一年增长 5 亿，达到 9 亿
Claude 付费用户同比增长超过 200%
Gemini 增长 258%
Manus 和 Genspark 首次进入榜单（端到端 AI Agent 平台）
首次将 CapCut、Canva、Notion 等深度集成 AI 的产品纳入统计

9 亿周活，ChatGPT 已经不是一个产品了，它是一个基础设施。但 Claude 200% 的付费增长和 Gemini 258% 的增长也说明：市场远没有定型。

快讯速览

Google Gemini 3.1 Flash-Lite 发布，比 Gemini 2.5 Flash 快 2.5 倍，输入价格仅 $0.25/M tokens。极致性价比。
Andrew Ng 发布 Context Hub：开源工具，给编码 Agent 提供最新 API 文档，解决 Agent 用过时 API 和幻觉参数的问题。
Anthropic 发布 Claude Partner Network，投入 1 亿美元，合作方包括 Accenture、Deloitte 等。Claude 是唯一同时上线 AWS、GCP、Azure 三大云的前沿模型。
DeepSeek V4 仍未发布，多个预期发布窗口已过。万亿参数 MoE 架构，百万 token 上下文，针对华为昇腾芯片优化。等着吧。

本周思考

这周的新闻看下来，有一个共同主题：规模。

百万 token 上下文成了标配。算力投入从十亿变成百亿再变成千亿。AI 应用的周活从百万变成了九亿。

但 Amazon Kiro 事件提醒我们，规模越大，翻车的代价也越大。AI 不是用来无脑 all in 的工具，它是一把需要人来掌控的武器。

用 AI，但管好 AI。

下周见。

本文首发于 aieii.com，一个关注 AI 工具与趋势的中文内容平台。