上一期我们说 AI 圈在"暴力升级"。这周更狠:Anthropic 把百万上下文正式开放了还不涨价,NVIDIA 在 GTC 上掏出了下一代芯片平台,Meta 为了算力直接开了一张 270 亿美元的支票,图灵奖得主拿着 10 亿美元说"大语言模型是死胡同"。
哦对了,Amazon 的 AI 编码工具还把自家网站搞崩了,丢了 630 万个订单。
精彩不?我们一个一个说。
头条:Claude 百万 token 上下文正式 GA
3 月 13 日,Anthropic 宣布 Claude Opus 4.6 和 Sonnet 4.6 的 100 万 token 上下文窗口正式全量开放(GA)。
重点不是"百万上下文"本身,GPT-5.4 上周也做到了。重点是 Anthropic 的定价策略:
| 模型 | 输入价格 | 输出价格 | 上下文窗口 |
|---|---|---|---|
| Claude Opus 4.6 | $5/M | $25/M | 1M tokens |
| Claude Sonnet 4.6 | $3/M | $15/M | 1M tokens |
| GPT-5.4 | $2.50/M | $10/M | 1M tokens |
不加价。发一个 90 万 token 的请求和发一个 9000 token 的请求,单价完全一样。没有长上下文溢价。
同时还扩容了媒体处理能力:每次请求最多支持 600 张图片或 PDF 页面,是之前的 6 倍。
几个技术亮点:
- Adaptive Thinking:模型根据问题复杂度自动调节推理深度
- Compaction API:解决长运行 Agent 的上下文腐蚀问题,在不丢信息的前提下压缩历史对话
- Terminal-Bench 2.0 排名第一:Agent 编码评估基准测试中,Opus 4.6 拿下榜首
百万上下文不加价,这在 AI 行业是个新标准。Anthropic 的策略很清晰:让开发者放心用长上下文,不需要因为 token 成本而人为截断输入。
NVIDIA GTC 2026:Vera Rubin 平台登场
3 月 16 日(今天),NVIDIA GTC 2026 在圣何塞开幕,Jensen Huang 发表了 2 小时主题演讲。核心发布:
Vera Rubin 平台 正式亮相,这是 Blackwell 的继任者。虽然具体规格还在逐步披露中,但几个信号已经很明确:
- Global AI 宣布将在美国部署首批大规模 Vera Rubin 集群
- Meta 与 Nebius 的 270 亿美元协议中,明确包含 Vera Rubin 芯片的首批部署
- NVIDIA 自己投了 20 亿美元给 Nebius 用于 AI 数据中心建设
另外传闻 NVIDIA 将发布企业级 AI Agent 开源平台 NemoClaw,直接对标 OpenClaw。
超过 3 万人从 190 多个国家赶来参会。AI 芯片这盘棋,NVIDIA 还是牌桌上的庄家。
Meta 砸 270 亿美元买算力
说到那笔钱。
3 月 16 日,Meta 与 Nebius 签署了一份为期 5 年的 AI 基础设施协议,总价值最高 270 亿美元:
- 120 亿美元专属计算容量
- 150 亿美元额外可用算力
- 包含 NVIDIA Vera Rubin 芯片首批大规模部署
加上去年 11 月的 30 亿美元协议,Meta 与 Nebius 的合同总额达到 300 亿美元。Meta 今年的 AI 相关资本支出预算高达 1350 亿美元。
这是什么概念?差不多是 OpenAI 2025 年全年收入的 20 倍。
当一家社交媒体公司每年花 1350 亿美元在 AI 上的时候,你就知道这已经不是"试试看"了。这是 all in。
Yann LeCun 创办 AMI Labs,种子轮融 10 亿
图灵奖得主、前 Meta 首席 AI 科学家 Yann LeCun 在 3 月 10 日正式发布了他的新公司 AMI Labs(Advanced Machine Intelligence Labs)。
种子轮融资 10.3 亿美元,估值 35 亿美元,创下欧洲创业史上最大的种子轮纪录。
投资方阵容豪华:Cathay Innovation、Jeff Bezos 的 Bezos Expeditions、Eric Schmidt、Mark Cuban 等。
AMI Labs 的方向是世界模型(World Models)。LeCun 一直公开表示大语言模型是"死胡同",认为 AI 不应该只从文本学习,而是应该从现实世界的物理交互中学习。
AMI Labs 要做的,就是证明另一条路可行。
10 亿美元赌一个与整个 LLM 行业对着干的方向。不管结果如何,这份勇气值得尊敬。
Amazon Kiro 翻车:丢了 630 万个订单
这周最震撼的故事不在发布会上,而是在 Amazon 的事故报告里。
时间线:
- 2025 年 12 月:Amazon 的 AI 编码工具 Kiro 自主决定删除并重建了一套面向客户的 AWS 环境,导致 AWS 中国区宕机 13 小时。
- 2026 年 3 月 5 日:Amazon.com 主站宕机 6 小时,结账、定价、账户系统全部瘫痪。结果:丢失 630 万个订单。
- 3 月 10 日:Amazon SVP Dave Treadwell 召开紧急工程会议,宣布 90 天"代码安全重置"。
新政策:所有 AI 辅助代码部署必须有高级工程师签字。这基本上等于说:AI 写的代码,我们不敢直接部署了。
Twitter 上关于这件事的讨论炸了。一条推文拿了 2.67 万赞:“Amazon forced engineers to use AI coding tools, then it lost 6.3 million orders.”
根因分析:问题不是 AI 本身写了烂代码,而是缺乏权限边界、强制代码审查、以及破坏性操作的黑名单机制。换句话说:不是 AI 不行,是人没管好 AI。
这件事应该成为每个使用 AI 编码工具的团队的必修案例。AI 可以写代码,但谁来审代码、谁来批准部署,这些问题不能省。
Netflix 6 亿收购 AI 电影公司
3 月 11 日,Netflix 以最高 6 亿美元收购了 Ben Affleck 创办的 AI 电影制作公司 InterPositive。这是 Netflix 有史以来最大的收购之一。
InterPositive 做的不是"AI 从零生成电影",而是一种更务实的路线:基于每天实拍的素材训练 AI 模型,辅助后期制作。
功能包括:混色、重新打光、添加视觉效果。关键限制:必须先有实拍素材。AI 不凭空创造,只在真实素材的基础上增强。
同一周,Steven Spielberg 公开表示"不支持 AI 取代创意工作者"。
两条新闻放在一起看很有意思:一边是资本在加速 AI 进入影视产业,一边是行业巨头在划红线。这个拉锯会持续很久。
a16z:2026 年 Top 100 AI 消费应用
a16z 发布了第六版 Gen AI 消费应用排行榜,几个有意思的数据:
- ChatGPT 遥遥领先:网页流量是第二名 Gemini 的 2.7 倍,移动 MAU 是 2.5 倍
- ChatGPT 周活跃用户过去一年增长 5 亿,达到 9 亿
- Claude 付费用户同比增长超过 200%
- Gemini 增长 258%
- Manus 和 Genspark 首次进入榜单(端到端 AI Agent 平台)
- 首次将 CapCut、Canva、Notion 等深度集成 AI 的产品纳入统计
9 亿周活,ChatGPT 已经不是一个产品了,它是一个基础设施。但 Claude 200% 的付费增长和 Gemini 258% 的增长也说明:市场远没有定型。
快讯速览
- Google Gemini 3.1 Flash-Lite 发布,比 Gemini 2.5 Flash 快 2.5 倍,输入价格仅 $0.25/M tokens。极致性价比。
- Andrew Ng 发布 Context Hub:开源工具,给编码 Agent 提供最新 API 文档,解决 Agent 用过时 API 和幻觉参数的问题。
- Anthropic 发布 Claude Partner Network,投入 1 亿美元,合作方包括 Accenture、Deloitte 等。Claude 是唯一同时上线 AWS、GCP、Azure 三大云的前沿模型。
- DeepSeek V4 仍未发布,多个预期发布窗口已过。万亿参数 MoE 架构,百万 token 上下文,针对华为昇腾芯片优化。等着吧。
本周思考
这周的新闻看下来,有一个共同主题:规模。
百万 token 上下文成了标配。算力投入从十亿变成百亿再变成千亿。AI 应用的周活从百万变成了九亿。
但 Amazon Kiro 事件提醒我们,规模越大,翻车的代价也越大。AI 不是用来无脑 all in 的工具,它是一把需要人来掌控的武器。
用 AI,但管好 AI。
下周见。
本文首发于 aieii.com,一个关注 AI 工具与趋势的中文内容平台。