Nvidia Rubin 全面量产: AI 算力的下一个十年

AIEII

如果要选一家定义了 2024-2026 年科技行业的公司，不是 OpenAI，不是 Google，是 Nvidia。

原因很简单：不管你用谁的模型，跑在什么云上，底层都是 Nvidia 的 GPU。OpenAI 训练 GPT-5 要买 Nvidia 的卡，Google 训练 Gemini 要买 Nvidia 的卡，就连做开源模型的 Meta 也要排队买 Nvidia 的卡。

而现在，Nvidia 的下一代芯片 Rubin 正式进入全面量产阶段。

Rubin 是什么

先理一下 Nvidia 的 GPU 架构进化线：

架构	发布年份	代表产品	定位
Ampere	2020	A100	AI 训练的起点
Hopper	2022	H100 / H200	AI 训练的标杆
Blackwell	2024	B100 / B200 / GB200	训练 + 推理融合
Rubin	2026	R100 系列	推理为王，能效翻倍

Rubin 不只是"性能更强"这么简单。它代表了一个战略方向的转变：从"训练为王"到"推理为王"。

过去三年，AI 行业的军备竞赛主要发生在训练端。谁有更多的 H100，谁就能训更大的模型。但到了 2026 年，训练的边际收益开始递减（模型已经够大了），而推理的需求却在爆炸式增长（每个人都在用 AI 产品）。

Rubin 就是为这个拐点设计的。它的推理吞吐量是 Blackwell 的 3 倍，但功耗只增加了 40%。换算成每 token 的成本，Rubin 能把 AI 推理的价格打到 Blackwell 的三分之一。

这意味着什么？意味着你现在用 ChatGPT 付的那些钱，到明年可能只需要三分之一就能得到同样甚至更好的体验。

2159 亿美元的怪兽

Nvidia FY2026（截至 2026 年 1 月）的财报数字是真的离谱：

全年营收：2159 亿美元，同比增长 65%
数据中心业务：1923 亿美元，占总营收 89%
净利润率：超过 55%

做个对比：2024 年全年，Nvidia 的营收是 609 亿美元。两年翻了 3.5 倍。人类商业史上，这个体量的公司以这个速度增长的案例屈指可数。

但更值得关注的是利润率。55% 的净利润率意味着 Nvidia 不只是在卖硬件，它实际上在收"AI 税"。所有想做 AI 的公司，不管大小，都要先给 Nvidia 交一笔钱。

为什么股价反而跌了 20%

这是 2026 年最反直觉的事情之一：Nvidia 创下了史上最强的营收和利润，但股价从高点跌了将近 20%。

原因有几个：

1. “卖预期，买现实”。华尔街的逻辑是：当所有好消息都已经反映在股价里的时候，任何低于"完美"的表现都会被惩罚。Nvidia 的营收虽然在涨，但增速在放缓（从 100%+ 降到 65%），这在华尔街眼里是"不够好"。

2. AI 可持续性焦虑。投资者开始问一个根本性的问题：这些买 GPU 的公司，到底能不能赚回来投入的钱？ Microsoft 一年花在 AI 基础设施上的钱超过了 500 亿美元，但 Copilot 的营收还远远覆盖不了这个数字。如果下游的 AI 应用赚不到钱，上游的 GPU 需求迟早会放缓。

3. 竞争开始出现。AMD 的 MI300 系列在推理市场拿到了约 15% 的份额。Google 的 TPU v6 在自家云上已经不输 Nvidia。更关键的是，Nvidia 自己花了 200 亿美元收购了 Groq，这本身就说明推理专用芯片市场是一个真实的威胁。

Groq 收购：200 亿美元的防御

说到 Groq，这笔收购值得单独聊聊。

Groq 不做 GPU，做的是 LPU (Language Processing Unit)。它的设计理念和 GPU 完全不同：GPU 是通用并行计算芯片，什么都能干但什么都不是最优的；LPU 是专门为大模型推理设计的，一个事情做到极致。

Groq 的 LPU 在推理速度上能达到 GPU 的 10-20 倍，延迟低到毫秒级。这在实时对话、自动驾驶决策、金融交易等场景下有巨大的优势。

Nvidia 买 Groq 的逻辑很清楚：与其等着 Groq 成为竞争对手，不如把它收进来当自己的推理引擎。 新的 Groq 3 LPX 推理加速器将和 Rubin 搭配出售，形成"训练用 Rubin，推理用 Groq"的组合拳。

这是 Nvidia 少有的防御性收购。过去十年，Nvidia 几乎没有正经的竞争对手（AMD 从来没真正威胁过它）。但推理市场的特殊需求正在催生一批专用芯片公司，Nvidia 选择了用钱解决问题。

对 AI 行业的连锁反应

Rubin 量产 + Groq 收购，加在一起会带来几个连锁反应：

AI 推理成本将在 12 个月内降低 60-70%。 这意味着更多的 AI 应用可以盈利，更多的公司愿意在产品里嵌入 AI 功能。现在"太贵了做不起"的场景，到 2027 年就会变成"不做不行"。

AI 创业公司的护城河更浅了。 当底层算力变便宜，“我们有大量 GPU"就不再是竞争优势。竞争的焦点会从"谁有更多卡"转向"谁的产品体验更好"和"谁有更多用户数据”。

开源模型会加速追赶闭源模型。 训练成本下降意味着更多的组织和个人能够训练和微调自己的模型。Meta 的 Llama 生态、Mistral、DeepSeek 这些开源选手会从 Rubin 的降成本中受益最多。

黄仁勋的赌注

有人问黄仁勋：你不担心 AI 泡沫破裂吗？

他的回答大意是：“AI 不是泡沫，AI 是电力。你见过电力泡沫破裂吗？”

这个类比很精妙。电力刚出现的时候也经历过一波疯狂投资和泡沫。很多早期的电力公司倒闭了。但电力本身从来没有"破裂"过，它变成了所有行业的基础设施。

Nvidia 赌的就是这个：AI 最终会像电力一样无处不在，而 Nvidia 就是那个卖发电机的。

这个赌注到目前为止是对的。2159 亿美元的营收证明了这一点。但股价下跌 20% 也在提醒一件事：即使方向是对的，速度和节奏也很重要。 市场不会因为你的长期愿景正确就永远给你高估值，它还要看你下个季度的数字。

Rubin 在下半年出货。那将是下一个证明自己的时刻。如果 Rubin 能像 H100 一样供不应求，Nvidia 的故事就还在继续。如果需求没有预期那么强，2159 亿美元可能就是这个周期的顶。

答案不在 Nvidia 手里，在每一个买 GPU 的客户手里。他们用 AI 赚到钱了吗？

这个问题，到今天还没有一个确定的答案。