如果要选一家定义了 2024-2026 年科技行业的公司,不是 OpenAI,不是 Google,是 Nvidia。
原因很简单:不管你用谁的模型,跑在什么云上,底层都是 Nvidia 的 GPU。OpenAI 训练 GPT-5 要买 Nvidia 的卡,Google 训练 Gemini 要买 Nvidia 的卡,就连做开源模型的 Meta 也要排队买 Nvidia 的卡。
而现在,Nvidia 的下一代芯片 Rubin 正式进入全面量产阶段。
Rubin 是什么
先理一下 Nvidia 的 GPU 架构进化线:
| 架构 | 发布年份 | 代表产品 | 定位 |
|---|---|---|---|
| Ampere | 2020 | A100 | AI 训练的起点 |
| Hopper | 2022 | H100 / H200 | AI 训练的标杆 |
| Blackwell | 2024 | B100 / B200 / GB200 | 训练 + 推理融合 |
| Rubin | 2026 | R100 系列 | 推理为王,能效翻倍 |
Rubin 不只是"性能更强"这么简单。它代表了一个战略方向的转变:从"训练为王"到"推理为王"。
过去三年,AI 行业的军备竞赛主要发生在训练端。谁有更多的 H100,谁就能训更大的模型。但到了 2026 年,训练的边际收益开始递减(模型已经够大了),而推理的需求却在爆炸式增长(每个人都在用 AI 产品)。
Rubin 就是为这个拐点设计的。它的推理吞吐量是 Blackwell 的 3 倍,但功耗只增加了 40%。换算成每 token 的成本,Rubin 能把 AI 推理的价格打到 Blackwell 的三分之一。
这意味着什么?意味着你现在用 ChatGPT 付的那些钱,到明年可能只需要三分之一就能得到同样甚至更好的体验。
2159 亿美元的怪兽
Nvidia FY2026(截至 2026 年 1 月)的财报数字是真的离谱:
- 全年营收:2159 亿美元,同比增长 65%
- 数据中心业务:1923 亿美元,占总营收 89%
- 净利润率:超过 55%
做个对比:2024 年全年,Nvidia 的营收是 609 亿美元。两年翻了 3.5 倍。人类商业史上,这个体量的公司以这个速度增长的案例屈指可数。
但更值得关注的是利润率。55% 的净利润率意味着 Nvidia 不只是在卖硬件,它实际上在收"AI 税"。所有想做 AI 的公司,不管大小,都要先给 Nvidia 交一笔钱。
为什么股价反而跌了 20%
这是 2026 年最反直觉的事情之一:Nvidia 创下了史上最强的营收和利润,但股价从高点跌了将近 20%。
原因有几个:
1. “卖预期,买现实”。华尔街的逻辑是:当所有好消息都已经反映在股价里的时候,任何低于"完美"的表现都会被惩罚。Nvidia 的营收虽然在涨,但增速在放缓(从 100%+ 降到 65%),这在华尔街眼里是"不够好"。
2. AI 可持续性焦虑。投资者开始问一个根本性的问题:这些买 GPU 的公司,到底能不能赚回来投入的钱? Microsoft 一年花在 AI 基础设施上的钱超过了 500 亿美元,但 Copilot 的营收还远远覆盖不了这个数字。如果下游的 AI 应用赚不到钱,上游的 GPU 需求迟早会放缓。
3. 竞争开始出现。AMD 的 MI300 系列在推理市场拿到了约 15% 的份额。Google 的 TPU v6 在自家云上已经不输 Nvidia。更关键的是,Nvidia 自己花了 200 亿美元收购了 Groq,这本身就说明推理专用芯片市场是一个真实的威胁。
Groq 收购:200 亿美元的防御
说到 Groq,这笔收购值得单独聊聊。
Groq 不做 GPU,做的是 LPU (Language Processing Unit)。它的设计理念和 GPU 完全不同:GPU 是通用并行计算芯片,什么都能干但什么都不是最优的;LPU 是专门为大模型推理设计的,一个事情做到极致。
Groq 的 LPU 在推理速度上能达到 GPU 的 10-20 倍,延迟低到毫秒级。这在实时对话、自动驾驶决策、金融交易等场景下有巨大的优势。
Nvidia 买 Groq 的逻辑很清楚:与其等着 Groq 成为竞争对手,不如把它收进来当自己的推理引擎。 新的 Groq 3 LPX 推理加速器将和 Rubin 搭配出售,形成"训练用 Rubin,推理用 Groq"的组合拳。
这是 Nvidia 少有的防御性收购。过去十年,Nvidia 几乎没有正经的竞争对手(AMD 从来没真正威胁过它)。但推理市场的特殊需求正在催生一批专用芯片公司,Nvidia 选择了用钱解决问题。
对 AI 行业的连锁反应
Rubin 量产 + Groq 收购,加在一起会带来几个连锁反应:
AI 推理成本将在 12 个月内降低 60-70%。 这意味着更多的 AI 应用可以盈利,更多的公司愿意在产品里嵌入 AI 功能。现在"太贵了做不起"的场景,到 2027 年就会变成"不做不行"。
AI 创业公司的护城河更浅了。 当底层算力变便宜,“我们有大量 GPU"就不再是竞争优势。竞争的焦点会从"谁有更多卡"转向"谁的产品体验更好"和"谁有更多用户数据”。
开源模型会加速追赶闭源模型。 训练成本下降意味着更多的组织和个人能够训练和微调自己的模型。Meta 的 Llama 生态、Mistral、DeepSeek 这些开源选手会从 Rubin 的降成本中受益最多。
黄仁勋的赌注
有人问黄仁勋:你不担心 AI 泡沫破裂吗?
他的回答大意是:“AI 不是泡沫,AI 是电力。你见过电力泡沫破裂吗?”
这个类比很精妙。电力刚出现的时候也经历过一波疯狂投资和泡沫。很多早期的电力公司倒闭了。但电力本身从来没有"破裂"过,它变成了所有行业的基础设施。
Nvidia 赌的就是这个:AI 最终会像电力一样无处不在,而 Nvidia 就是那个卖发电机的。
这个赌注到目前为止是对的。2159 亿美元的营收证明了这一点。但股价下跌 20% 也在提醒一件事:即使方向是对的,速度和节奏也很重要。 市场不会因为你的长期愿景正确就永远给你高估值,它还要看你下个季度的数字。
Rubin 在下半年出货。那将是下一个证明自己的时刻。如果 Rubin 能像 H100 一样供不应求,Nvidia 的故事就还在继续。如果需求没有预期那么强,2159 亿美元可能就是这个周期的顶。
答案不在 Nvidia 手里,在每一个买 GPU 的客户手里。他们用 AI 赚到钱了吗?
这个问题,到今天还没有一个确定的答案。