贝果

推理时代地位重塑 2030年全球CPU市场规模将超1300亿美元

2026-05-31 08:05 作者：李玉洋来源：中国经营网

中经记者李玉洋上海报道

CPU或许正在经历一个“爆金币”阶段。

近期，CPU成为科技圈“顶流”——英伟达单独出售CPU、阿里云强调CPU与AI芯片协同，还有两大CPU巨头（Intel+AMD）在今年2—5月对部分CPU系列（尤其服务器和高端消费级）进行了多轮涨价，且都上调市场预期。行业人士分析认为，这是AI从大模型训练转向智能体 (Agentic AI) 推理的必然结果。

《中国经营报》记者注意到，在这轮CPU“爆金币”阶段，英伟达最近的动作具有信号意义：一是英伟达Vera CPU已于5月18日正式完成首批交付，客户包括Anthropic、OpenAI、SpaceX AI（即xAI）和甲骨文云基础设施（OCI）；二是英伟达、微软和Arm在台北国际电脑展（COMPUTEX Taipei）前夕预告“PC新时代”的到来，外界猜测英伟达将发布面向消费者的基于Arm架构的CPU。

“主要因为智能体。”行业机构Omdia人工智能首席分析师苏廉节这样解释近期CPU大火的原因。“智能体的绝大部分工作是任务解读、解构、编排和分配，这些工作都是有优先次序的，需要CPU这种串行计算的芯片逻辑。”他说。

这和AMD董事会主席、CEO苏姿丰的观点类似。日前，苏姿丰在上海的AMD AI开发者日表示，AI正在进入Agent时代，Agent需要自主拆解任务、规划步骤、调用外部工具、处理数据、检查结果，这些编排和调度工作全部由CPU完成，GPU只负责其中“调用模型做推理”的环节。在她看来，数据中心里CPU与GPU的配比正在从过去的1:4甚至1:8，向1:1靠拢。

中金证券在最近的一份研报中指出，基于GPU:CPU=1:1配比估计下，测算至2030年全球CPU市场规模将超1300亿美元。

CPU的技术升级趋势

事实上，早在两年多前由芯片大神Jim Keller创办的AI芯片初创Tenstorrent就意识到CPU对于大模型的重要性，只不过他们采用的是RISC-V架构。

根据当时《电子工程专辑》对Tenstorrent首席CPU架构师练维汉的采访，他认为今后AI模型的计算，不只是矩阵型运算，还有很多需要CPU来做，比如大语言模型的存取非常破碎、混乱，而这是CPU最擅长做的。

“大语言模型有所谓的KV cache，它是给语言模型的一个情景，比如说我谈狗的时候，是你的狗还是我的狗？所以说先把token（词元）碰到KV-cache里，它去找聊天记录，像这样的项目非常多，每次开始一个对话，它就做这样的事情。”练维汉表示，这是一种不同寻常的随机存取，所以CPU是个好选择，未来这样的情况预估会越来越多，所以CPU＋AI引擎是一种好的异构组合。

苏姿丰认为，服务器CPU的需求大致可分成三类：第一类是传统的通用计算需求，增速相对温和；第二类是作为GPU头节点的CPU，在数据中心的服务器集群里，通常需要CPU来管理和调度旁边的GPU运算，这颗CPU就是“头节点”；第三类是专门为Agent工作流服务的CPU，负责任务编排、数据处理和工具调用。

除了Agentic AI，强化学习(RL)也带来了对CPU需求的提升。比如，英伟达在官方新闻稿中就表示，Vera CPU是全球首款专为Agentic AI和强化学习时代量身打造的处理器。

中信建投在人工智能行业CPU系列报告中提到，强化学习架构中Actor（环境步进、推理调用）100%运行在CPU，Learner（优化器更新）运行在GPU，CPU成为RL训练的核心调度层。

“现在的CPU架构随着摩尔定律持续迭代，就能应付接下来的诉求。大厂都会在CPU里加一些利于推理的计算逻辑。”苏廉节表示，目前大部分的资源都被安排到GPU ，且CPU可以是X86架构，也可以是更节能、更灵活的Arm或是RISC-V架构，生态成熟。

前述中金证券研报指出，从技术发展趋势看，作为新操作系统的“调度器”CPU的升级趋势主要有：一是更强的单核性能来降低单次推理的延迟，二是更大的内存带宽和更强的I/O能力来调度更长的上下文以及管理海量的数据，三是更多核心数据来支持高并发查询及虚拟化。

今年已有近200亿美元的CPU营收

英伟达进军CPU市场的时机，恰逢AI应用从模型训练向推理及智能体范式加速转型。这一趋势已令此前深陷困境的英特尔出现复苏迹象，Arm公司也于今年早些时候亲自下场，推出其史上首款自研CPU芯片，专门面向推理和智能体AI工作。

视角再回到英伟达CPU上。据了解，Vera于今年3月正式发布，是英伟达史上首款独立售卖的CPU产品，采用Arm架构，配备88颗自研的Olympus核心，为编译器、运行时引擎、分析流水线、智能体工具和编排服务提供高性能；采用第二代低功耗内存子系统，该系统基于LPDDR5X内存构建，带宽最高可达1.2 TB/s——与通用CPU相比，带宽提升一倍，功耗降低一半。

在产品形态上，英伟达发布了一款全新的Vera CPU机架，该机架集成了256个液冷式Vera处理器，可支持超过22500个并发CPU环境同时运行；Vera机架基于NVIDIA MGX模块化参考架构打造；也可作为NVIDIA Vera Rubin NVL72平台的一部分，Vera通过NVIDIA NVLink-C2C互连技术与英伟达显卡配对。

此外，英伟达还推出了以Vera作为主机处理器的全新参考设计，用于构建NVIDIA HGX Rubin NVL8系统，Vera系统合作伙伴提供双插槽和单插槽CPU服务器配置；在所有配置下，Vera系统集成了NVIDIA ConnectX SuperNIC网卡和NVIDIA BlueField-4数据处理单元（DPU），以实现加速网络、存储和安全功能。

目前，英伟达Vera 已全面量产，将于今年下半年在合作伙伴处开售。据悉，与英伟达合作部署Vera的头部超大规模云服务商包括阿里云、CoreWeave、Meta和甲骨文云基础设施，还有戴尔科技、慧与、联想、超微等系统制造商。

英伟达首席财务官Colette Kress在最新的财报电话会议上表示，今年在CPU业务上已有近200亿美元的营收可见度，而Vera打开了一个全新的、规模高达2000亿美元的潜在市场。

不少分析师认为，200亿美元这一数字不宜直接与传统CPU营收口径对标，可能源于英伟达以机架为单位而非单颗芯片出售CPU的计价方式。

摩根士丹利分析师Joseph Moore表示，200亿美元的目标将使英伟达“处于市场领导地位的临界点”，而英伟达多年来积累的供应链议价能力和采购优先级，将使其在产能受限的环境下依然保持较强竞争力。

（编辑：吴清审核：李正豪校对：陈丽）