推理时代地位重塑 2030年全球CPU市场规模将超1300亿美元
2026-05-31 08:05      作者:李玉洋     来源:中国经营网

中经记者 李玉洋 上海报道

CPU或许正在经历一个“爆金币”阶段。

近期,CPU成为科技圈“顶流”——英伟达单独出售CPU、阿里云强调CPU与AI芯片协同,还有两大CPU巨头(Intel+AMD)在今年2—5月对部分CPU系列(尤其服务器和高端消费级)进行了多轮涨价,且都上调市场预期。行业人士分析认为,这是AI从大模型训练转向智能体 (Agentic AI) 推理的必然结果。

《中国经营报》记者注意到,在这轮CPU“爆金币”阶段,英伟达最近的动作具有信号意义:一是英伟达Vera CPU已于5月18日正式完成首批交付,客户包括Anthropic、OpenAI、SpaceX AI(即xAI)和甲骨文云基础设施(OCI);二是英伟达、微软和Arm在台北国际电脑展(COMPUTEX Taipei)前夕预告“PC新时代”的到来,外界猜测英伟达将发布面向消费者的基于Arm架构的CPU。

“主要因为智能体。”行业机构Omdia人工智能首席分析师苏廉节这样解释近期CPU大火的原因。“智能体的绝大部分工作是任务解读、解构、编排和分配,这些工作都是有优先次序的,需要CPU这种串行计算的芯片逻辑。”他说。

这和AMD董事会主席、CEO苏姿丰的观点类似。日前,苏姿丰在上海的AMD AI开发者日表示,AI正在进入Agent时代,Agent需要自主拆解任务、规划步骤、调用外部工具、处理数据、检查结果,这些编排和调度工作全部由CPU完成,GPU只负责其中“调用模型做推理”的环节。在她看来,数据中心里CPU与GPU的配比正在从过去的1:4甚至1:8,向1:1靠拢。

中金证券在最近的一份研报中指出,基于GPU:CPU=1:1配比估计下,测算至2030年全球CPU市场规模将超1300亿美元。

CPU的技术升级趋势

事实上,早在两年多前由芯片大神Jim Keller创办的AI芯片初创Tenstorrent就意识到CPU对于大模型的重要性,只不过他们采用的是RISC-V架构。

根据当时《电子工程专辑》对Tenstorrent首席CPU架构师练维汉的采访,他认为今后AI模型的计算,不只是矩阵型运算,还有很多需要CPU来做,比如大语言模型的存取非常破碎、混乱,而这是CPU最擅长做的。

“大语言模型有所谓的KV cache,它是给语言模型的一个情景,比如说我谈狗的时候,是你的狗还是我的狗?所以说先把token(词元)碰到KV-cache里,它去找聊天记录,像这样的项目非常多,每次开始一个对话,它就做这样的事情。”练维汉表示,这是一种不同寻常的随机存取,所以CPU是个好选择,未来这样的情况预估会越来越多,所以CPU+AI引擎是一种好的异构组合。

苏姿丰认为,服务器CPU的需求大致可分成三类:第一类是传统的通用计算需求,增速相对温和;第二类是作为GPU头节点的CPU,在数据中心的服务器集群里,通常需要CPU来管理和调度旁边的GPU运算,这颗CPU就是“头节点”;第三类是专门为Agent工作流服务的CPU,负责任务编排、数据处理和工具调用。

除了Agentic AI,强化学习(RL)也带来了对CPU需求的提升。比如,英伟达在官方新闻稿中就表示,Vera CPU是全球首款专为Agentic AI和强化学习时代量身打造的处理器。

中信建投在人工智能行业CPU系列报告中提到,强化学习架构中Actor(环境步进、推理调用)100%运行在CPU,Learner(优化器更新)运行在GPU,CPU成为RL训练的核心调度层。

“现在的CPU架构随着摩尔定律持续迭代,就能应付接下来的诉求。大厂都会在CPU里加一些利于推理的计算逻辑。”苏廉节表示,目前大部分的资源都被安排到GPU ,且CPU可以是X86架构,也可以是更节能、更灵活的Arm或是RISC-V架构,生态成熟。

前述中金证券研报指出,从技术发展趋势看,作为新操作系统的“调度器”CPU的升级趋势主要有:一是更强的单核性能来降低单次推理的延迟,二是更大的内存带宽和更强的I/O能力来调度更长的上下文以及管理海量的数据,三是更多核心数据来支持高并发查询及虚拟化。

今年已有近200亿美元的CPU营收

英伟达进军CPU市场的时机,恰逢AI应用从模型训练向推理及智能体范式加速转型。这一趋势已令此前深陷困境的英特尔出现复苏迹象,Arm公司也于今年早些时候亲自下场,推出其史上首款自研CPU芯片,专门面向推理和智能体AI工作。

视角再回到英伟达CPU上。据了解,Vera于今年3月正式发布,是英伟达史上首款独立售卖的CPU产品,采用Arm架构,配备88颗自研的Olympus核心,为编译器、运行时引擎、分析流水线、智能体工具和编排服务提供高性能;采用第二代低功耗内存子系统,该系统基于LPDDR5X内存构建,带宽最高可达1.2 TB/s——与通用CPU相比,带宽提升一倍,功耗降低一半。

在产品形态上,英伟达发布了一款全新的Vera CPU机架,该机架集成了256个液冷式Vera处理器,可支持超过22500个并发CPU环境同时运行;Vera机架基于NVIDIA MGX模块化参考架构打造;也可作为NVIDIA Vera Rubin NVL72平台的一部分,Vera通过NVIDIA NVLink-C2C互连技术与英伟达显卡配对。

此外,英伟达还推出了以Vera作为主机处理器的全新参考设计,用于构建NVIDIA HGX Rubin NVL8系统,Vera系统合作伙伴提供双插槽和单插槽CPU服务器配置;在所有配置下,Vera系统集成了NVIDIA ConnectX SuperNIC网卡和NVIDIA BlueField-4数据处理单元(DPU),以实现加速网络、存储和安全功能。

目前,英伟达Vera 已全面量产,将于今年下半年在合作伙伴处开售。据悉,与英伟达合作部署Vera的头部超大规模云服务商包括阿里云、CoreWeave、Meta和甲骨文云基础设施,还有戴尔科技、慧与、联想、超微等系统制造商。

英伟达首席财务官Colette Kress在最新的财报电话会议上表示,今年在CPU业务上已有近200亿美元的营收可见度,而Vera打开了一个全新的、规模高达2000亿美元的潜在市场。

不少分析师认为,200亿美元这一数字不宜直接与传统CPU营收口径对标,可能源于英伟达以机架为单位而非单颗芯片出售CPU的计价方式。

摩根士丹利分析师Joseph Moore表示,200亿美元的目标将使英伟达“处于市场领导地位的临界点”,而英伟达多年来积累的供应链议价能力和采购优先级,将使其在产能受限的环境下依然保持较强竞争力。

(编辑:吴清 审核:李正豪 校对:陈丽)