华创证券:Token推理大爆发 国产算力再迎海量需求
时间: 2026-03-03 16:37作者: 殊彦智通财经APP获悉,华创证券发布研报称,Token消耗量的指数级攀升,更深层次的驱动力是用户对AI使用模式的根本性转变。算力需求持续扩张正直接拉动算力芯片需求增长,中国GPU产业进入高景气放量阶段。推理负载常态化意味着算力需求从“周期性训练投入”转向“持续性推理消耗”,算力芯片产业价值中枢呈现系统性上移趋势。在推理负载常态化与海外高端算力供给受限背景下,供给端弹性不足与国产替代加速形成共振,产业利润有望向芯片设计与核心算力环节集中。
华创证券主要观点如下:
事件:2026年2月9日至15日,OpenRouter数据显示,中国模型以4.12万亿Token的调用量,首次超过同期美国模型的2.94万亿Token。2月16日至22日,平台调用量排名前五的模型中,有四款来自中国厂商,分别为MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5以及DeepSeek的V3.2。这四款模型合计贡献了Top5总调用量的85.7%。
需求端:算力芯片进入高负载常态化阶段
Token消耗量的指数级攀升,表面看是用户规模与使用时长的增长,但其背后更深层次的驱动力,是用户对AI使用模式的根本性转变。AI的角色正在从一个提供简单信息、进行日常闲聊的“问答工具”,进化为能够深度参与工作流、处理复杂任务的“生产力工具”。
英伟达CEO黄仁勋指出,没有算力,就无法生成Token;没有Token,就无法带来收入增长。算力需求的持续扩张正直接拉动算力芯片需求增长,中国GPU产业进入高景气放量阶段,弗若斯特沙利文预测,中国AI计算加速芯片市场规模将从2024年的1,425.37亿元增至2029年的13,367.92亿元,年均复合增长率为53.7%。
从细分市场上看,GPU的市场增长速度最快,其市场份额预计将从2024年的69.9%进一步提升至2029年的77.3%,市场规模达到10,333.40亿元。整体来看,推理负载常态化意味着算力需求从“周期性训练投入”转向“持续性推理消耗”,算力芯片产业价值中枢呈现系统性上移趋势。
供给端:海外约束强化与国产替代能力增强
1)海外供应紧张:政策限制叠加产能瓶颈,供给弹性持续受限。据环球网援引市场报道,美国商务部表示,自批准对华出口AI芯片两个月以来,英伟达仍尚未向中国售出任何H200芯片。今年1月,美国商务部虽发布新规放宽H200芯片对华出口限制,但美国国务院坚持推动更严格的出口限制。多重不确定性之下,中国客户在许可条件不明朗前未向英伟达下达订单。
在政策扰动之外,全球算力硬件本身亦处于结构性紧平衡状态,目前数据中心GPU的交付周期目前为36至52周。综合来看,短期供给弹性难以有效释放,交付周期拉长成为常态,海外算力供给缺口或将持续存在,为国产算力替代与本土供应链加速完善创造窗口期。
2)国产芯片替代能力增强:性能与商业化同步跃迁。Token消耗量持续增长本质反映大模型推理调用频次与负载强度同步提升,而FP8指标成为下一代算力标准,本质是通过一定精度牺牲,获得更大算力综合性能。2月12日,摩尔线程首度公开S5000单卡FP8算力突破1000TFLOPS,训练精度紧咬英伟达H100,差距不到1%。
国产芯片积极推进生态适配,自2025年12月至2026年3月,沐曦股份C500/C550已逐步适配腾讯混元图像3.0、阶跃星辰Step3.5flash、智谱GLM-5等多家国产大模型。随着模型适配能力持续完善,国产GPU正由技术可用迈向规模可用,2月27日,寒武纪、摩尔线程与沐曦股份相继发布2025年度业绩快报,三家企业均实现了三位数的营业收入增长,其中寒武纪首度实现年度扭亏为盈。
整体来看,国产GPU在算力密度、生态适配与商业兑现三个维度同步突破,国产算力芯片正逐步实现规模化替代。
标的方面
建议关注:(1)芯片设计:寒武纪(688256.SH)、海光信息(688041.SH)、沐曦股份(688802.SH)、摩尔线程(688795.SH)、天数智芯(09903);(2)芯片代工:中芯国际(688981.SH)、华虹公司(688347.SH)/华虹半导体(01347);(3)服务器及配套:浪潮信息(000977.SZ)、华丰科技(688629.SH)。
风险提示
下游需求不及预期、国产替代进展不及预期、代工供应风险。