在近期举办的GTC 2026大会上,相关行业观点引发了市场深思。AI产业的重心正在从“训练模型”向“推理应用”转移,未来每一秒钟、每一次交互,背后都是海量Token的生成与消耗。而近期中国发展高层论坛2026年年会上,国家数据局为Token正式定名——“词元”,并明确相关定位:“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”。中国日均词元调用量在2026年3月已突破140万亿,本年度三个月时间又增长40%以上。
词元产业的应用与发展趋势,或决定了近期半导体周期的发展态势。当市场的焦点还停留在英伟达新一代GPU的市场表现与行业格局时,一个深刻的变化正在发生:推理侧的需求,正以远超训练侧的速度膨胀。这一变化,不仅重塑了AI算力的结构,也有望为中国半导体产业链及科创50相关领域,带来了相应的发展空间。
过去两年,AI算力的核心驱动力是“训练”——巨头们比拼的是谁能用最多的芯片、最快的速度,训练出参数更大的模型。这种模式对芯片的要求近乎苛刻:最先进的制程、最高的单卡算力、CUDA生态应用较为广泛等,英伟达在该阶段占据较高市场应用份额。
但当AI进入应用爆发期,逻辑发生了根本转变。推理,这个将模型能力转化为实际服务的过程,开始占据算力消耗的主导地位。与训练不同,推理场景追求的是“综合成本最低”与“能效比最优”。在一个AI客服、视频平台等规模化的应用场景中,采用高成本的高端GPU开展全部推理任务,经济性与实用性相对有限。这为国产算力提供了重要方向,推理侧的芯片需求呈现出了分层的特征:在金融高频交易、自动驾驶决策等高端场景,对芯片性能要求较高;但在占据绝对多数份额的海量推理场景——比如互联网搜索、内容生成、企业级应用——核心诉求已转变为“够用、便宜、稳定”。而这恰恰是国产芯片通过架构创新(如ASIC、LPU)和成本优化具备发展潜力的领域。
更重要的是,国产芯片的“可用性”正在逐步被验证。众多国产算力厂商产品在FP8算力等关键指标上不断优化提升,且在算力生态上正加速适配国产大模型。当推理需求开始放量,下游应用厂商为了控制成本和保障供应链稳定,倾向于采用性价比更优的国产方案。
免责声明:
本机构撰写的报告,系基于我们认为可靠的或已公开的信息撰写,我们不保证文中数据、资料、观点或陈述不会发生任何变更。在任何情况下,本机构撰写的报告中的数据、资料、观点或所表述的意见,仅供信息分享和参考,并不构成对任何人的投资建议。在任何情况下,我们不对任何人因使用本机构撰写的报告中的任何数据、资料、观点、内容所引致的任何损失负任何责任,阅读者自行承担风险。本机构撰写的报告,主要以电子版形式分发,也会辅以印刷品形式分发,版权均归金证研所有。未经我们同意,不得对报告进行任何有悖原意的引用、删节和修改,不得用于营利或用于未经允许的其它用途。