大语言模型推理成本持续下降 AI应用终端的爆发或加速到来

北京时间1月28日凌晨,DeepSeek团队正式发布两款多模态框架——Janus-Pro和Janus Flow,引起资本市场的强烈关注。

而据华尔街见闻消息,1月20日DeepSeek-R1模型正式发布以来,上线18天累计下载量已突破1600万次,DeepSeek的火爆引起了AI行业内外的广泛讨论。

为什么DeepSeek这么火爆?其中包括两种优势,首先是性能和成本。1月24日,在国外大模型排名Arena上,DeepSeek-R1基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与OpenAI o1并列第一,综合排名得分达到1357分,略超OpenAI o1的1352分 。而其API服务定价极具性价比,仅为竞品的4%。

第二是开源模式,DeepSeek采用开源模式,这种开源模式不仅是技术的共享,更是一种生态理念的创新,它构建了一个全球开发者共同参与的良性循环,加速了技术的迭代和应用场景的拓展。极大地激发了AI生态的活力,也让DeepSeek的影响力迅速扩散。

DeepSeek大热,香港科技板块受益明显。据万得数据,春节假期A股休市期间(1月28日至2月4日),恒生科技指数累计上涨6.19%。

恒生科技指数相较美国科技资产而言估值更有优势,在国产科技爆发时或受益境内外资产的双重加持。

根据经济学的“杰文斯悖论”现象,技术进步或大大降低了资源使用成本,从而刺激资源需求的快速增长。随着DeepSeek等大型语言模型推出的模型推理成本越来越低,AI应用终端的爆发或加速到来。

据万得数据,截至2025年2月4日,恒生科技指数的前5大行业分别(恒生三级行业分类)为:线上零售商、电讯设备、汽车、互动媒体及服务、数码解决方案服务,主要涉及智能手机、AI PC、智能穿戴设备、车载信息系统等主要终端设备,以及线上消费、汽车、游戏、教育等AI应用场景,国产大模型对相关应用端的赋能或促进相关AI应用生态的蓬勃发展。

 

猜你喜欢