新一代大模型Gemini 3自11月18日发布以来,由于前端开发和多模态理解两项功能的显著进步,横扫各大基准测试,频繁登上各大排行榜的榜首,获得业界好评。
Gemini 3显著提升的模型能力将利好Agent、AI科研、AI编程等AI应用方向。当前国内外头部模型厂商陆续迭代AI大模型产品,随着全球科技企业在大模型领域的竞争持续白热化,AI应用商业化加速推进。
从各方反馈来看,Gemini 3的强化主要在于前端开发方面几乎实现零代码的AI编程,向GPT靠齐的文风和几乎10倍于GPT的推理速度,以及视觉理解与推理的多模态能力。在LMArena排行榜上,Gemini 3以1501分登顶。在考察研究生水平科学问题理解能力的GPQA Diamond基准测试中,其得分高达91.9%。此外,在专门考察高难度数学问题求解的MathArena Apex测试中,Gemini 3取得了23.4%的成绩,刷新了前沿模型在这一领域的纪录。需要注意的是,Gemini 3仍存在幻觉,Agent能力相对不足,尚难以真正应用于生产与工作,但已在智能体能力上实现了飞跃。
此外,Gemini 3可以流畅引用搜索引擎的数据源,使用TPU(面向人工智能计算场景开发的专用芯片)的优势显著。Gemini 3的训练可以全部或大部分使用TPU专用芯片,随着部分厂商转用TPU,市场预期包含算力租赁在内的云业务或将持续高速增长。
Gemini 3在大模型层面的突破,同时也显示了TPU和搜索引擎的价值,加强了云和搜索业务的基本面,证明了硬件-技术-生态全栈能力的意义。与国外类似,国内互联网大厂依托较为完善的应用生态,通过加大投入或紧密合作补足大模型能力,正在加速AI产品化与商业化,具备AI技术落地与应用场景适配的头部企业。
免责声明:
本机构撰写的报告,系基于我们认为可靠的或已公开的信息撰写,我们不保证文中数据、资料、观点或陈述不会发生任何变更。在任何情况下,本机构撰写的报告中的数据、资料、观点或所表述的意见,仅供信息分享和参考,并不构成对任何人的投资建议。在任何情况下,我们不对任何人因使用本机构撰写的报告中的任何数据、资料、观点、内容所引致的任何损失负任何责任,阅读者自行承担风险。本机构撰写的报告,主要以电子版形式分发,也会辅以印刷品形式分发,版权均归金证研所有。未经我们同意,不得对报告进行任何有悖原意的引用、删节和修改,不得用于营利或用于未经允许的其它用途。