Gemini 3.0 Pro解析模型基本架构：Transfor

2025-11-19 08:53:15 一哥柚子之旅财经

Gemini 3.0 Pro解析模型基本架构：Transformer，MOE架构，多模态大模型（文本、视觉、音频输入）；使用自研TPU进行训练；Gemini 3.0 Pro基本上在学术、科学、数学、多模态、编程、Agent领域领先学术、科学、数学领域：在Humanity's Last 37.5% > 26.5%（行业最高），GPQA 91.9% > 88.1%（行业最高），MathArena(数学竞赛题目) 23.4% > 1.6%（行业最高），AIME(数学) 95% > 94%（行业最高）；多模态领域：ARC-AGI-2（视觉推理） 31.1% > 17.6%（行业最高），MMMU-Pro（多模态理解与推理）81.0% > 80.8%（行业最高）， ScreenSpot-Pro（屏幕理解）72.7% > 36.2%（行业最高），Video-MMMU（视频获取知识）87.6% > 83.6%（行业最高）；编程领域：LiveCodeBench Pro（编程竞赛）2439 > 2243（行业最高），Terminal-Bench 2.0（Agentic终端编程）54.2% > 47.6%（行业最高），SWE-Bench Verified（Agentic编程）76.2% < 77.2%（行业最高）；Agent领域：Terminal-Bench 2.0（Agentic终端编程）54.2% > 47.6%（行业最高），SWE-Bench Verified（Agentic编程）76.2% < 77.2%（行业最高），t2-bence（Agentic工具使用）85.4% > 84.7%（行业最高），Vending-Bench 2（长任务Agent）5478.16 > 3838.4（行业最高）；我们认为：1）大模型迭代继续，并未达到大模型性能边界，目前基本遵循log函数性能提升；2）多模态领域，Gemini大模型的优势领域继续提升，各参数指标出色，等到具体demo出来的时候会更加惊艳；3）编程领域，纵向来看，Gemini 3.0 pro相比与Gemini 2.5 Pro大幅提升，看出了谷歌在Coding领域的决心；横向来看，Gemini 3.0 Pro编程水平基本上追平Claude Sonnet 4.5，结合谷歌云优势，Gemini大模型API在B端企业的调用有望持续提升。

阅读：0 点赞：0