如何评价谷歌正式发布的 Gemini 3?哪些信息值得关注?

AI Summary1 min read

TL;DR

谷歌正式发布Gemini 3系列模型,在推理、多模态和数学基准测试中创下多项纪录,性能全面超越前代。它提供更直接、有洞察力的交互,支持科学、学习和创意任务,并已在多个平台开放预览。

当地时间11月18日,Alphabet旗下的谷歌正式推出Gemini 3系列模型。Gemini 3 Pro已于即日起在Gemini应用、Search AI Mode、AI Studio、Vertex AI以及全新代理式开发平台Google Antigravity中开放预览。性能全面跃升:多项前沿基准测试夺冠 谷歌表示,Gemini 3 Pro在推理与多模态能力上实现了“前所未有的深度与细腻度”,并在几乎所有主流AI基准上全面超越前代2.5 Pro。它以1501 Elo(Elo评分体系,用于衡量模型在盲测对战中的相对实力)的突破性成绩登顶LMArena榜单,在“人类终极考试”(Humanity’s Last Exam)中取得37.5%(无工具)成绩,并在高难度科学推理测试GPQA Diamond中拿下91.9%的顶级表现。 在数学方面,Gemini 3 Pro再次刷新前沿模型记录,以23.4%的成绩夺得MathArena Apex新高,显示出其在结构化逻辑思维与复杂计算上的强势提升。 作为一款完全多模态的基础模型,Gemini 3 Pro在视觉和视频理解同样创下新纪录:多模态大考MMMU-Pro得分81%,视频推理基准Video-MMMU得分87.6%,均创当前SOTA。在强调事实一致性的SimpleQA Verified中,它也以72.1%的成绩领先同类模型。 谷歌称,这些能力意味着Gemini 3 Pro可以在科学、数学、工程等高复杂度任务中提供更可靠的分析与建议,并在日常交互中给出“更直接、更有洞察力”的回应。 除了在多项基准测试中刷新纪录外,Gemini 3 Pro也为每一次交互带来了全新的深度与细腻度。谷歌表示,新模型的回答更加聪明、简洁且直截了当,避免陈词滥调和无谓的恭维,更倾向于提供具有洞见的结论与判断——“告诉你需要知道的,而不是你想听的”。 这一代模型更像一个真正的思考伙伴。它能够帮助用户以全新的方式理解信息和表达观点,例如将晦涩难懂的科学概念转译为高保真的可视化代码,或在创作、规划等场景中进行更具启发性的头脑风暴。谷歌强调,这种“深度交互体验”是Gemini 3 Pro在推理与多模态能力跃升后的自然结果,使其在专业分析与日常创意任务中都表现得更加可靠而富有洞察力。 谷歌同步预览了增强版Gemini 3 Deep Think。该模型进一步突破了智能边界,在Gemini 3的推理和多模态理解能力上实现了阶跃式提升,能够帮助用户解决更为复杂的问题。 Gemini 3 Deep Think在极难测试中再次刷新记录:Humanity’s Last Exam提升至41%(无工具),GPQA Diamond提升至93.8%,并在核心AGI测试ARC-AGI-2(带代码执行、官方验证)中获得前所未有的45.1%。谷歌称该模式代表其在自主推理与新颖任务解决能力上的重大突破。 谷歌表示,Gemini 3的推出只是新一代模型周期的起点。自发布起,Gemini 3已开始在不同产品与平台中分阶段上线: 对于 谷歌同时透露,未来将陆续推出更多Gemini 3系列模型,以扩展其在不同场景下的能力与覆盖范围。“我们期待看到用户使用 Gemini 在学习、构建与规划中解锁更多可能性。” 在发布现场,谷歌展示了一系列基于Gemini 3的实时演示,覆盖学习、构建与视觉分析等核心场景,重点体现其在多模态理解、跨介质推理以及端到端代码生成方面的跃升能力。 Gemini 3生成的生成带有封面与章节导航的数字化家庭食谱电子书 在学习场景的展示中,Gemini 3通过多模态处理能力展现出强大的信息整合能力。谷歌工程师向模型上传了一张带有折痕与油渍的手写家族食谱照片。Gemini 3能够准确识别并翻译不同语言的笔迹,再将内容自动排版,生成带有封面与章节导航的数字化家庭食谱电子书。 Gemini 3生成的RNA聚合酶结构与运动流程等交互式动画截图 随后,演示切换到科研学习场景:面对超40页的PDF学术论文与一段长时教学视频,Gemini 3一次性提取核心理论,生成变量关系图,并编写可执行的可视化代码,实时绘制出如RNA聚合酶结构与运动流程等交互式动画,同时自动产出可点击的学习闪卡与结构化学习指南。 Gemini 3在运动训练中展示其视觉理解与动作分析能力 在运动训练演示中,Gemini 3则展示其视觉理解与动作分析能力。模型对一段匹克球比赛视频进行逐帧解析,在画面中叠加挥拍角度轨迹、移动路径热力图以及失误动作标注,并基于分析结果给出专业训练建议与改进计划,类似一位具备视频分析能力的体育教练。谷歌全新AI模型Gemini 3发布:宣称“全球最智能模型”,多项基准登顶_腾讯新闻

Visit Website