(网经社讯)11月24日消息,谷歌近日正式推出新一代多模态大模型Gemini 3系列,其中旗舰机型Gemini 3 Pro率先面向用户开放。该模型采用原生多模态架构,能够同步处理文本、图像、音频等多类型信息,在多项基准测试中展现出突破性性能。其以1501的Elo分数登顶LMArena排行榜,在"人类最终考试"中取得37.5%的成绩,展现出博士级别的推理能力。
据网经社产业电商台(B2B.100EC.CN)获悉,在专业领域测试中,Gemini 3 Pro表现卓越:GPQA Diamond测试获得91.9%的分数,MathArena Apex测试达到23.4%的新高。多模态方面,MMMU-Pro测试正确率达81%,Video-MMMU测试达87.6%,重新定义了多模态推理的标准。其升级版Gemini 3 Deep Think表现更为突出,在GPQA Diamond测试中进一步提升至93.8%。
该模型具备强大的实际应用能力。用户可通过它完成复杂任务,如解读多语言手写食谱并生成可分享的电子版,或通过分析运动视频提供训练建议。在编程领域,Gemini 3以1487的Elo分数位列WebDev Arena榜首,Terminal-Bench 2.0测试达到54.2%,展现出卓越的代码生成和计算机操作能力。
同步推出的图像模型Nano Banana Pro(基于Gemini 3 Pro构建)支持4K分辨率图像生成与多轮编辑。它能根据文本提示生成太阳系示意图等复杂图表,并实现专业级的图像编辑功能,如将生活照转换为正装肖像。该模型在文本渲染精度和视觉一致性方面均有显著提升。
目前,开发者可通过Google AI Studio、Vertex AI等平台使用Gemini 3系列模型,该系列也适用于Cursor、GitHub等第三方开发环境。企业用户可通过Vertex AI和Gemini Enterprise获取服务。








































