note

一、Gemma 4

【大模型开源进展】Google DeepMind 正式发布了其迄今为止最强大的开放模型家族 Gemma 4。该系列基于与 Gemini 3 相同的研究成果和技术构建,专门为高级推理和 Agent 工作流设计,Gemma 4 包含 E2B、E4B、26B-A4B 和 31B Dense 四种尺寸,全面支持跨文本、图像和视频的多模态处理,其中较小尺寸模型(E2B 和 E4B)还原生支持音频输入。
https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
https://developers.googleblog.com/bring-state-of-the-art-agentic-skills-to-the-edge-with-gemma-4/
https://huggingface.co/blog/gemma4

二、模型选择

在这里插入图片描述

三、模型效果

多模态方面,在MMMU pro benchmark上,31B的效果还是很惊艳的:
在这里插入图片描述

综合benchmark对比:
在这里插入图片描述

Reference

[1] Gemma 4 现已发布: 同等规模下性能最强的开放模型
[2] gemma3n模型结构分析

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐