【MLLM】Gemma 4模型简介和选择
·
note
一、Gemma 4
【大模型开源进展】Google DeepMind 正式发布了其迄今为止最强大的开放模型家族 Gemma 4。该系列基于与 Gemini 3 相同的研究成果和技术构建,专门为高级推理和 Agent 工作流设计,Gemma 4 包含 E2B、E4B、26B-A4B 和 31B Dense 四种尺寸,全面支持跨文本、图像和视频的多模态处理,其中较小尺寸模型(E2B 和 E4B)还原生支持音频输入。
https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
https://developers.googleblog.com/bring-state-of-the-art-agentic-skills-to-the-edge-with-gemma-4/
https://huggingface.co/blog/gemma4
二、模型选择

三、模型效果
多模态方面,在MMMU pro benchmark上,31B的效果还是很惊艳的:
综合benchmark对比:
Reference
更多推荐



所有评论(0)