Google 发布了最新的开放权重模型 Gemma 4,上个版本 Gemma 3 是在一年前发布的。Gemma 4 有四个版本,设计能在本地设备上运行:参数多的两个版本 26B Mixture of Experts 和 31B Dense 设计能在 80GB Nvidia H100 GPU(售价约 20 万人民币)上以 bfloat16 格式未量化运行,量化后降低精度则能使用消费级 GPU;参数少的两个版本 Effective 2B (E2B) 和 Effective 4B (E4B)设计能在移动设备上运行。Google 称它的 Pixel 团队与高通和联发科密切合作,为智能手机、Raspberry Pi 和 Jetson Nano 等设备对这些小模型进行了优化。Gemma 4 采用了 Apache 2.0 授权,在商业用途限制上更灵活。
https://deepmind.google/models/gemma/gemma-4/