Gemma 4 31B — 4bit is all you need
Este artigo compara o desempenho das versões quantizadas de 4 bits e 8 bits do modelo Gemma 4 31B em um MacBook Pro M5 Max, revelando que a versão de 4 bits surpreendentemente obteve uma pontuação superior. Adicionalmente, destaca um problema onde o Gemma 4 26B-A4B entrou em um loop de regressão, atingindo o limite máximo de tokens e truncando as respostas.



