heapsort
ARTICLE↑ trending46

Trials and tribulations fine-tuning & deploying Gemma-4 [P]

Reddit r/MachineLearning·18 de abril de 2026

Uma equipe de ML documentou os desafios técnicos encontrados ao fazer o fine-tuning e implantar o Gemma-4. Os problemas principais incluíram a incompatibilidade do PEFT com as camadas personalizadas do Gemma 4, o SFTTrainer quebrando silenciosamente a atenção de compartilhamento de KV e o DeepSpeed ZeRO-3 salvando adaptadores LoRA incompletos.

Ler original