Trials and tribulations fine-tuning & deploying Gemma-4 [P]
Ein ML-Team dokumentierte die technischen Herausforderungen beim Fine-Tuning und der Bereitstellung von Gemma-4. Schlüsselprobleme waren die Inkompatibilität von PEFT mit Gemma 4s benutzerdefinierten Layern, das stille Unterbrechen der KV-Sharing-Attention durch SFTTrainer sowie DeepSpeed ZeRO-3, das halb-leere LoRA-Adapter speicherte.
![Need feedback on my Senior Thesis: An automated MLOps pipeline for AI news classification & summarization [D]](/cdn-cgi/image/width=3840,quality=75,format=webp/https://preview.redd.it/wqv7mg1e1kvg1.png?width=140&height=77&auto=webp&s=03d8f38014e24bd3ba9837868280bafea56bb1b8)
![Thesis: an agent-native workspace for running and tracking ML experiments [P]](/cdn-cgi/image/width=3840,quality=75,format=webp/https://preview.redd.it/ni5g8i9zqfvg1.png?width=140&height=82&auto=webp&s=8f277f2eb016a16b31dc2a4b2f4fe8e3a242b319)
