← heapsort-ai

HuggingFace

7 items

DOCDEV.to AI·il y a 16j

96. LoRA: Fine-Tune a Billion-Parameter Model on a Laptop

L'article explique comment la technique LoRA (Low-Rank Adaptation) permet l'ajustement fin de modèles de langage à milliards de paramètres sur du matériel grand public, comme les ordinateurs portables. Au lieu de mettre à jour tous les paramètres, LoRA ajoute de minuscules modules entraînables, réduisant considérablement les exigences en mémoire GPU.

28
DOCTogether AI Blog·08/05/2026

Deploy and inference any model from HuggingFace

Cette session explique comment déployer n'importe quel modèle Hugging Face en utilisant Goose et le Dedicated Container Inference de Together. Elle vise à simplifier la complexité de la configuration, permettant aux modèles de fonctionner rapidement dans un environnement GPU de production.

27