← heapsort-ai

server

2 items

DOC↑ trendingReddit r/LocalLLaMA·il y a 19j

Latest b9274 Addresses MTP VRAM leak

La mise à jour b9274 résout un problème de fuite de VRAM dans les modèles MTP (Multi-Token Prediction), où les ressources allouées au GPU n'étaient pas libérées lors des cycles de veille/reprise. La correction implique la réinitialisation explicite des ressources du décodeur spéculatif, du contexte de brouillon et du modèle de brouillon dans la fonction destroy() afin d'éviter les erreurs de manque de mémoire.

47