What 19 GB of Memory Compression Taught Me About MLX on M1 Max
L'auteur décrit un problème de compression mémoire de 19 Go avec un grand LLM utilisant MLX sur un M1 Max, initialement confondu avec une fuite. La solution était un simple appel API MLX pour gérer correctement la mémoire unifiée de macOS pour les modèles inactifs entre les inférences.