ARTICLEDEV.to AI·20/4/2026
What 19 GB of Memory Compression Taught Me About MLX on M1 Max
El autor detalla un problema de compresión de memoria de 19 GB al ejecutar un LLM grande con MLX en un M1 Max, confundiéndolo con una fuga. La solución fue una única llamada a la API de MLX para gestionar adecuadamente la memoria unificada de macOS para modelos grandes inactivos entre inferencias.
27