NEWS↑ trending44
Cloudflare open-sources lossless LLM compression tool
Reddit r/LocalLLaMA·18 de abril de 2026
Cloudflare lanzó Unweight, un sistema de compresión sin pérdidas que reduce el tamaño de los LLM entre un 15 y un 22% sin sacrificar la precisión de la salida. La herramienta, que ahorra aproximadamente 3 GB de VRAM en GPUs Nvidia H100 para Llama-3.1-8B, ha sido de código abierto en GitHub con planes de extender la compresión.
Leer original ↗