heapsort
NEWS↑ trending44

Cloudflare open-sources lossless LLM compression tool

Reddit r/LocalLLaMA·18 de abril de 2026

Cloudflare lanzó Unweight, un sistema de compresión sin pérdidas que reduce el tamaño de los LLM entre un 15 y un 22% sin sacrificar la precisión de la salida. La herramienta, que ahorra aproximadamente 3 GB de VRAM en GPUs Nvidia H100 para Llama-3.1-8B, ha sido de código abierto en GitHub con planes de extender la compresión.

Leer original