NEWS↑ trending44
Cloudflare open-sources lossless LLM compression tool
Reddit r/LocalLLaMA·18 avril 2026
Cloudflare a lancé Unweight, un système de compression sans perte qui réduit la taille des LLM de 15 à 22 % sans sacrifier la précision de sortie. L'outil, qui économise environ 3 Go de VRAM sur les GPU Nvidia H100 pour Llama-3.1-8B, a été mis en open-source sur GitHub avec des plans pour étendre la compression.
Lire l'original ↗