heapsort
NEWS↑ trending44

Cloudflare open-sources lossless LLM compression tool

Reddit r/LocalLLaMA·18 de abril de 2026

A Cloudflare lançou Unweight, uma ferramenta de compressão lossless que reduz o tamanho de LLMs em 15-22% sem sacrificar a precisão da saída. A ferramenta, que economiza cerca de 3 GB de VRAM em GPUs Nvidia H100 para o Llama-3.1-8B, foi de código aberto no GitHub com planos de expandir a compressão.

Ler original