NEWS↑ trending44
Cloudflare open-sources lossless LLM compression tool
Reddit r/LocalLLaMA·18 de abril de 2026
A Cloudflare lançou Unweight, uma ferramenta de compressão lossless que reduz o tamanho de LLMs em 15-22% sem sacrificar a precisão da saída. A ferramenta, que economiza cerca de 3 GB de VRAM em GPUs Nvidia H100 para o Llama-3.1-8B, foi de código aberto no GitHub com planos de expandir a compressão.
Ler original ↗