heapsort
NEWS↑ trending42

Luce DFlash: Qwen3.6-27B at up to 2x throughput on a single RTX 3090

Reddit r/LocalLLaMA·27 de abril de 2026
Luce DFlash: Qwen3.6-27B at up to 2x throughput on a single RTX 3090

Luce DFlash presenta un puerto GGUF de decodificación especulativa DFlash para Qwen3.6-27B, logrando casi el doble de rendimiento en una única RTX 3090. Este stack C++/CUDA independiente, disponible como proyecto de código abierto con licencia MIT, mejora significativamente el rendimiento de los LLM en hardware de consumo.

Leer original