heapsort
RESEARCH↑ trending38

QWEN3.6 + ik_llama is fast af

Reddit r/LocalLLaMA·19 de abril de 2026
QWEN3.6 + ik_llama is fast af

Un usuario informó haber ejecutado el modelo Qwen3.6 + ik_llama a más de 50 tokens/segundo con una ventana de contexto de 200k en 16GB de VRAM y 32GB de RAM. Esto representa un hito de rendimiento significativo para los grandes modelos de lenguaje.

Leer original