NEWS↑ trending36
backend-agnostic tensor parallelism has been merged into llama.cpp
Reddit r/LocalLLaMA·9 de abril de 2026
A funcionalidade de paralelismo de tensor backend-agnóstico foi integrada ao llama.cpp, permitindo que modelos de IA rodem muito mais rápido em sistemas com múltiplas GPUs. Isso significa que a aceleração de desempenho não exige mais CUDA.
Leer original ↗