NEWS↑ trending36
backend-agnostic tensor parallelism has been merged into llama.cpp
Reddit r/LocalLLaMA·9 avril 2026
A funcionalidade de paralelismo de tensor backend-agnóstico foi integrada ao llama.cpp, permitindo que modelos de IA rodem muito mais rápido em sistemas com múltiplas GPUs. Isso significa que a aceleração de desempenho não exige mais CUDA.
Lire l'original ↗