NEWS↑ trending42
llama.cpp speculative checkpointing was merged
Reddit r/LocalLLaMA·19 avril 2026
Le "checkpointing spéculatif" a été intégré à llama.cpp, offrant des gains de vitesse potentiels. Certains prompts, notamment pour le codage avec des paramètres optimisés, peuvent bénéficier d'une accélération de 0% à 50%, tandis que d'autres pourraient ne pas voir d'amélioration en raison d'un faible taux d'acceptation du brouillon.
Lire l'original ↗