NEWS↑ trending42
llama.cpp speculative checkpointing was merged
Reddit r/LocalLLaMA·19 de abril de 2026
A funcionalidade de checkpointing especulativo foi integrada ao llama.cpp, oferecendo potenciais ganhos de velocidade. Embora alguns prompts possam ter um aumento de 0% a 50% (especialmente para codificação com parâmetros otimizados), outros podem não apresentar melhorias devido à baixa aceitação do rascunho.
Ler original ↗