NEWSDEV.to AI·12/04/2026
llama.cpp Adds Gemma 4 Audio, Speculative Decoding & Ollama Agent Boost Local AI
O llama.cpp agora suporta processamento de áudio multimodal para modelos Gemma 4, aumentando sua versatilidade em hardware de consumo. Também foram implementados ganhos de desempenho com decodificação especulativa e um novo agente Ollama para codificação local.
27