← heapsort-ai

llama.cpp

33 items

ARTICLE↑ trendingReddit r/LocalLLaMA·4/10/2026

I no longer need a cloud LLM to do quick web research

O autor compartilha sua configuração para pesquisa e raspagem web rápida usando LLMs locais, especificamente Qwen3.5:27B-Q3_K_M em uma RTX 4090 com llama.cpp. Ele detalha as ferramentas e o processo que o permite realizar extração eficaz de conteúdo web offline, indicando que modelos locais agora atendem aos seus padrões de qualidade.

38
NEWS↑ trendingReddit r/LocalLLaMA·4/10/2026

More Gemma4 fixes in the past 24 hours

Este conteúdo relata correções recentes e novos templates de chat para os modelos Gemma 4 do Google, visando melhorar o orçamento de raciocínio e a chamada de ferramentas. Ele oferece instruções para usuários de llama.cpp sobre como aplicar esses novos templates para garantir o funcionamento correto.

36
DOCDEV.to AI·16d ago

로컬 LLM 셋업 가이드 (v16)

This guide details how to set up and run Large Language Models (LLMs) locally, specifying hardware prerequisites such as an NVIDIA GPU and sufficient RAM, and comparing frameworks like llama.cpp and Ollama. It provides step-by-step instructions for installing llama.cpp and running a model with GPU acceleration.

28