← heapsort-ai

llama.cpp

33 items

ARTICLE↑ trendingReddit r/LocalLLaMA·10/4/2026

I no longer need a cloud LLM to do quick web research

O autor compartilha sua configuração para pesquisa e raspagem web rápida usando LLMs locais, especificamente Qwen3.5:27B-Q3_K_M em uma RTX 4090 com llama.cpp. Ele detalha as ferramentas e o processo que o permite realizar extração eficaz de conteúdo web offline, indicando que modelos locais agora atendem aos seus padrões de qualidade.

38
NEWS↑ trendingReddit r/LocalLLaMA·10/4/2026

More Gemma4 fixes in the past 24 hours

Este conteúdo relata correções recentes e novos templates de chat para os modelos Gemma 4 do Google, visando melhorar o orçamento de raciocínio e a chamada de ferramentas. Ele oferece instruções para usuários de llama.cpp sobre como aplicar esses novos templates para garantir o funcionamento correto.

36
DOCDEV.to AI·hace 16d

로컬 LLM 셋업 가이드 (v16)

Esta guía detalla cómo configurar y ejecutar Modelos de Lenguaje Grandes (LLMs) localmente, especificando los requisitos de hardware como una GPU NVIDIA y RAM suficiente, y comparando frameworks como llama.cpp y Ollama. Proporciona instrucciones paso a paso para la instalación de llama.cpp y la ejecución de un modelo con aceleración de GPU.

28