LLMs

714 items

RESEARCH↑ trendingReddit r/LocalLLaMA·4/17/2026

Qwen3.6 GGUF Benchmarks

Dieser Inhalt präsentiert KLD-Performance-Benchmarks für Unsloth's Qwen3.6-35B-A3B GGUF-Quants, die deren Effizienz in Bezug auf KLD versus Speicherplatz hervorheben. Es wird zudem klargestellt, dass häufige GGUF-Updates in der Regel auf externe Fehlerbehebungen oder offizielle Verbesserungen zurückzuführen sind und nicht auf interne Fehler von Unsloth.

LLMs quantization Benchmarks

DOCDEV.to AI·4/23/2026

How to Integrate Claude with n8n to Build AI Workflows

Dieser Leitfaden beschreibt, wie Claude mit n8n integriert wird, um KI-Workflows zu erstellen, die dynamisch interpretieren, entscheiden und handeln können. Die Kombination ermöglicht es, die Grenzen traditioneller Automatisierung zu überwinden, indem unstrukturierte Eingaben verarbeitet und strukturierte Ausgaben basierend auf Schlussfolgerungen generiert werden.

integration LLMs AI Workflows automation

ARTICLE↑ trendingReddit r/LocalLLaMA·5/7/2026

Need advice on hardware purchasing decision: RTX 5090 vs. M5 Max 128GB for agentic software development

Der Benutzer sucht Rat bei der Wahl zwischen einer RTX 5090 und einem M5 Max 128GB für die Entwicklung von Agenten-Software mit Qwen3.6 27B lokal. Die RTX 5090 bietet die dreifache Geschwindigkeit, während der M5 Max die vierfache Speicherkapazität bereitstellt, was einen Kompromiss zwischen schneller Codegenerierung und größerer Kontextkapazität darstellt.

LLMs GPU hardware performance

ARTICLE↑ trendingReddit r/LocalLLaMA·4/9/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

LLMs VRAM modelos de linguagem hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·4/27/2026

Guys this is so fun!

Ein Nutzer äußert seine Begeisterung, verschiedene KI-Modelle wie Qwen und Llama lokal auf seinem MacBook Air und einer KI-Workstation mit einer RTX Pro 6000 Blackwell auszuführen, wobei er Tools wie LM Studio und LM Link verwendet.

open source models LLMs Local AI hardware

CASE↑ trendingReddit r/LocalLLaMA·4/19/2026

"Browser OS" implemented by Qwen 3.6 35B: The best result I ever got from a local model

Ein Nutzer teilt seine Erfahrung bei der Implementierung von 'Browser OS' mit dem lokalen Qwen 3.6 35B Modell und betont, dass dies die besten Ergebnisse sind, die er jemals von einem lokalen KI-Modell erhalten hat. Der Inhalt verweist wahrscheinlich auf eine Demonstration oder einen detaillierten Bericht dieser beeindruckenden Leistung.

AI models LLMs demonstration Local AI

"Browser OS" implemented by Qwen 3.6 35B: The best result I ever got from a local model

ARTICLE↑ trendingReddit r/LocalLLaMA·4/21/2026

2x 512gb ram M3 Ultra mac studios

Ein Benutzer mit zwei High-End M3 Ultra Mac Studios (jeweils 512 GB RAM, 25.000 $ Hardware) testet LLM-Modelle wie Deepseek und GLM und bittet die Community um Vorschläge, welche Modelle noch geladen werden sollen. Er behebt auch Backend-Probleme und wartet auf Optimierungen für Kimi 2.6.

Apple AI models LLMs Mac Studio

RESEARCH↑ trendingReddit r/LocalLLaMA·4/23/2026

Qwen 3.6 27B Makes Huge Gains in Agency on Artificial Analysis - Ties with Sonnet 4.6

Qwen 3.6 27B hat große Fortschritte gemacht und Sonnet 4.6 im Agentic Index von Artificial Analysis erreicht, wobei es mehrere andere prominente Modelle übertrifft. Das Training des Modells scheint auf den agentischen Einsatz ausgerichtet zu sein und zeigt trotz fragwürdiger Metriken im Coding Index eine überraschende Leistung für seine Größe.

model performance AI models LLMs Benchmarking

Qwen 3.6 27B Makes Huge Gains in Agency on Artificial Analysis - Ties with Sonnet 4.6

ARTICLEDEV.to AI·4/22/2026

We Built a 31-Agent AI Team That Hires Itself, Critiques Itself, and Dreams

Dieser technische Bericht beschreibt ein sich selbst entwickelndes 31-Agenten-KI-Team, das auf Claude Code basiert und eine parallele kognitive Ebene, eine dynamische Einstellungs-Pipeline und robuste Verifizierung umfasst. Er kritisiert gängige Agenten-Frameworks und betont die Notwendigkeit von Spezialisierung, Kreuzverifizierung, Gedächtniskalibrierung und Selbstverbesserung in Multi-Agenten-Systemen.

Self-evolving AI AI architecture LLMs multi-agent systems

ARTICLE↑ trendingReddit r/LocalLLaMA·4/22/2026

Recent Open models from last 6 Months - Nov 2025 - Apr 2026

Der Benutzer hat eine Grafik mit kürzlich veröffentlichten offenen Modellen der letzten sechs Monate (November 2025 - April 2026) erstellt, wobei der Fokus auf den neuesten Versionen liegt und das hohe Volumen an „Local LLMs“ hervorgehoben wird. Er lädt die Community zur Diskussion über die Grafik und unterschätzte Modelle ein.

LLMs open-source AI Model Releases Local LLMs

Recent Open models from last 6 Months - Nov 2025 - Apr 2026

ARTICLEKDNuggets·vor 1T

Why Do LLMs Corrupt Your Documents When You Delegate?

Dieser Inhalt analysiert mehrere Gründe, warum struktureller Inhaltsverfall auftreten kann, wenn komplexe Dokumentenbearbeitungsaufgaben an große Sprachmodelle (LLMs) delegiert werden. Er untersucht die Herausforderungen und Probleme, die dieser Delegation inhärent sind.

content editing LLMs AI limitations AI delegation

Why Do LLMs Corrupt Your Documents When You Delegate?

ARTICLE↑ trendingReddit r/LocalLLaMA·4/19/2026

Is anyone getting real coding work done with Qwen3.6-35B-A3B-UD-Q4_K_M on a 32GB Mac in opencode, claude code or similar?

Ein Benutzer versucht, Programmierarbeiten mit Qwen3.6-35B auf einem M2 Macbook Pro mit 32 GB RAM durchzuführen, stößt jedoch auf Probleme mit Speicherausschöpfung und Kontextfensterverwaltung. Obwohl das Modell die Kernursache eines Fehlers erkennt, scheitert es an der Implementierung, da wichtige Informationen während der Kontextkomprimierung verloren gehen.

LLMs open-source AI local inference code generation

ARTICLE↑ trendingReddit r/LocalLLaMA·4/19/2026

Switching from Opus 4.7 to Qwen-35B-A3B

Ein Benutzer erwägt den Wechsel von Opus 4.7 zu Qwen-35B-A3B als täglichen Code-Agenten und sucht nach Erfahrungen aus der Community. Er fragt, ob Qwen-35B-A3B für die meisten Aufgaben ausreicht, auch wenn Opus bei komplexen Argumentationen überlegen sein mag, und betreibt es auf einem M5 Max 128GB.

AI models LLMs Coding Agent model comparison

ARTICLEDEV.to AI·4/23/2026

I Built a Local AI VRAM Calculator & GPU Planner (Beta)

Der Autor hat ein neues Beta-Tool, den „Local AI VRAM Calculator & GPU Planner“, veröffentlicht, um die GPU- und VRAM-Anforderungen für das lokale Ausführen von LLMs zu bestimmen. Dieses Tool soll Hardware-Kompromisse für verschiedene Workloads und Quantisierungsstufen sichtbar machen, bevor man sich auf Komponenten festlegt.

LLMs GPU VRAM AI tools

ARTICLE↑ trendingReddit r/MachineLearning·4/23/2026

First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

Ein autodidaktischer Nutzer, der neu im Bereich Fine-Tuning ist, sucht Rat bei der Wahl zwischen 3B- und 7B-LLM-Modellen für ein Multi-Task-Reasoning-Projekt. Das Projekt umfasst das Verständnis der zugrunde liegenden Fragen, die Beibehaltung mehrerer Perspektiven und den Umgang mit unübersichtlichen Eingaben.

LLMs model selection multi-task reasoning NLP

ARTICLE↑ trendingReddit r/LocalLLaMA·4/10/2026

gemma-4-26B-A4B with my coding agent Kon

O autor compartilha Kon, seu agente de codificação de IA, que funciona bem com modelos locais para tarefas simples. Ele é notável por seu prompt de sistema pequeno, ausência de telemetria, compatibilidade com os melhores modelos locais e provedores populares, além de uma base de código simples e recursos avançados.

Open Source LLMs Coding Agent local models

ARTICLE↑ trendingReddit r/MachineLearning·4/19/2026

Converting XQuery to SQL with Local LLMs: Do I Need Fine-Tuning or a Better Approach? [P]

Der Autor beschreibt die Herausforderung, XQuery in SQL mit lokalen LLMs in einem Unternehmenskontext zu konvertieren, erschwert durch begrenzte Trainingsdaten. Erste Versuche mit Parsing-basierten Methoden und Prompt-Engineering waren bei komplexen oder variablen Anfragen nicht ausreichend.

LLMs prompt-engineering SQL data conversion

ARTICLE↑ trendingReddit r/MachineLearning·4/9/2026

Studying Sutton and Barto's RL book and its connections to RL for LLMs (e.g., tool use, math reasoning, agents, and so on)? [D]

Um graduado em Matemática busca orientação para estudar Aprendizado por Reforço (RL) e suas conexões com LLMs, especialmente para aplicações em matemática. Ele questiona a relevância do livro 'Sutton e Barto' em um contexto moderno de LLMs e pede ajuda para focar em tópicos e algoritmos mais recentes como PPO e GRPO.

Sutton e Barto LLMs AI para Matemática reinforcement learning

NEWS↑ trendingReddit r/LocalLLaMA·4/9/2026

Local (small) LLMs found the same vulnerabilities as Mythos

Pequenos Modelos de Linguagem Grandes (LLMs) descobriram as mesmas vulnerabilidades que o sistema Mythos. Este achado sugere que modelos menores podem replicar descobertas críticas de segurança em sistemas de IA.

LLMs Mythos vulnerabilities AI security

ARTICLE↑ trendingReddit r/LocalLLaMA·4/30/2026

Open Models - April 2026 - One of the best months of all time for Local LLMs?

Der Inhalt bespricht offene Modelle, insbesondere lokale LLMs, vom April 2026 und hebt diesen Monat als potenziell hervorragend für sie hervor. Es wird auch eine Lizenzänderung für MiniMax-M2.7 erwähnt und nach Vorschlägen für unterschätzte Modelle gefragt.

Open Source AI models LLMs licensing

Open Models - April 2026 - One of the best months of all time for Local LLMs?