← heapsort-ai

LLMs

714 items

RESEARCH↑ trendingReddit r/LocalLLaMA·4/17/2026

Qwen3.6 GGUF Benchmarks

Dieser Inhalt präsentiert KLD-Performance-Benchmarks für Unsloth's Qwen3.6-35B-A3B GGUF-Quants, die deren Effizienz in Bezug auf KLD versus Speicherplatz hervorheben. Es wird zudem klargestellt, dass häufige GGUF-Updates in der Regel auf externe Fehlerbehebungen oder offizielle Verbesserungen zurückzuführen sind und nicht auf interne Fehler von Unsloth.

Qwen3.6 GGUF Benchmarks
41
DOCDEV.to AI·4/23/2026

How to Integrate Claude with n8n to Build AI Workflows

Dieser Leitfaden beschreibt, wie Claude mit n8n integriert wird, um KI-Workflows zu erstellen, die dynamisch interpretieren, entscheiden und handeln können. Die Kombination ermöglicht es, die Grenzen traditioneller Automatisierung zu überwinden, indem unstrukturierte Eingaben verarbeitet und strukturierte Ausgaben basierend auf Schlussfolgerungen generiert werden.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·5/7/2026

Need advice on hardware purchasing decision: RTX 5090 vs. M5 Max 128GB for agentic software development

Der Benutzer sucht Rat bei der Wahl zwischen einer RTX 5090 und einem M5 Max 128GB für die Entwicklung von Agenten-Software mit Qwen3.6 27B lokal. Die RTX 5090 bietet die dreifache Geschwindigkeit, während der M5 Max die vierfache Speicherkapazität bereitstellt, was einen Kompromiss zwischen schneller Codegenerierung und größerer Kontextkapazität darstellt.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·4/9/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·4/27/2026

Guys this is so fun!

Ein Nutzer äußert seine Begeisterung, verschiedene KI-Modelle wie Qwen und Llama lokal auf seinem MacBook Air und einer KI-Workstation mit einer RTX Pro 6000 Blackwell auszuführen, wobei er Tools wie LM Studio und LM Link verwendet.

41
CASE↑ trendingReddit r/LocalLLaMA·4/19/2026

"Browser OS" implemented by Qwen 3.6 35B: The best result I ever got from a local model

Ein Nutzer teilt seine Erfahrung bei der Implementierung von 'Browser OS' mit dem lokalen Qwen 3.6 35B Modell und betont, dass dies die besten Ergebnisse sind, die er jemals von einem lokalen KI-Modell erhalten hat. Der Inhalt verweist wahrscheinlich auf eine Demonstration oder einen detaillierten Bericht dieser beeindruckenden Leistung.

"Browser OS" implemented by Qwen 3.6 35B: The best result I ever got from a local model
41
ARTICLE↑ trendingReddit r/LocalLLaMA·4/21/2026

2x 512gb ram M3 Ultra mac studios

Ein Benutzer mit zwei High-End M3 Ultra Mac Studios (jeweils 512 GB RAM, 25.000 $ Hardware) testet LLM-Modelle wie Deepseek und GLM und bittet die Community um Vorschläge, welche Modelle noch geladen werden sollen. Er behebt auch Backend-Probleme und wartet auf Optimierungen für Kimi 2.6.

2x 512gb ram M3 Ultra mac studios
41
RESEARCH↑ trendingReddit r/LocalLLaMA·4/23/2026

Qwen 3.6 27B Makes Huge Gains in Agency on Artificial Analysis - Ties with Sonnet 4.6

Qwen 3.6 27B hat große Fortschritte gemacht und Sonnet 4.6 im Agentic Index von Artificial Analysis erreicht, wobei es mehrere andere prominente Modelle übertrifft. Das Training des Modells scheint auf den agentischen Einsatz ausgerichtet zu sein und zeigt trotz fragwürdiger Metriken im Coding Index eine überraschende Leistung für seine Größe.

Qwen 3.6 27B Makes Huge Gains in Agency on Artificial Analysis - Ties with Sonnet 4.6
41
ARTICLEDEV.to AI·4/22/2026

We Built a 31-Agent AI Team That Hires Itself, Critiques Itself, and Dreams

Dieser technische Bericht beschreibt ein sich selbst entwickelndes 31-Agenten-KI-Team, das auf Claude Code basiert und eine parallele kognitive Ebene, eine dynamische Einstellungs-Pipeline und robuste Verifizierung umfasst. Er kritisiert gängige Agenten-Frameworks und betont die Notwendigkeit von Spezialisierung, Kreuzverifizierung, Gedächtniskalibrierung und Selbstverbesserung in Multi-Agenten-Systemen.

40
ARTICLE↑ trendingReddit r/LocalLLaMA·4/19/2026

Is anyone getting real coding work done with Qwen3.6-35B-A3B-UD-Q4_K_M on a 32GB Mac in opencode, claude code or similar?

Ein Benutzer versucht, Programmierarbeiten mit Qwen3.6-35B auf einem M2 Macbook Pro mit 32 GB RAM durchzuführen, stößt jedoch auf Probleme mit Speicherausschöpfung und Kontextfensterverwaltung. Obwohl das Modell die Kernursache eines Fehlers erkennt, scheitert es an der Implementierung, da wichtige Informationen während der Kontextkomprimierung verloren gehen.

39
ARTICLE↑ trendingReddit r/LocalLLaMA·4/19/2026

Switching from Opus 4.7 to Qwen-35B-A3B

Ein Benutzer erwägt den Wechsel von Opus 4.7 zu Qwen-35B-A3B als täglichen Code-Agenten und sucht nach Erfahrungen aus der Community. Er fragt, ob Qwen-35B-A3B für die meisten Aufgaben ausreicht, auch wenn Opus bei komplexen Argumentationen überlegen sein mag, und betreibt es auf einem M5 Max 128GB.

39
ARTICLEDEV.to AI·4/23/2026

I Built a Local AI VRAM Calculator & GPU Planner (Beta)

Der Autor hat ein neues Beta-Tool, den „Local AI VRAM Calculator & GPU Planner“, veröffentlicht, um die GPU- und VRAM-Anforderungen für das lokale Ausführen von LLMs zu bestimmen. Dieses Tool soll Hardware-Kompromisse für verschiedene Workloads und Quantisierungsstufen sichtbar machen, bevor man sich auf Komponenten festlegt.

39
ARTICLE↑ trendingReddit r/LocalLLaMA·4/10/2026

gemma-4-26B-A4B with my coding agent Kon

O autor compartilha Kon, seu agente de codificação de IA, que funciona bem com modelos locais para tarefas simples. Ele é notável por seu prompt de sistema pequeno, ausência de telemetria, compatibilidade com os melhores modelos locais e provedores populares, além de uma base de código simples e recursos avançados.

38
ARTICLE↑ trendingReddit r/MachineLearning·4/9/2026

Studying Sutton and Barto's RL book and its connections to RL for LLMs (e.g., tool use, math reasoning, agents, and so on)? [D]

Um graduado em Matemática busca orientação para estudar Aprendizado por Reforço (RL) e suas conexões com LLMs, especialmente para aplicações em matemática. Ele questiona a relevância do livro 'Sutton e Barto' em um contexto moderno de LLMs e pede ajuda para focar em tópicos e algoritmos mais recentes como PPO e GRPO.

38