← heapsort-ai

LLMs

714 items

RESEARCH↑ trendingReddit r/LocalLLaMA·17/04/2026

Qwen3.6 GGUF Benchmarks

Ce contenu présente les benchmarks de performance KLD pour les quants GGUF Qwen3.6-35B-A3B d'Unsloth, soulignant leur efficacité par rapport à l'espace disque. Il clarifie également que les mises à jour fréquentes des GGUF sont généralement dues à des corrections de bugs externes ou à des améliorations officielles, et non à des erreurs internes d'Unsloth.

Qwen3.6 GGUF Benchmarks
41
DOCDEV.to AI·23/04/2026

How to Integrate Claude with n8n to Build AI Workflows

Ce guide explique comment intégrer Claude à n8n pour créer des workflows d'IA capables d'interpréter, de décider et d'agir dynamiquement. Cette combinaison permet de dépasser les limites de l'automatisation traditionnelle en traitant des entrées non structurées et en générant des sorties structurées basées sur le raisonnement.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·07/05/2026

Need advice on hardware purchasing decision: RTX 5090 vs. M5 Max 128GB for agentic software development

L'utilisateur demande conseil pour choisir entre une RTX 5090 et un M5 Max 128GB pour le développement de logiciels agentiques avec Qwen3.6 27B en local. La RTX 5090 offre une vitesse 3 fois supérieure, tandis que le M5 Max offre 4 fois plus de mémoire, posant un compromis entre la génération rapide de code et une plus grande capacité de contexte.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·09/04/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·27/04/2026

Guys this is so fun!

Un utilisateur exprime son enthousiasme à faire fonctionner divers modèles d'IA comme Qwen et Llama localement sur son MacBook Air et une station de travail IA équipée d'une RTX Pro 6000 Blackwell, en utilisant des outils comme LM Studio et LM Link.

41
ARTICLE↑ trendingReddit r/LocalLLaMA·21/04/2026

2x 512gb ram M3 Ultra mac studios

Un utilisateur possédant deux Mac Studios M3 Ultra haut de gamme (512 Go de RAM chacun, 25 000 $ de matériel) teste des modèles LLM comme Deepseek et GLM, et sollicite des suggestions de la communauté sur les modèles à charger. Il dépanne également des problèmes de backend et attend des optimisations pour Kimi 2.6.

2x 512gb ram M3 Ultra mac studios
41
RESEARCH↑ trendingReddit r/LocalLLaMA·23/04/2026

Qwen 3.6 27B Makes Huge Gains in Agency on Artificial Analysis - Ties with Sonnet 4.6

Qwen 3.6 27B a réalisé des gains importants, égalant Sonnet 4.6 sur l'Indice Agentique d'Artificial Analysis et surpassant plusieurs autres modèles proéminents. L'entraînement du modèle semble axé sur l'utilisation agentique, montrant des performances surprenantes pour sa taille malgré des métriques douteuses pour l'Index de Codage.

Qwen 3.6 27B Makes Huge Gains in Agency on Artificial Analysis - Ties with Sonnet 4.6
41
ARTICLEDEV.to AI·22/04/2026

We Built a 31-Agent AI Team That Hires Itself, Critiques Itself, and Dreams

Ce rapport d'ingénierie détaille une équipe d'IA auto-évolutive de 31 agents, construite sur Claude Code, intégrant une couche cognitive parallèle, un pipeline de recrutement dynamique et une vérification robuste. Il critique les frameworks d'agents courants, soulignant le besoin de spécialisation, de vérification croisée, de calibration de la mémoire et d'auto-amélioration dans les systèmes multi-agents.

40
ARTICLE↑ trendingReddit r/LocalLLaMA·19/04/2026

Is anyone getting real coding work done with Qwen3.6-35B-A3B-UD-Q4_K_M on a 32GB Mac in opencode, claude code or similar?

Un utilisateur tente d'effectuer des tâches de codage avec Qwen3.6-35B sur un Macbook Pro M2 de 32 Go, rencontrant des problèmes d'épuisement de la mémoire et de gestion de la fenêtre contextuelle. Bien que le modèle identifie l'essence d'un bug, il ne parvient pas à implémenter la solution car des informations cruciales sont perdues lors de la compaction du contexte.

39
ARTICLE↑ trendingReddit r/LocalLLaMA·19/04/2026

Switching from Opus 4.7 to Qwen-35B-A3B

Un utilisateur envisage de passer d'Opus 4.7 à Qwen-35B-A3B pour son agent de codage quotidien et sollicite les expériences de la communauté. Il se demande si Qwen-35B-A3B suffira pour la plupart des tâches, tout en reconnaissant qu'Opus pourrait avoir un avantage pour le raisonnement complexe, sur un M5 Max 128GB.

39
ARTICLEDEV.to AI·23/04/2026

I Built a Local AI VRAM Calculator & GPU Planner (Beta)

L'auteur a lancé un nouvel outil bêta, le « Local AI VRAM Calculator & GPU Planner », pour aider à déterminer les exigences en GPU et VRAM pour l'exécution locale des LLM. Cet outil vise à rendre visibles les compromis matériels pour différentes charges de travail et niveaux de quantification avant d'investir dans des composants.

39
ARTICLE↑ trendingReddit r/LocalLLaMA·10/04/2026

gemma-4-26B-A4B with my coding agent Kon

O autor compartilha Kon, seu agente de codificação de IA, que funciona bem com modelos locais para tarefas simples. Ele é notável por seu prompt de sistema pequeno, ausência de telemetria, compatibilidade com os melhores modelos locais e provedores populares, além de uma base de código simples e recursos avançados.

38
ARTICLE↑ trendingReddit r/MachineLearning·09/04/2026

Studying Sutton and Barto's RL book and its connections to RL for LLMs (e.g., tool use, math reasoning, agents, and so on)? [D]

Um graduado em Matemática busca orientação para estudar Aprendizado por Reforço (RL) e suas conexões com LLMs, especialmente para aplicações em matemática. Ele questiona a relevância do livro 'Sutton e Barto' em um contexto moderno de LLMs e pede ajuda para focar em tópicos e algoritmos mais recentes como PPO e GRPO.

38