LLMs

714 items

RESEARCH↑ trendingReddit r/LocalLLaMA·17/04/2026

Qwen3.6 GGUF Benchmarks

Ce contenu présente les benchmarks de performance KLD pour les quants GGUF Qwen3.6-35B-A3B d'Unsloth, soulignant leur efficacité par rapport à l'espace disque. Il clarifie également que les mises à jour fréquentes des GGUF sont généralement dues à des corrections de bugs externes ou à des améliorations officielles, et non à des erreurs internes d'Unsloth.

LLMs quantization Benchmarks

DOCDEV.to AI·23/04/2026

How to Integrate Claude with n8n to Build AI Workflows

Ce guide explique comment intégrer Claude à n8n pour créer des workflows d'IA capables d'interpréter, de décider et d'agir dynamiquement. Cette combinaison permet de dépasser les limites de l'automatisation traditionnelle en traitant des entrées non structurées et en générant des sorties structurées basées sur le raisonnement.

integration LLMs AI Workflows automation

ARTICLE↑ trendingReddit r/LocalLLaMA·07/05/2026

Need advice on hardware purchasing decision: RTX 5090 vs. M5 Max 128GB for agentic software development

L'utilisateur demande conseil pour choisir entre une RTX 5090 et un M5 Max 128GB pour le développement de logiciels agentiques avec Qwen3.6 27B en local. La RTX 5090 offre une vitesse 3 fois supérieure, tandis que le M5 Max offre 4 fois plus de mémoire, posant un compromis entre la génération rapide de code et une plus grande capacité de contexte.

LLMs GPU hardware performance

ARTICLE↑ trendingReddit r/LocalLLaMA·09/04/2026

16 GB VRAM users, what model do we like best now?

Um usuário com 16 GB de VRAM compartilha sua experiência positiva com o modelo Qwen 3.5 27b em quants IQ3 em uma RTX 4080, alcançando boa velocidade e contexto. Ele discute os desafios de otimizar modelos de IA localmente com essa quantidade de VRAM, ponderando entre qualidade e velocidade ao lidar com diferentes níveis de quantização.

LLMs VRAM modelos de linguagem hardware

ARTICLE↑ trendingReddit r/LocalLLaMA·27/04/2026

Guys this is so fun!

Un utilisateur exprime son enthousiasme à faire fonctionner divers modèles d'IA comme Qwen et Llama localement sur son MacBook Air et une station de travail IA équipée d'une RTX Pro 6000 Blackwell, en utilisant des outils comme LM Studio et LM Link.

open source models LLMs Local AI hardware

CASE↑ trendingReddit r/LocalLLaMA·19/04/2026

"Browser OS" implemented by Qwen 3.6 35B: The best result I ever got from a local model

Un utilisateur partage son expérience en implémentant 'Browser OS' avec le modèle local Qwen 3.6 35B, affirmant avoir obtenu les meilleurs résultats parmi les modèles d'IA locaux. Le contenu renvoie probablement à une démonstration ou un compte rendu détaillé de cette performance impressionnante.

AI models LLMs demonstration Local AI

"Browser OS" implemented by Qwen 3.6 35B: The best result I ever got from a local model

ARTICLE↑ trendingReddit r/LocalLLaMA·21/04/2026

2x 512gb ram M3 Ultra mac studios

Un utilisateur possédant deux Mac Studios M3 Ultra haut de gamme (512 Go de RAM chacun, 25 000 $ de matériel) teste des modèles LLM comme Deepseek et GLM, et sollicite des suggestions de la communauté sur les modèles à charger. Il dépanne également des problèmes de backend et attend des optimisations pour Kimi 2.6.

Apple AI models LLMs Mac Studio

RESEARCH↑ trendingReddit r/LocalLLaMA·23/04/2026

Qwen 3.6 27B Makes Huge Gains in Agency on Artificial Analysis - Ties with Sonnet 4.6

Qwen 3.6 27B a réalisé des gains importants, égalant Sonnet 4.6 sur l'Indice Agentique d'Artificial Analysis et surpassant plusieurs autres modèles proéminents. L'entraînement du modèle semble axé sur l'utilisation agentique, montrant des performances surprenantes pour sa taille malgré des métriques douteuses pour l'Index de Codage.

model performance AI models LLMs Benchmarking

Qwen 3.6 27B Makes Huge Gains in Agency on Artificial Analysis - Ties with Sonnet 4.6

ARTICLEDEV.to AI·22/04/2026

We Built a 31-Agent AI Team That Hires Itself, Critiques Itself, and Dreams

Ce rapport d'ingénierie détaille une équipe d'IA auto-évolutive de 31 agents, construite sur Claude Code, intégrant une couche cognitive parallèle, un pipeline de recrutement dynamique et une vérification robuste. Il critique les frameworks d'agents courants, soulignant le besoin de spécialisation, de vérification croisée, de calibration de la mémoire et d'auto-amélioration dans les systèmes multi-agents.

Self-evolving AI AI architecture LLMs multi-agent systems

ARTICLE↑ trendingReddit r/LocalLLaMA·22/04/2026

Recent Open models from last 6 Months - Nov 2025 - Apr 2026

L'utilisateur a créé un graphique présentant les modèles ouverts récents sortis au cours des six derniers mois (Novembre 2025 - Avril 2026), en se concentrant sur les dernières versions et en soulignant le grand volume de « LLMs locaux ». Il invite la communauté à discuter du graphique général et des modèles sous-estimés.

LLMs open-source AI Model Releases Local LLMs

Recent Open models from last 6 Months - Nov 2025 - Apr 2026

ARTICLEKDNuggets·il y a 1j

Why Do LLMs Corrupt Your Documents When You Delegate?

Ce contenu analyse plusieurs raisons pour lesquelles la dégradation structurelle du contenu peut se produire lorsqu'on délègue des tâches complexes d'édition de documents aux Grands Modèles de Langage (LLM). Il explore les défis et les problèmes inhérents à une telle délégation.

content editing LLMs AI limitations AI delegation

Why Do LLMs Corrupt Your Documents When You Delegate?

ARTICLE↑ trendingReddit r/LocalLLaMA·19/04/2026

Is anyone getting real coding work done with Qwen3.6-35B-A3B-UD-Q4_K_M on a 32GB Mac in opencode, claude code or similar?

Un utilisateur tente d'effectuer des tâches de codage avec Qwen3.6-35B sur un Macbook Pro M2 de 32 Go, rencontrant des problèmes d'épuisement de la mémoire et de gestion de la fenêtre contextuelle. Bien que le modèle identifie l'essence d'un bug, il ne parvient pas à implémenter la solution car des informations cruciales sont perdues lors de la compaction du contexte.

LLMs open-source AI local inference code generation

ARTICLE↑ trendingReddit r/LocalLLaMA·19/04/2026

Switching from Opus 4.7 to Qwen-35B-A3B

Un utilisateur envisage de passer d'Opus 4.7 à Qwen-35B-A3B pour son agent de codage quotidien et sollicite les expériences de la communauté. Il se demande si Qwen-35B-A3B suffira pour la plupart des tâches, tout en reconnaissant qu'Opus pourrait avoir un avantage pour le raisonnement complexe, sur un M5 Max 128GB.

AI models LLMs Coding Agent model comparison

ARTICLEDEV.to AI·23/04/2026

I Built a Local AI VRAM Calculator & GPU Planner (Beta)

L'auteur a lancé un nouvel outil bêta, le « Local AI VRAM Calculator & GPU Planner », pour aider à déterminer les exigences en GPU et VRAM pour l'exécution locale des LLM. Cet outil vise à rendre visibles les compromis matériels pour différentes charges de travail et niveaux de quantification avant d'investir dans des composants.

LLMs GPU VRAM AI tools

ARTICLE↑ trendingReddit r/MachineLearning·23/04/2026

First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

Un utilisateur autodidacte, débutant en fine-tuning, demande conseil pour choisir entre des modèles LLM 3B et 7B pour un projet de raisonnement multi-tâches. Le projet vise à comprendre l'intention sous-jacente des questions, à maintenir plusieurs perspectives et à gérer des entrées complexes.

LLMs model selection multi-task reasoning NLP

ARTICLE↑ trendingReddit r/LocalLLaMA·10/04/2026

gemma-4-26B-A4B with my coding agent Kon

O autor compartilha Kon, seu agente de codificação de IA, que funciona bem com modelos locais para tarefas simples. Ele é notável por seu prompt de sistema pequeno, ausência de telemetria, compatibilidade com os melhores modelos locais e provedores populares, além de uma base de código simples e recursos avançados.

Open Source LLMs Coding Agent local models

ARTICLE↑ trendingReddit r/MachineLearning·19/04/2026

Converting XQuery to SQL with Local LLMs: Do I Need Fine-Tuning or a Better Approach? [P]

L'auteur détaille le défi de convertir des requêtes XQuery en SQL avec des LLM locaux en entreprise, confronté à un manque de données d'entraînement diverses. Les approches basées sur le parsing et l'ingénierie des prompts ont échoué pour les requêtes complexes ou variées.

LLMs prompt-engineering SQL data conversion

ARTICLE↑ trendingReddit r/MachineLearning·09/04/2026

Studying Sutton and Barto's RL book and its connections to RL for LLMs (e.g., tool use, math reasoning, agents, and so on)? [D]

Um graduado em Matemática busca orientação para estudar Aprendizado por Reforço (RL) e suas conexões com LLMs, especialmente para aplicações em matemática. Ele questiona a relevância do livro 'Sutton e Barto' em um contexto moderno de LLMs e pede ajuda para focar em tópicos e algoritmos mais recentes como PPO e GRPO.

Sutton e Barto LLMs AI para Matemática reinforcement learning

NEWS↑ trendingReddit r/LocalLLaMA·09/04/2026

Local (small) LLMs found the same vulnerabilities as Mythos

Pequenos Modelos de Linguagem Grandes (LLMs) descobriram as mesmas vulnerabilidades que o sistema Mythos. Este achado sugere que modelos menores podem replicar descobertas críticas de segurança em sistemas de IA.

LLMs Mythos vulnerabilities AI security

ARTICLE↑ trendingReddit r/LocalLLaMA·30/04/2026

Open Models - April 2026 - One of the best months of all time for Local LLMs?

Le contenu traite des modèles ouverts, en particulier des LLM Locaux, d'avril 2026, le présentant comme un excellent mois potentiel pour eux. Il note également un changement de licence pour MiniMax-M2.7 et sollicite des suggestions de modèles sous-estimés.

Open Source AI models LLMs licensing

Open Models - April 2026 - One of the best months of all time for Local LLMs?