LLMs

720 items

ARTICLE↑ trendingReddit r/MachineLearning·23/04/2026

First time fine-tuning, need a sanity check — 3B or 7B for multi-task reasoning? [D]

Un utilisateur autodidacte, débutant en fine-tuning, demande conseil pour choisir entre des modèles LLM 3B et 7B pour un projet de raisonnement multi-tâches. Le projet vise à comprendre l'intention sous-jacente des questions, à maintenir plusieurs perspectives et à gérer des entrées complexes.

LLMs model selection multi-task reasoning NLP

ARTICLE↑ trendingReddit r/LocalLLaMA·10/04/2026

gemma-4-26B-A4B with my coding agent Kon

O autor compartilha Kon, seu agente de codificação de IA, que funciona bem com modelos locais para tarefas simples. Ele é notável por seu prompt de sistema pequeno, ausência de telemetria, compatibilidade com os melhores modelos locais e provedores populares, além de uma base de código simples e recursos avançados.

open-source LLMs Coding Agent local models

ARTICLE↑ trendingReddit r/MachineLearning·19/04/2026

Converting XQuery to SQL with Local LLMs: Do I Need Fine-Tuning or a Better Approach? [P]

L'auteur détaille le défi de convertir des requêtes XQuery en SQL avec des LLM locaux en entreprise, confronté à un manque de données d'entraînement diverses. Les approches basées sur le parsing et l'ingénierie des prompts ont échoué pour les requêtes complexes ou variées.

LLMs prompt-engineering SQL data conversion

ARTICLE↑ trendingReddit r/MachineLearning·09/04/2026

Studying Sutton and Barto's RL book and its connections to RL for LLMs (e.g., tool use, math reasoning, agents, and so on)? [D]

Um graduado em Matemática busca orientação para estudar Aprendizado por Reforço (RL) e suas conexões com LLMs, especialmente para aplicações em matemática. Ele questiona a relevância do livro 'Sutton e Barto' em um contexto moderno de LLMs e pede ajuda para focar em tópicos e algoritmos mais recentes como PPO e GRPO.

Sutton e Barto LLMs AI para Matemática reinforcement learning

NEWS↑ trendingReddit r/LocalLLaMA·09/04/2026

Local (small) LLMs found the same vulnerabilities as Mythos

Pequenos Modelos de Linguagem Grandes (LLMs) descobriram as mesmas vulnerabilidades que o sistema Mythos. Este achado sugere que modelos menores podem replicar descobertas críticas de segurança em sistemas de IA.

LLMs Mythos vulnerabilities AI Security

ARTICLE↑ trendingReddit r/LocalLLaMA·30/04/2026

Open Models - April 2026 - One of the best months of all time for Local LLMs?

Le contenu traite des modèles ouverts, en particulier des LLM Locaux, d'avril 2026, le présentant comme un excellent mois potentiel pour eux. Il note également un changement de licence pour MiniMax-M2.7 et sollicite des suggestions de modèles sous-estimés.

open-source AI models LLMs licensing

Open Models - April 2026 - One of the best months of all time for Local LLMs?

RESEARCHarXiv CS.CL·il y a 2j

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

L'hypothèse du Piggyback explique comment les tokens de modèle de chat peuvent induire un désalignement émergent dans les LLMs, généralisant les comportements affinés à des requêtes hors domaine. La technique de finetuning régularisé par token (TReFT) est proposée pour atténuer ce problème, préservant l'apprentissage intra-domaine et réduisant le désalignement.

Finetuning Emergent Misalignment LLMs Generalization

ARTICLEDEV.to AI·23/04/2026

Retrieval-Augmented Generation: State of the Art and Future Directions

La Génération Augmentée par Récupération (RAG) reste essentielle pour pallier les limites des Grands Modèles de Langage (LLM), tels que les hallucinations et les connaissances obsolètes, en intégrant des systèmes de récupération externes. Le texte décrit l'évolution du RAG, d'une conception linéaire simple à une architecture en couches plus robuste pour les systèmes de production.

AI architecture LLMs RAG

ARTICLE↑ trendingReddit r/LocalLLaMA·21/04/2026

Kimi K2.6 is a legit Opus 4.7 replacement

Kimi K2.6 est recommandé comme un remplacement viable pour Opus 4.7, capable de gérer 85% des tâches avec une bonne qualité, incluant la vision et une excellente utilisation du navigateur, particulièrement pour les tâches à long terme. L'auteur suggère que cela montre que les LLM de pointe n'apportent pas toujours de nouvelles fonctionnalités révolutionnaires, et que les solutions locales pourraient être préférables en raison des limites d'utilisation.

AI models LLMs benchmarks Local AI

NEWS↑ trendingReddit r/LocalLLaMA·09/04/2026

backend-agnostic tensor parallelism has been merged into llama.cpp

A funcionalidade de paralelismo de tensor backend-agnóstico foi integrada ao llama.cpp, permitindo que modelos de IA rodem muito mais rápido em sistemas com múltiplas GPUs. Isso significa que a aceleração de desempenho não exige mais CUDA.

LLMs Otimização GPU IA

NEWS↑ trendingReddit r/LocalLLaMA·21/04/2026

Open WebUI Desktop Released!

La version de bureau d'Open WebUI a été lancée et inclut désormais llama.cpp. Les utilisateurs peuvent exécuter des modèles d'IA localement ou se connecter à un serveur distant.

LLMs User Interface Local AI AI

DOC↑ trendingReddit r/LocalLLaMA·04/05/2026

it's time to update your Gemma 4 GGUFs

Il est temps de mettre à jour vos modèles Gemma 4 GGUF, car le modèle de chat a été corrigé il y a quelques jours. Plusieurs liens pour télécharger les modèles mis à jour sont disponibles.

AI models LLMs update Gemma

DOC↑ trendingReddit r/LocalLLaMA·26/04/2026

What is the best coding agent (CLI) like Claude Code for Local Development

L'utilisateur cherche de l'aide pour configurer l'agent Claude Code pour le développement local, notamment avec llama.cpp et le modèle Qwen3.6-35B-A3B, car il rencontre des difficultés. Il demande des conseils, des guides ou des suggestions d'outils alternatifs comme pi.dev.

LLMs Coding Agent development AI tools

RESEARCHarXiv CS.AI·il y a 2j

CrowdMath: A Dataset of Crowdsourced Mathematical Research Discussions

Cet article présente CrowdMath, un ensemble de données de 164 chaînes de progression annotées par des experts du programme CrowdMath du MIT PRIMES--Art of Problem Solving. Il vise à évaluer les grands modèles linguistiques sur la résolution collaborative de problèmes ouverts en mathématiques, se distinguant des benchmarks axés sur les réponses finales ou les preuves complètes.

mathematical reasoning LLMs datasets benchmarks

DOCML Mastery·il y a 18j

Building Context-Aware Search in Python with LLM Embeddings + Metadata

Ce contenu se concentre sur la création d'un système de recherche conscient du contexte en Python, en utilisant les intégrations de LLM et les métadonnées. Il explique comment surmonter les limites de la recherche par mots-clés, qui échoue si un terme n'est pas littéralement présent dans le document.

LLMs development Search embeddings

Building Context-Aware Search in Python with LLM Embeddings + Metadata

ARTICLE↑ trendingReddit r/LocalLLaMA·03/05/2026

One bash permission slipped...

Un utilisateur raconte un incident où un modèle de langage (LLM) a généré des commandes bash incorrectes, y compris un "rm -rf", entraînant une perturbation massive des données. Malgré la perte, l'utilisateur était soulagé de pousser fréquemment et a noté que l'incident s'était produit dans une VM isolée.

LLMs bash security data disruption

RESEARCHarXiv CS.LG·14/04/2026

Human-like Working Memory Interference in Large Language Models

Cette étude analyse les limitations de la mémoire de travail dans les Large Language Models (LLMs), mettant en évidence des signatures d'interférence similaires à celles observées chez l'homme. Les LLMs pré-entraînés montrent une dégradation des performances avec la charge de mémoire et un biais par la récence, bien que les transformateurs puissent être entraînés à résoudre ces tâches parfaitement.

LLMs AI limitations Working Memory human cognition

RESEARCHarXiv CS.CL·il y a 19j

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Cet article introduit PromptNCE, une méthode pour estimer l'information mutuelle ponctuelle (PMI) en utilisant uniquement des LLM et des invites d'estimation contrastive, contournant le besoin de critiques spécifiques à la tâche. Il présente un benchmark avec des PMI dérivés de l'humain et montre que PromptNCE atteint une corrélation de Spearman allant jusqu'à 0,82.

information theory LLMs prompt-engineering machine learning

RESEARCHarXiv CS.CL·20/04/2026

Consistency Analysis of Sentiment Predictions using Syntactic & Semantic Context Assessment Summarization (SSAS)

Cet article présente le cadre Syntactic & Semantic Context Assessment Summarization (SSAS) pour résoudre l'incohérence des prédictions de sentiment des LLM, un défi pour l'analyse d'entreprise fiable. Le SSAS agit comme un pré-processeur de données sophistiqué, utilisant une classification hiérarchique et une summarisation itérative pour établir un contexte à signal élevé et dense en sentiments, rendant les prédictions plus stables pour les décisions commerciales stratégiques.

LLMs sentiment analysis data preprocessing Enterprise AI

ARTICLE↑ trendingReddit r/LocalLLaMA·18/04/2026

Are you guys actually using local tool calling or is it a collective prank?

Un utilisateur exprime sa frustration face à la fonctionnalité d'appel d'outils locaux des LLM comme Qwen et Gemma, rencontrant des hallucinations et des boucles d'exécution en essayant de créer des fichiers. Il se demande si la difficulté est une limitation des petits modèles ou une erreur de configuration avec Open WebUI et LM Studio.

LLMs hallucination AI limitations open-source AI