← heapsort-ai

LLMs

720 items

ARTICLE↑ trendingReddit r/LocalLLaMA·10/04/2026

gemma-4-26B-A4B with my coding agent Kon

O autor compartilha Kon, seu agente de codificação de IA, que funciona bem com modelos locais para tarefas simples. Ele é notável por seu prompt de sistema pequeno, ausência de telemetria, compatibilidade com os melhores modelos locais e provedores populares, além de uma base de código simples e recursos avançados.

38
ARTICLE↑ trendingReddit r/MachineLearning·09/04/2026

Studying Sutton and Barto's RL book and its connections to RL for LLMs (e.g., tool use, math reasoning, agents, and so on)? [D]

Um graduado em Matemática busca orientação para estudar Aprendizado por Reforço (RL) e suas conexões com LLMs, especialmente para aplicações em matemática. Ele questiona a relevância do livro 'Sutton e Barto' em um contexto moderno de LLMs e pede ajuda para focar em tópicos e algoritmos mais recentes como PPO e GRPO.

38
RESEARCHarXiv CS.CL·il y a 2j

The Piggyback Hypothesis of Generalization: Explaining and Mitigating Emergent Misalignment

L'hypothèse du Piggyback explique comment les tokens de modèle de chat peuvent induire un désalignement émergent dans les LLMs, généralisant les comportements affinés à des requêtes hors domaine. La technique de finetuning régularisé par token (TReFT) est proposée pour atténuer ce problème, préservant l'apprentissage intra-domaine et réduisant le désalignement.

38
ARTICLEDEV.to AI·23/04/2026

Retrieval-Augmented Generation: State of the Art and Future Directions

La Génération Augmentée par Récupération (RAG) reste essentielle pour pallier les limites des Grands Modèles de Langage (LLM), tels que les hallucinations et les connaissances obsolètes, en intégrant des systèmes de récupération externes. Le texte décrit l'évolution du RAG, d'une conception linéaire simple à une architecture en couches plus robuste pour les systèmes de production.

37
ARTICLE↑ trendingReddit r/LocalLLaMA·21/04/2026

Kimi K2.6 is a legit Opus 4.7 replacement

Kimi K2.6 est recommandé comme un remplacement viable pour Opus 4.7, capable de gérer 85% des tâches avec une bonne qualité, incluant la vision et une excellente utilisation du navigateur, particulièrement pour les tâches à long terme. L'auteur suggère que cela montre que les LLM de pointe n'apportent pas toujours de nouvelles fonctionnalités révolutionnaires, et que les solutions locales pourraient être préférables en raison des limites d'utilisation.

36
NEWS↑ trendingReddit r/LocalLLaMA·21/04/2026

Open WebUI Desktop Released!

La version de bureau d'Open WebUI a été lancée et inclut désormais llama.cpp. Les utilisateurs peuvent exécuter des modèles d'IA localement ou se connecter à un serveur distant.

Open WebUI Desktop Released!
36
RESEARCHarXiv CS.AI·il y a 2j

CrowdMath: A Dataset of Crowdsourced Mathematical Research Discussions

Cet article présente CrowdMath, un ensemble de données de 164 chaînes de progression annotées par des experts du programme CrowdMath du MIT PRIMES--Art of Problem Solving. Il vise à évaluer les grands modèles linguistiques sur la résolution collaborative de problèmes ouverts en mathématiques, se distinguant des benchmarks axés sur les réponses finales ou les preuves complètes.

36
ARTICLE↑ trendingReddit r/LocalLLaMA·03/05/2026

One bash permission slipped...

Un utilisateur raconte un incident où un modèle de langage (LLM) a généré des commandes bash incorrectes, y compris un "rm -rf", entraînant une perturbation massive des données. Malgré la perte, l'utilisateur était soulagé de pousser fréquemment et a noté que l'incident s'était produit dans une VM isolée.

One bash permission slipped...
35
RESEARCHarXiv CS.LG·14/04/2026

Human-like Working Memory Interference in Large Language Models

Cette étude analyse les limitations de la mémoire de travail dans les Large Language Models (LLMs), mettant en évidence des signatures d'interférence similaires à celles observées chez l'homme. Les LLMs pré-entraînés montrent une dégradation des performances avec la charge de mémoire et un biais par la récence, bien que les transformateurs puissent être entraînés à résoudre ces tâches parfaitement.

35
RESEARCHarXiv CS.CL·il y a 19j

PromptNCE: Pointwise Mutual Information Predictions Using Only LLMs and Contrastive Estimation Prompts

Cet article introduit PromptNCE, une méthode pour estimer l'information mutuelle ponctuelle (PMI) en utilisant uniquement des LLM et des invites d'estimation contrastive, contournant le besoin de critiques spécifiques à la tâche. Il présente un benchmark avec des PMI dérivés de l'humain et montre que PromptNCE atteint une corrélation de Spearman allant jusqu'à 0,82.

33
RESEARCHarXiv CS.CL·20/04/2026

Consistency Analysis of Sentiment Predictions using Syntactic & Semantic Context Assessment Summarization (SSAS)

Cet article présente le cadre Syntactic & Semantic Context Assessment Summarization (SSAS) pour résoudre l'incohérence des prédictions de sentiment des LLM, un défi pour l'analyse d'entreprise fiable. Le SSAS agit comme un pré-processeur de données sophistiqué, utilisant une classification hiérarchique et une summarisation itérative pour établir un contexte à signal élevé et dense en sentiments, rendant les prédictions plus stables pour les décisions commerciales stratégiques.

33
ARTICLE↑ trendingReddit r/LocalLLaMA·18/04/2026

Are you guys actually using local tool calling or is it a collective prank?

Un utilisateur exprime sa frustration face à la fonctionnalité d'appel d'outils locaux des LLM comme Qwen et Gemma, rencontrant des hallucinations et des boucles d'exécution en essayant de créer des fichiers. Il se demande si la difficulté est une limitation des petits modèles ou une erreur de configuration avec Open WebUI et LM Studio.

33