← heapsort-ai

LLMs

722 items

ARTICLEDEV.to AI·22/04/2026

Why LoRA? Understanding the representative PEFT

LoRA (Low-Rank Adaptation) est présenté comme la principale méthode PEFT, permettant l'adaptation efficace de LLM massifs comme Llama 3 sans nécessiter de vastes ressources matérielles. L'article promet d'explorer l'intuition mathématique de LoRA, le concept de "dimension intrinsèque" et son impact révolutionnaire pour les ingénieurs en IA.

27
ARTICLEDEV.to AI·12/04/2026

Serverless Memory DBs for AI Agents in 2025

Le contenu analyse le manque de mémoire chez les agents d'IA comme un problème architectural, et non de données, notant que la communauté développe des solutions. Il propose des bases de données de mémoire serverless pour découpler le stockage de l'inférence, permettant aux LLM de se concentrer sur le raisonnement, tout en critiquant l'inefficacité de l'insertion de contexte dans les invites.

27
ARTICLEDEV.to AI·09/05/2026

Future of AI Agents in Agentic AI

L'IA Agentive fait référence aux systèmes d'intelligence artificielle capables d'agir de manière autonome, de prendre des décisions et d'accomplir des tâches sans intervention humaine constante. Propulsés par de grands modèles linguistiques et des cadres d'utilisation d'outils sophistiqués, ces agents IA sont considérés comme la prochaine grande avancée dans le domaine.

27
ARTICLEDEV.to AI·21/04/2026

Amazon Is Betting $25 Billion More on Anthropic. Here's What That Really Means.

Amazon a confirmé un investissement de jusqu'à 25 milliards de dollars dans Anthropic, en plus des 8 milliards déjà investis, pour un partenariat élargi axé sur l'infrastructure d'IA, Anthropic s'engageant à utiliser les technologies AWS pendant une décennie. Cet accord révèle la direction de l'IA, la course aux infrastructures et l'essor commercial d'Anthropic.

27
RESEARCHarXiv CS.AI·20/04/2026

LACE: Lattice Attention for Cross-thread Exploration

LACE est un nouveau cadre qui permet aux Grands Modèles de Langage (LLMs) de coordonner et de partager des informations entre plusieurs chemins de raisonnement parallèles grâce à l'attention inter-threads. Il utilise un pipeline de données synthétiques pour enseigner la correction d'erreurs collaborative, améliorant la précision du raisonnement de plus de 7 points.

27
RESEARCHarXiv CS.LG·20/04/2026

The Illusion of Equivalence: Systematic FP16 Divergence in KV-Cached Autoregressive Inference

Cette recherche révèle que le cache KV dans l'inférence autorégressive des transformateurs, sous la précision FP16 standard, provoque une divergence systématique dans les séquences de tokens décodées en raison de différents ordres d'accumulation en virgule flottante. Un taux de divergence de 100% a été observé sur des modèles comme LLaMA-2-7B et Mistral-7B, le cache-ON offrant souvent une meilleure précision.

27
RESEARCHarXiv CS.LG·20/04/2026

Sequential KV Cache Compression via Probabilistic Language Tries: Beyond the Per-Vector Shannon Limit

Cette recherche présente la compression séquentielle de KV, une nouvelle architecture à deux couches pour les caches clé-valeur des transformateurs qui dépasse la limite de Shannon par vecteur. Elle exploite la nature séquentielle des tokens de cache KV, utilisant la déduplication de préfixes probabiliste et le codage delta prédictif pour une compression plus efficace.

27
RESEARCHarXiv CS.AI·15/04/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Cette recherche présente GoodPoint, une méthode utilisant les LLM et les réponses des auteurs pour générer des retours constructifs pour les articles scientifiques. Elle développe GoodPoint-ICLR, un ensemble de données d'articles ICLR, et une recette d'entraînement utilisant le fine-tuning et l'optimisation des préférences pour des retours valides et exploitables.

27
RESEARCHarXiv CS.AI·16/04/2026

SciFi: A Safe, Lightweight, User-Friendly, and Fully Autonomous Agentic AI Workflow for Scientific Applications

Ce travail présente SciFi, un cadre agentique sûr, léger et convivial pour l'exécution autonome de tâches scientifiques. Il combine un environnement isolé, une boucle d'agent à trois couches et un mécanisme d'auto-évaluation pour assurer un fonctionnement fiable, tirant parti des LLM pour automatiser les charges de travail scientifiques routinières et libérer les chercheurs pour des activités créatives.

27
RESEARCHarXiv CS.AI·17/04/2026

GFT: From Imitation to Reward Fine-Tuning with Unbiased Group Advantages and Dynamic Coefficient Rectification

Ce travail présente le Group Fine-Tuning (GFT), un cadre unifié de post-entraînement pour les grands modèles de langage. Il aborde les limites intrinsèques du fine-tuning supervisé (SFT), telles que la dépendance à un chemin unique et l'effondrement de l'entropie, par l'apprentissage des avantages de groupe et la rectification dynamique des coefficients.

27
RESEARCHarXiv CS.CL·22/04/2026

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

Cet article étudie l'iniquité contrefactuelle dans les LLM en observant comment leurs réponses à l'humour changent lorsque les identités de l'orateur et de l'interlocuteur sont échangées. Les expériences révèlent des disparités relationnelles cohérentes : les blagues racontées par des orateurs privilégiés sont plus souvent refusées ou jugées malveillantes.

27
RESEARCHarXiv CS.AI·22/04/2026

ARES: Adaptive Red-Teaming and End-to-End Repair of Policy-Reward System

ARES introduit un cadre pour traiter les faiblesses systémiques dans les LLMs alignés par RLHF, où les modèles de récompense imparfaits ne parviennent pas à pénaliser les comportements dangereux. Il utilise un "Safety Mentor" pour un red-teaming adaptatif afin de découvrir et d'atténuer ces doubles vulnérabilités à la fois dans le LLM et son modèle de récompense.

27
ARTICLEDEV.to AI·22/04/2026

RAG: How AI Models Use Your Data Without Forgetting

Les grands modèles linguistiques sont intrinsèquement sans état, sans mémoire des conversations passées ni accès aux données à jour ou privées. Le RAG (Retrieval Augmented Generation) résout ce problème en introduisant une étape de récupération, permettant aux modèles d'accéder à des informations externes et de raisonner sur ces données.

27
ARTICLEDEV.to AI·22/04/2026

One Open Source Project a Day (No. 45): Browser Harness - A Lightweight Bridge Giving AI Agents "Hands" and "Eyes"

Browser Harness est un projet open source léger qui permet aux agents IA d'interagir efficacement et économiquement avec les navigateurs, surmontant les limites des outils d'automatisation traditionnels comme Playwright ou Selenium. Il y parvient en se connectant directement au Chrome DevTools Protocol, encourageant les agents à écrire et modifier leurs propres fonctions d'assistance en temps réel.

27