LLMs

722 items

ARTICLEDEV.to AI·22/04/2026

Why LoRA? Understanding the representative PEFT

LoRA (Low-Rank Adaptation) est présenté comme la principale méthode PEFT, permettant l'adaptation efficace de LLM massifs comme Llama 3 sans nécessiter de vastes ressources matérielles. L'article promet d'explorer l'intuition mathématique de LoRA, le concept de "dimension intrinsèque" et son impact révolutionnaire pour les ingénieurs en IA.

LLMs deep learning fine-tuning PEFT

ARTICLEDEV.to AI·12/04/2026

Serverless Memory DBs for AI Agents in 2025

Le contenu analyse le manque de mémoire chez les agents d'IA comme un problème architectural, et non de données, notant que la communauté développe des solutions. Il propose des bases de données de mémoire serverless pour découpler le stockage de l'inférence, permettant aux LLM de se concentrer sur le raisonnement, tout en critiquant l'inefficacité de l'insertion de contexte dans les invites.

LLMs memory Architecture serverless databases

ARTICLEDEV.to AI·09/05/2026

Future of AI Agents in Agentic AI

L'IA Agentive fait référence aux systèmes d'intelligence artificielle capables d'agir de manière autonome, de prendre des décisions et d'accomplir des tâches sans intervention humaine constante. Propulsés par de grands modèles linguistiques et des cadres d'utilisation d'outils sophistiqués, ces agents IA sont considérés comme la prochaine grande avancée dans le domaine.

future of AI LLMs Agentic AI AI Agents

ARTICLEDEV.to AI·21/04/2026

Amazon Is Betting $25 Billion More on Anthropic. Here's What That Really Means.

Amazon a confirmé un investissement de jusqu'à 25 milliards de dollars dans Anthropic, en plus des 8 milliards déjà investis, pour un partenariat élargi axé sur l'infrastructure d'IA, Anthropic s'engageant à utiliser les technologies AWS pendant une décennie. Cet accord révèle la direction de l'IA, la course aux infrastructures et l'essor commercial d'Anthropic.

LLMs cloud computing AWS AI partnership

ARTICLEML Mastery·il y a 7j

Scikit-LLM vs. Traditional Text Classifiers: When Should You Use an LLM?

Le contenu examine comment les modèles d'IA générative, tels que les LLM, ont progressivement supplanté les méthodes d'apprentissage automatique traditionnelles pour des tâches comme la classification de texte. Il aborde le moment opportun pour utiliser un LLM.

LLMs machine learning text classification Scikit-LLM

Scikit-LLM vs. Traditional Text Classifiers: When Should You Use an LLM?

ARTICLEDEV.to AI·21/04/2026

Harness Engineering: The Most Important Part of AI Agents

L'article affirme que les agents d'IA proviennent non pas d'LLMs plus intelligents, mais de leur intégration dans un système robuste grâce à l'"ingénierie du harnais". Cette approche met l'accent sur les défis pratiques de la construction d'applications d'IA fiables et réelles, au-delà de la performance du modèle.

System Design LLMs Reliability software engineering

ARTICLEDEV.to AI·15/04/2026

AI Tech Daily Agent — Complete Architecture Deep Dive & Workflow Analysis

Ce contenu explore en détail l'architecture et le flux de travail d'un agent d'IA autonome, basé sur le framework Fetch.ai uAgents, dédié au journalisme technologique quotidien. Il décrit comment ce système automatise la recherche, l'analyse et la génération d'articles complets sur la technologie et l'IA.

LLMs workflow automation Autonomous systems Architecture

RESEARCHarXiv CS.AI·20/04/2026

LACE: Lattice Attention for Cross-thread Exploration

LACE est un nouveau cadre qui permet aux Grands Modèles de Langage (LLMs) de coordonner et de partager des informations entre plusieurs chemins de raisonnement parallèles grâce à l'attention inter-threads. Il utilise un pipeline de données synthétiques pour enseigner la correction d'erreurs collaborative, améliorant la précision du raisonnement de plus de 7 points.

synthetic data LLMs Attention Mechanisms AI Reasoning

RESEARCHarXiv CS.LG·20/04/2026

The Illusion of Equivalence: Systematic FP16 Divergence in KV-Cached Autoregressive Inference

Cette recherche révèle que le cache KV dans l'inférence autorégressive des transformateurs, sous la précision FP16 standard, provoque une divergence systématique dans les séquences de tokens décodées en raison de différents ordres d'accumulation en virgule flottante. Un taux de divergence de 100% a été observé sur des modèles comme LLaMA-2-7B et Mistral-7B, le cache-ON offrant souvent une meilleure précision.

AI models inference LLMs numerical precision

RESEARCHarXiv CS.LG·20/04/2026

Sequential KV Cache Compression via Probabilistic Language Tries: Beyond the Per-Vector Shannon Limit

Cette recherche présente la compression séquentielle de KV, une nouvelle architecture à deux couches pour les caches clé-valeur des transformateurs qui dépasse la limite de Shannon par vecteur. Elle exploite la nature séquentielle des tokens de cache KV, utilisant la déduplication de préfixes probabiliste et le codage delta prédictif pour une compression plus efficace.

Transformer Architecture AI models LLMs data compression

RESEARCHarXiv CS.AI·15/04/2026

GoodPoint: Learning Constructive Scientific Paper Feedback from Author Responses

Cette recherche présente GoodPoint, une méthode utilisant les LLM et les réponses des auteurs pour générer des retours constructifs pour les articles scientifiques. Elle développe GoodPoint-ICLR, un ensemble de données d'articles ICLR, et une recette d'entraînement utilisant le fine-tuning et l'optimisation des préférences pour des retours valides et exploitables.

LLMs Feedback Generation machine learning NLP

RESEARCHarXiv CS.AI·16/04/2026

SciFi: A Safe, Lightweight, User-Friendly, and Fully Autonomous Agentic AI Workflow for Scientific Applications

Ce travail présente SciFi, un cadre agentique sûr, léger et convivial pour l'exécution autonome de tâches scientifiques. Il combine un environnement isolé, une boucle d'agent à trois couches et un mécanisme d'auto-évaluation pour assurer un fonctionnement fiable, tirant parti des LLM pour automatiser les charges de travail scientifiques routinières et libérer les chercheurs pour des activités créatives.

LLMs Workflow Agentic AI automation

RESEARCHarXiv CS.AI·17/04/2026

GFT: From Imitation to Reward Fine-Tuning with Unbiased Group Advantages and Dynamic Coefficient Rectification

Ce travail présente le Group Fine-Tuning (GFT), un cadre unifié de post-entraînement pour les grands modèles de langage. Il aborde les limites intrinsèques du fine-tuning supervisé (SFT), telles que la dépendance à un chemin unique et l'effondrement de l'entropie, par l'apprentissage des avantages de groupe et la rectification dynamique des coefficients.

LLMs reinforcement learning post-training machine learning

ARTICLEDEV.to AI·06/05/2026

Released my first open source project — MIT-licensed CLI for AI-assisted commit messages

L'auteur a lancé son premier projet open source, un outil CLI sous licence MIT pour les messages de commit assistés par l'IA. Le projet prend en charge les modèles locaux via l'intégration d'Ollama et l'auteur s'engage à la maintenance, ouvert aux co-mainteneurs si l'intérêt augmente.

open-source LLMs development AI tools

RESEARCHarXiv CS.CL·22/04/2026

Scripts Through Time: A Survey of the Evolving Role of Transliteration in NLP

Cet article explore le rôle de la translittération en PNL, une technique essentielle pour surmonter la "barrière d'écriture" dans le transfert interlinguistique. Il présente une taxonomie des motivations et approches, analysant leur efficacité et leur pertinence pour les LLM modernes dans divers contextes.

Cross-lingual AI language models LLMs NLP

RESEARCHarXiv CS.CL·22/04/2026

Investigating Counterfactual Unfairness in LLMs towards Identities through Humor

Cet article étudie l'iniquité contrefactuelle dans les LLM en observant comment leurs réponses à l'humour changent lorsque les identités de l'orateur et de l'interlocuteur sont échangées. Les expériences révèlent des disparités relationnelles cohérentes : les blagues racontées par des orateurs privilégiés sont plus souvent refusées ou jugées malveillantes.

ethics social impact LLMs Bias

RESEARCHarXiv CS.AI·22/04/2026

ARES: Adaptive Red-Teaming and End-to-End Repair of Policy-Reward System

ARES introduit un cadre pour traiter les faiblesses systémiques dans les LLMs alignés par RLHF, où les modèles de récompense imparfaits ne parviennent pas à pénaliser les comportements dangereux. Il utilise un "Safety Mentor" pour un red-teaming adaptatif afin de découvrir et d'atténuer ces doubles vulnérabilités à la fois dans le LLM et son modèle de récompense.

LLMs reinforcement learning security

ARTICLEDEV.to AI·22/04/2026

RAG: How AI Models Use Your Data Without Forgetting

Les grands modèles linguistiques sont intrinsèquement sans état, sans mémoire des conversations passées ni accès aux données à jour ou privées. Le RAG (Retrieval Augmented Generation) résout ce problème en introduisant une étape de récupération, permettant aux modèles d'accéder à des informations externes et de raisonner sur ces données.

LLMs RAG AI Information Retrieval

ARTICLEDEV.to AI·il y a 27j

The Death of RAG? Long-Context Windows vs. Vector Databases

L'article examine si la Génération Augmentée par Récupération (RAG) est rendue obsolète par les grandes fenêtres contextuelles des nouveaux LLM. Il soutient que le RAG reste pertinent en raison de son efficacité en termes de coûts, de sa latence réduite et de son efficacité dans la gestion des données propriétaires fréquemment mises à jour.

AI architecture LLMs Vector Databases RAG

ARTICLEDEV.to AI·22/04/2026

One Open Source Project a Day (No. 45): Browser Harness - A Lightweight Bridge Giving AI Agents "Hands" and "Eyes"

Browser Harness est un projet open source léger qui permet aux agents IA d'interagir efficacement et économiquement avec les navigateurs, surmontant les limites des outils d'automatisation traditionnels comme Playwright ou Selenium. Il y parvient en se connectant directement au Chrome DevTools Protocol, encourageant les agents à écrire et modifier leurs propres fonctions d'assistance en temps réel.

open-source LLMs browser automation AI Agents