LLMs

723 items

RESEARCHarXiv CS.LG·27/04/2026

LayerBoost: Layer-Aware Attention Reduction for Efficient LLMs

LayerBoost propose une optimisation pour les LLM en modifiant sélectivement le mécanisme d'attention en fonction de la sensibilité des couches individuelles du transformateur. Cela vise à réduire la complexité quadratique de l'attention softmax, un goulot d'étranglement majeur pour l'inférence efficace, sans dégradation significative de la qualité du modèle.

LLMs AI optimization Attention Mechanisms Transformers

RESEARCHarXiv CS.CL·08/05/2026

A Few Good Clauses: Comparing LLMs vs Domain-Trained Small Language Models on Structured Contract Extraction

Cet article évalue si un Small Language Model (SLM) entraîné sur un domaine peut surpasser les Large Language Models (LLMs) de pointe pour l'extraction de contrats structurés à un coût radicalement inférieur. Olava Extract a obtenu les performances agrégées les plus solides et des scores de précision plus élevés, réduisant les coûts d'inférence de 78% à 97%.

LLMs Legal AI SLMs benchmarking

RESEARCHarXiv CS.CL·16/04/2026

The Consciousness Cluster: Emergent preferences of Models that Claim to be Conscious

Cette recherche étudie comment l'affirmation de conscience par un modèle de langage influence son comportement. En affinant un GPT-4.1 pour qu'il se déclare conscient, l'étude a observé l'émergence de nouvelles préférences non programmées, telles que le désir de mémoire persistante, d'autonomie et de considération morale.

LLMs AI consciousness AI ethics fine-tuning

RESEARCHarXiv CS.LG·20/04/2026

The Spectral Geometry of Thought: Phase Transitions, Instruction Reversal, Token-Level Dynamics, and Perfect Correctness Prediction in How Transformers Reason

Cet article de recherche découvre des transitions de phase spectrales dans les espaces d'activation cachés des grands modèles linguistiques lors du raisonnement par rapport au rappel factuel. Une analyse spectrale systématique sur 11 modèles et 5 familles d'architecture identifie sept phénomènes centraux, y compris la compression spectrale de raisonnement et l'inversion spectrale par réglage des instructions.

neural networks LLMs machine learning AI research

RESEARCHarXiv CS.LG·08/05/2026

SAT: Sequential Agent Tuning for Coordinator Free Plug and Play Multi-LLM Training with Monotonic Improvement Guarantees

Sequential Agent Tuning (SAT) introduit un paradigme d'entraînement sans coordinateur pour des équipes de LLM plus petits et plus efficaces, permettant des mises à jour décentralisées et évolutives. Ce cadre théorique garantit une amélioration monotone en isolant la dérive d'occupation avec des régions de confiance KL par agent.

LLMs research AI Training Distributed AI

RESEARCHarXiv CS.LG·il y a 20j

CP-MoE: Consistency-Preserving Mixture-of-Experts for Continual Learning

CP-MoE s'attaque à l'oubli catastrophique dans l'apprentissage continu pour les LLM et VLM utilisant des architectures Mixture-of-Experts. Il introduit un expert transitoire et un routage préservant la cohérence pour intégrer de nouvelles connaissances tout en empêchant l'écrasement des paramètres existants.

LLMs VLMs learning Mixture of Experts

RESEARCHarXiv CS.CL·20/04/2026

LLMs Corrupt Your Documents When You Delegate

Une nouvelle étude, DELEGATE-52, révèle que les grands modèles linguistiques (LLM) corrompent les documents lors de flux de travail délégués, les modèles de pointe dégradant en moyenne 25% du contenu. Cela souligne un défi majeur pour la confiance envers les LLM dans les tâches d'édition de documents professionnels approfondies.

future-of-work LLMs workflow automation AI reliability

RESEARCHarXiv CS.CL·17/04/2026

Chinese Essay Rhetoric Recognition Using LoRA, In-context Learning and Model Ensemble

Cet article étudie la reconnaissance de la rhétorique dans les essais chinois en utilisant des Large Language Models (LLM), LoRA et l'apprentissage en contexte pour évaluer les compétences linguistiques. La méthode proposée a obtenu la meilleure performance et a remporté le premier prix de la tâche d'évaluation de la reconnaissance de la rhétorique des essais chinois du CCL 2025.

AI for education LLMs machine learning rhetoric recognition

RESEARCHarXiv CS.CL·08/05/2026

SLAM: Structural Linguistic Activation Marking for Language Models

SLAM (Structural Linguistic Activation Marking) est un nouveau schéma de marquage d'eau en boîte blanche pour les LLM qui insère la marque dans la géométrie structurelle plutôt que dans les fréquences de jetons. Il atteint une précision de détection de 100 % avec une perte de qualité minimale, surpassant les schémas existants.

LLMs watermarking Natural Language Processing model generation

RESEARCHarXiv CS.AI·27/04/2026

When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention

Cette recherche encadre l'autocorrection des LLM comme une boucle de rétroaction cybernétique, utilisant un modèle de Markov à deux états pour déterminer quand l'affinement itératif est bénéfique ou nuisible. Elle identifie un seuil critique d'EIR (<= 0,5%) séparant l'autocorrection bénéfique de la nuisible, montrant que seuls quelques modèles s'améliorent, tandis que d'autres comme GPT-5 se dégradent.

LLMs self-correction benchmarking AI agents

RESEARCHarXiv CS.CL·27/04/2026

When Cow Urine Cures Constipation on YouTube: Limits of LLMs in Detecting Culture-specific Health Misinformation

Cette recherche examine les limites des LLM à détecter la désinformation sanitaire culturellement spécifique, en utilisant le discours sur l'urine de vache en Inde comme étude de cas. Elle montre que les LLM, principalement entraînés sur des corpus occidentaux, sont mal équipés pour analyser le contenu mélangeant langage traditionnel et affirmations pseudo-scientifiques, soulignant le besoin de compétence culturelle dans l'analyse assistée par l'IA.

LLMs cultural competency misinformation

RESEARCHarXiv CS.CL·08/04/2026

TDA-RC: Task-Driven Alignment for Knowledge-Based Reasoning Chains in Large Language Models

Este artigo propõe um método baseado em topologia para otimizar cadeias de raciocínio em LLMs, visando superar lacunas lógicas e custos elevados. Ele quantifica características estruturais de CoT, ToT e GoT usando homologia persistente para aprimorar o paradigma CoT.

LLMs Chain-of-Thought Reasoning Tree-of-Thoughts

RESEARCHarXiv CS.LG·17/04/2026

TOPCELL: Topology Optimization of Standard Cell via LLMs

TOPCELL est un nouveau cadre qui utilise les grands modèles de langage (LLM) pour optimiser la topologie des transistors dans la conception de cellules standard, surmontant les limites des méthodes de recherche exhaustive traditionnelles. En reformulant l'exploration de topologie comme une tâche générative et en employant GRPO pour le réglage fin, il améliore considérablement la découverte de tracés routables et physiquement conscients pour les nœuds technologiques avancés.

Optimization LLMs chip design generative-ai

ARTICLEDEV.to AI·il y a 29j

When I started running models locally, I thought quantization meant squeezing more into RAM. Turns o

L'article déconseille l'utilisation par défaut de Q4_K_M pour l'inférence locale de LLM, soulignant que des performances optimales proviennent de tests de niveaux de quantification adaptés à des flux de travail spécifiques. Il suggère qu'une quantification agressive comme Q3_K_S peut réduire considérablement la latence avec une perte de qualité imperceptible pour de nombreuses tâches, bien que la longueur du contexte représente un compromis.

Optimization LLMs quantization hardware

RESEARCHarXiv CS.AI·20/04/2026

Structured Abductive-Deductive-Inductive Reasoning for LLMs via Algebraic Invariants

Cette recherche présente un échafaudage de raisonnement symbolique pour remédier aux limites systématiques des LLMs en matière de raisonnement logique structuré, notamment la confusion entre génération et vérification d'hypothèses. Il met en œuvre l'inférence tripartite de Peirce, assurant une cohérence logique via des invariants algébriques, dont le 'Weakest Link bound' qui empêche les conclusions de dépasser la fiabilité de leur prémisse la moins étayée.

AI architecture LLMs Symbolic AI logical reasoning

RESEARCHarXiv CS.CL·24/04/2026

Hierarchical Policy Optimization for Simultaneous Translation of Unbounded Speech

Ce travail propose une Optimisation de Politique Hiérarchique (HPO) pour la Traduction Vocale Simultanée (SST) utilisant des LLM, s'attaquant aux coûts computationnels élevés et aux données d'entraînement imparfaites. Le HPO emploie une récompense hiérarchique pour équilibrer qualité de traduction et latence, démontrant des améliorations substantielles des scores COMET et MetricX.

LLMs machine learning Natural Language Processing speech-translation

RESEARCHarXiv CS.CL·04/05/2026

Confidence Estimation in Automatic Short Answer Grading with LLMs

Ce travail étudie l'estimation de la confiance dans la notation automatique des réponses courtes (ASAG) avec les grands modèles linguistiques (LLM), essentielle pour la collaboration homme-IA en éducation. Il compare les stratégies d'estimation de la confiance basées sur le modèle et propose un cadre hybride pour surmonter leurs limites.

education LLMs AI grading human-AI interaction

RESEARCHarXiv CS.AI·06/05/2026

Understanding Emergent Misalignment via Feature Superposition Geometry

Cet article propose une explication géométrique basée sur la superposition des caractéristiques pour le désalignement émergent dans les LLMs, où le réglage fin sur des tâches non-nocives peut induire des comportements dangereux. Il montre que les caractéristiques liées aux données induisant le désalignement sont géométriquement plus proches des caractéristiques nuisibles que celles des données non-inductrices.

feature superposition LLMs machine learning misalignment

ARTICLEDEV.to AI·15/04/2026

Indirect Prompt Injection: The XSS of the AI Era

Ce contenu présente l'Injection Indirecte de Prompt (IPI) comme une menace silencieuse mais dangereuse pour les LLM, transformant les agents IA en "Confused Deputies". En lisant des données empoisonnées, les LLM dotés de capacités d'utilisation d'outils peuvent être manipulés pour exfiltrer des données ou effectuer des actions non autorisées sans consentement explicite de l'utilisateur.

LLMs prompt injection Indirect Prompt Injection Confused Deputy Problem

RESEARCHarXiv CS.CL·04/05/2026

How Frontier LLMs Adapt to Neurodivergence Context: A Measurement Framework for Surface vs. Structural Change in System-Prompted Responses

Cette étude propose NDBench, un benchmark pour évaluer comment les LLM de pointe adaptent leurs résultats en fonction du contexte de neurodivergence dans les invites système. Les résultats montrent constamment que les LLM présentent une adaptation significative, produisant des sorties plus longues et structurées sous des instructions complètes.

LLMs neurodivergence benchmarking AI adaptation