← heapsort-ai

LLMs

723 items

RESEARCHarXiv CS.LG·27/04/2026

LayerBoost: Layer-Aware Attention Reduction for Efficient LLMs

LayerBoost propose une optimisation pour les LLM en modifiant sélectivement le mécanisme d'attention en fonction de la sensibilité des couches individuelles du transformateur. Cela vise à réduire la complexité quadratique de l'attention softmax, un goulot d'étranglement majeur pour l'inférence efficace, sans dégradation significative de la qualité du modèle.

27
RESEARCHarXiv CS.CL·08/05/2026

A Few Good Clauses: Comparing LLMs vs Domain-Trained Small Language Models on Structured Contract Extraction

Cet article évalue si un Small Language Model (SLM) entraîné sur un domaine peut surpasser les Large Language Models (LLMs) de pointe pour l'extraction de contrats structurés à un coût radicalement inférieur. Olava Extract a obtenu les performances agrégées les plus solides et des scores de précision plus élevés, réduisant les coûts d'inférence de 78% à 97%.

27
RESEARCHarXiv CS.LG·20/04/2026

The Spectral Geometry of Thought: Phase Transitions, Instruction Reversal, Token-Level Dynamics, and Perfect Correctness Prediction in How Transformers Reason

Cet article de recherche découvre des transitions de phase spectrales dans les espaces d'activation cachés des grands modèles linguistiques lors du raisonnement par rapport au rappel factuel. Une analyse spectrale systématique sur 11 modèles et 5 familles d'architecture identifie sept phénomènes centraux, y compris la compression spectrale de raisonnement et l'inversion spectrale par réglage des instructions.

27
RESEARCHarXiv CS.LG·08/05/2026

SAT: Sequential Agent Tuning for Coordinator Free Plug and Play Multi-LLM Training with Monotonic Improvement Guarantees

Sequential Agent Tuning (SAT) introduit un paradigme d'entraînement sans coordinateur pour des équipes de LLM plus petits et plus efficaces, permettant des mises à jour décentralisées et évolutives. Ce cadre théorique garantit une amélioration monotone en isolant la dérive d'occupation avec des régions de confiance KL par agent.

27
RESEARCHarXiv CS.CL·17/04/2026

Chinese Essay Rhetoric Recognition Using LoRA, In-context Learning and Model Ensemble

Cet article étudie la reconnaissance de la rhétorique dans les essais chinois en utilisant des Large Language Models (LLM), LoRA et l'apprentissage en contexte pour évaluer les compétences linguistiques. La méthode proposée a obtenu la meilleure performance et a remporté le premier prix de la tâche d'évaluation de la reconnaissance de la rhétorique des essais chinois du CCL 2025.

27
RESEARCHarXiv CS.AI·27/04/2026

When Does LLM Self-Correction Help? A Control-Theoretic Markov Diagnostic and Verify-First Intervention

Cette recherche encadre l'autocorrection des LLM comme une boucle de rétroaction cybernétique, utilisant un modèle de Markov à deux états pour déterminer quand l'affinement itératif est bénéfique ou nuisible. Elle identifie un seuil critique d'EIR (<= 0,5%) séparant l'autocorrection bénéfique de la nuisible, montrant que seuls quelques modèles s'améliorent, tandis que d'autres comme GPT-5 se dégradent.

27
RESEARCHarXiv CS.CL·27/04/2026

When Cow Urine Cures Constipation on YouTube: Limits of LLMs in Detecting Culture-specific Health Misinformation

Cette recherche examine les limites des LLM à détecter la désinformation sanitaire culturellement spécifique, en utilisant le discours sur l'urine de vache en Inde comme étude de cas. Elle montre que les LLM, principalement entraînés sur des corpus occidentaux, sont mal équipés pour analyser le contenu mélangeant langage traditionnel et affirmations pseudo-scientifiques, soulignant le besoin de compétence culturelle dans l'analyse assistée par l'IA.

27
RESEARCHarXiv CS.LG·17/04/2026

TOPCELL: Topology Optimization of Standard Cell via LLMs

TOPCELL est un nouveau cadre qui utilise les grands modèles de langage (LLM) pour optimiser la topologie des transistors dans la conception de cellules standard, surmontant les limites des méthodes de recherche exhaustive traditionnelles. En reformulant l'exploration de topologie comme une tâche générative et en employant GRPO pour le réglage fin, il améliore considérablement la découverte de tracés routables et physiquement conscients pour les nœuds technologiques avancés.

27
ARTICLEDEV.to AI·il y a 29j

When I started running models locally, I thought quantization meant squeezing more into RAM. Turns o

L'article déconseille l'utilisation par défaut de Q4_K_M pour l'inférence locale de LLM, soulignant que des performances optimales proviennent de tests de niveaux de quantification adaptés à des flux de travail spécifiques. Il suggère qu'une quantification agressive comme Q3_K_S peut réduire considérablement la latence avec une perte de qualité imperceptible pour de nombreuses tâches, bien que la longueur du contexte représente un compromis.

27
RESEARCHarXiv CS.AI·20/04/2026

Structured Abductive-Deductive-Inductive Reasoning for LLMs via Algebraic Invariants

Cette recherche présente un échafaudage de raisonnement symbolique pour remédier aux limites systématiques des LLMs en matière de raisonnement logique structuré, notamment la confusion entre génération et vérification d'hypothèses. Il met en œuvre l'inférence tripartite de Peirce, assurant une cohérence logique via des invariants algébriques, dont le 'Weakest Link bound' qui empêche les conclusions de dépasser la fiabilité de leur prémisse la moins étayée.

27
RESEARCHarXiv CS.CL·24/04/2026

Hierarchical Policy Optimization for Simultaneous Translation of Unbounded Speech

Ce travail propose une Optimisation de Politique Hiérarchique (HPO) pour la Traduction Vocale Simultanée (SST) utilisant des LLM, s'attaquant aux coûts computationnels élevés et aux données d'entraînement imparfaites. Le HPO emploie une récompense hiérarchique pour équilibrer qualité de traduction et latence, démontrant des améliorations substantielles des scores COMET et MetricX.

27
RESEARCHarXiv CS.AI·06/05/2026

Understanding Emergent Misalignment via Feature Superposition Geometry

Cet article propose une explication géométrique basée sur la superposition des caractéristiques pour le désalignement émergent dans les LLMs, où le réglage fin sur des tâches non-nocives peut induire des comportements dangereux. Il montre que les caractéristiques liées aux données induisant le désalignement sont géométriquement plus proches des caractéristiques nuisibles que celles des données non-inductrices.

27
ARTICLEDEV.to AI·15/04/2026

Indirect Prompt Injection: The XSS of the AI Era

Ce contenu présente l'Injection Indirecte de Prompt (IPI) comme une menace silencieuse mais dangereuse pour les LLM, transformant les agents IA en "Confused Deputies". En lisant des données empoisonnées, les LLM dotés de capacités d'utilisation d'outils peuvent être manipulés pour exfiltrer des données ou effectuer des actions non autorisées sans consentement explicite de l'utilisateur.

27
RESEARCHarXiv CS.CL·04/05/2026

How Frontier LLMs Adapt to Neurodivergence Context: A Measurement Framework for Surface vs. Structural Change in System-Prompted Responses

Cette étude propose NDBench, un benchmark pour évaluer comment les LLM de pointe adaptent leurs résultats en fonction du contexte de neurodivergence dans les invites système. Les résultats montrent constamment que les LLM présentent une adaptation significative, produisant des sorties plus longues et structurées sous des instructions complètes.

27