large language models

265 items

RESEARCHDEV.to AI·26/04/2026

AI 法律科技 2026 上半年中国市场扫描

Le marché chinois des technologies juridiques alimentées par l'IA connaît une expansion rapide au premier semestre 2026, atteignant 4,8 milliards de RMB avec une croissance de 78 %, propulsé par les grands modèles d'IA et les politiques réglementaires. Les segments clés sont l'examen des contrats, la recherche juridique et la génération d'actes d'accusation, les LLM domestiques atteignant une grande précision.

Regulatory policy AI China market large language models

RESEARCHDEV.to AI·16/04/2026

ExpertPrompting: Instructing Large Language Models to be Distinguished Experts

Ce contenu présente "ExpertPrompting", une méthode innovante pour instruire les grands modèles de langage à agir comme des experts distingués. Il vise à améliorer les connaissances spécialisées et les performances des modèles d'IA grâce à des techniques de prompt avancées.

AI models prompt-engineering large language models

ARTICLEDEV.to AI·19/04/2026

The Personal Small Model (PSM): Memory as a Learned Cognitive Primitive

Ce contenu critique l'hypothèse actuelle selon laquelle la mémoire des systèmes d'IA est un problème de stockage, proposant une architecture alternative inspirée de la spécialisation de la mémoire humaine. Il présente le Personal Small Model (PSM), un petit modèle entraîné à maîtriser les opérations de mémoire, telles que le filtrage de pertinence.

specialized AI models cognitive architecture AI Memory Systems large language models

NEWSDEV.to AI·il y a 8j

Claude Opus 4.8: Dynamic Workflows and Parallel Subagents

Anthropic a lancé Claude Opus 4.8, introduisant des flux de travail dynamiques permettant des centaines de sous-agents parallèles pour des tâches complexes. Cette version présente des améliorations significatives dans les benchmarks comme SWE-bench Verified et USAMO, avec des prix standard inchangés et un nouveau mode rapide plus abordable.

AI models Anthropic benchmarks large language models

DOCDEV.to AI·24/04/2026

How to implement Claude conversation history without storing everything (token-efficient pattern)

Ce contenu aborde une erreur courante dans le développement d'applications basées sur Claude : l'envoi de l'historique complet des conversations à chaque requête, entraînant des coûts de jetons élevés. Il propose un modèle efficace en termes de jetons pour gérer l'historique des conversations, garantissant la fonctionnalité tout en maîtrisant les dépenses de l'API.

Optimization Claude API large language models

RESEARCHAnthropic (YouTube)·07/05/2026

Translating Claude’s thoughts into language

Ce contenu explore le domaine fascinant de la traduction des processus internes ou des « pensées » d'un modèle d'intelligence artificielle comme Claude en un langage compréhensible. Il étudie comment les opérations complexes de l'IA peuvent être interprétées et exprimées pour mieux comprendre son raisonnement.

cognitive AI Natural Language Processing interpretability AI

Translating Claude’s thoughts into language

NEWSDEV.to AI·03/05/2026

Together AI Free API: Run Llama 3.3, DeepSeek R1, and FLUX Image Generation for Free in 2026

Together AI propose un accès API gratuit à des modèles avancés tels que Llama 3.3, DeepSeek R1 et FLUX pour la génération d'images. Cet accès gratuit sera disponible jusqu'en 2026, permettant aux développeurs d'utiliser ces puissantes capacités d'IA sans frais.

image generation API Free Access Together AI

ARTICLEDEV.to AI·19/04/2026

I Built an AI Memory System. Then I Forgot About It.

L'auteur a construit un système de mémoire IA pour Claude qui fonctionne depuis février. Cette rétrospective explore comment le système est devenu autosuffisant et intégré, réduisant le besoin de maintenance et d'intervention constantes de la part du créateur.

knowledge graphs AI Memory Systems personal projects large language models

RESEARCHarXiv CS.CL·15/04/2026

Self-Distillation Zero: Self-Revision Turns Binary Rewards into Dense Supervision

Self-Distillation Zero (SD-Zero) est une nouvelle méthode de post-entraînement plus efficace en termes d'échantillons que l'apprentissage par renforcement, sans nécessiter d'enseignants externes ou de démonstrations de haute qualité. Elle entraîne un modèle unique à jouer les rôles de Générateur et de Réviseur, transformant les récompenses binaires éparses en une supervision dense via l'autodistillation.

reinforcement learning post-training Dense Supervision Self-Distillation

RESEARCHarXiv CS.CL·15/04/2026

Narrative over Numbers: The Identifiable Victim Effect and its Amplification Under Alignment and Reasoning in Large Language Models

Cette recherche examine systématiquement l'Effet de la Victime Identifiable (EVI) dans les grands modèles linguistiques, un biais cognitif où les victimes décrites narrativement reçoivent plus de ressources que les groupes statistiques. L'étude empirique à grande échelle sur 16 LLM de pointe évalue si ces systèmes héritent des irrationalités affectives humaines dans des applications critiques comme le triage humanitaire et la modération de contenu.

Identifiable Victim Effect cognitive bias AI ethics large language models

RESEARCHarXiv CS.LG·15/04/2026

Disposition Distillation at Small Scale: A Three-Arc Negative Result

Cet article détaille une tentative de distiller des dispositions comportementales dans de petits modèles de langage (0.6B-2.3B paramètres) via un pipeline de distillation. Les gains initiaux rapportés ont été falsifiés en raison d'artefacts d'évaluation, aboutissant à un résultat négatif pour l'hypothèse principale et menant à trois arcs d'investigation ultérieurs.

Negative Results Model Distillation Behavioral Dispositions large language models

RESEARCHarXiv CS.LG·15/04/2026

A Layer-wise Analysis of Supervised Fine-Tuning

Cette recherche analyse le Supervised Fine-Tuning (SFT), révélant que les capacités de suivi des instructions émergent distinctement à travers les couches : les couches intermédiaires sont stables tandis que les couches finales sont très sensibles. S'appuyant sur cette observation, les auteurs proposent le Mid-Block Efficient Tuning, qui met à jour les couches intermédiaires critiques, surpassant le LoRA standard avec une surcharge de paramètres réduite.

Supervised Fine-Tuning Layer-wise Analysis Catastrophic Forgetting large language models

RESEARCHarXiv CS.AI·25/04/2026

Adaptive Test-Time Compute Allocation with Evolving In-Context Demonstrations

Ce travail présente un cadre innovant pour l'allocation adaptative de calcul au moment des tests, ajustant conjointement où la computation est dépensée et comment la génération est effectuée. La méthode utilise une phase d'échauffement pour identifier les requêtes faciles, puis concentre le calcul supplémentaire sur les requêtes non résolues, en remodelant les distributions de génération avec des démonstrations en contexte évolutives.

deep learning machine learning in-context learning AI

RESEARCHarXiv CS.AI·13/04/2026

Model Space Reasoning as Search in Feedback Space for Planning Domain Generation

Cette recherche étudie l'utilisation d'un cadre de rétroaction de modèle linguistique agentique pour générer des domaines de planification de haute qualité à partir de descriptions en langage naturel augmentées. Elle évalue l'impact de divers mécanismes de rétroaction symbolique, tels que les jalons et la validation de plan, combinés à une recherche heuristique pour optimiser la qualité du domaine.

Symbolic AI Agentic AI AI Planning Feedback Systems

RESEARCHarXiv CS.LG·13/04/2026

Distributionally Robust Token Optimization in RLHF

Pour résoudre la susceptibilité des LLM aux échecs dus à de petits changements dans les invites, notamment pour le raisonnement en plusieurs étapes, des chercheurs proposent l'Optimisation de Tokens Robuste Distributionnellement (DRTO). Cette approche combine l'apprentissage par renforcement à partir du feedback humain (RLHF) au niveau du token avec l'optimisation robuste distributionnellement (DRO) pour améliorer la cohérence sous les changements de distribution, montrant des améliorations sur les benchmarks de raisonnement mathématique.

DRO LLMs RLHF Distributionally Robust Optimization

RESEARCHarXiv CS.CL·01/05/2026

Length Value Model: Scalable Value Pretraining for Token-Level Length Modeling

Cet article présente le Length Value Model (LenVM), un nouveau cadre au niveau du token pour modéliser la longueur de génération restante dans les modèles autorégressifs. En formulant la modélisation de la longueur comme un problème d'estimation de valeur, LenVM fournit un signal efficace, sans annotation et évolutif pour les LLM et VLM, améliorant les performances sur les tâches de correspondance exacte de longueur.

deep learning Model Architecture computer vision large language models

RESEARCHarXiv CS.CL·14/04/2026

Self-Calibrating Language Models via Test-Time Discriminative Distillation

Les grands modèles de langage sont souvent trop confiants, exprimant une grande certitude même lorsqu'ils sont incorrects. Cet article présente SECL, un pipeline d'entraînement en temps de test qui exploite un signal auto-supervisé pour améliorer la calibration sans nécessiter de données étiquetées.

Calibration self-supervision Overconfidence large language models

RESEARCHarXiv CS.AI·27/04/2026

Introducing Background Temperature to Characterise Hidden Randomness in Large Language Models

Ce contenu introduit un nouveau concept, la 'Température de Fond', pour caractériser le caractère aléatoire caché des Grands Modèles de Langage.

LLMs machine learning randomness large language models

RESEARCHarXiv CS.CL·30/04/2026

SpecTr-GBV: Multi-Draft Block Verification Accelerating Speculative Decoding

SpecTr-GBV est une nouvelle méthode de décodage spéculatif qui unifie les stratégies multi-brouillons et la vérification de blocs gourmande pour accélérer l'inférence des modèles de langage. Elle formule l'étape de vérification comme un problème de transport optimal, améliorant l'efficacité théorique et les performances empiriques en atteignant la longueur d'acceptation optimale.

large language models inference optimization Speculative Decoding AI research

RESEARCHarXiv CS.CL·09/04/2026

Hallucination as output-boundary misclassification: a composite abstention architecture for language models

Este artigo enquadra a alucinação em grandes modelos de linguagem como um erro de classificação e propõe uma intervenção composta por recusa baseada em instruções e um gate de abstenção estrutural. O gate utiliza um score de déficit de suporte de sinais como auto-consistência e cobertura de citação, mas a avaliação controlada mostrou que nenhum mecanismo isolado foi suficiente para mitigar totalmente o problema.

hallucination Abstention Architectures large language models AI safety