large language models

265 items

RESEARCHarXiv CS.AI·il y a 6j

Thinking Through Signs: PEEL as a Semiotic Scaffolding for Epistemically Accountable AI-Enabled Research

Ce commentaire introduit PEEL, un échafaudage de travail combinant la lecture distante déterministe avec l'interprétation de LLM, fondé sur la sémiotique peircienne et le raisonnement abductif. Appliqué à des condensations générées par l'IA, PEEL révèle des distorsions systématiques invisibles sans mesure non-IA, impliquant que les instruments déterministes doivent accompagner les outils d'IA pour assurer la fidélité et l'autorité épistémique.

Research methodology AI in research Epistemic accountability large language models

DOCDEV.to AI·il y a 8j

The Developer's Guide to Slashing Your AI API Bill by 95%

Ce guide explique aux développeurs comment réduire considérablement les coûts d'API IA jusqu'à 95 %, en préconisant des alternatives moins chères comme DeepSeek V4 Flash plutôt que GPT-4o. Il souligne une différence de prix de 40 fois pour une qualité de sortie similaire, aidant les développeurs à gérer efficacement les budgets de projet.

DeepSeek-V4-Flash AI API costs Cost Optimization developer guide

NEWSDEV.to AI·il y a 20j

Google Sparks AI Race with Gemini 3.5 Flash’s Breakthrough Speed

Le Gemini 3.5 Flash de Google révolutionne la vitesse de l'IA, offrant une intelligence instantanée et de premier ordre pour les tâches de codage et de raisonnement complexe. Ce nouveau modèle établit une nouvelle norme de performance, surpassant les versions précédentes et défiant ses rivaux.

Google AI AI Speed Gemini large language models

RESEARCHarXiv CS.CL·20/04/2026

Why Fine-Tuning Encourages Hallucinations and How to Fix It

Les grands modèles de langage sont souvent sujets aux hallucinations factuelles, un problème aggravé par le réglage fin supervisé (SFT) qui dégrade les connaissances pré-entraînées. Cette recherche propose une méthode SFT basée sur l'auto-distillation, inspirée de l'apprentissage continu, pour atténuer les hallucinations en régularisant la dérive de la distribution de sortie, tout en acquérant efficacement de nouvelles informations factuelles.

hallucinations large language models fine-tuning Continual Learning

RESEARCHarXiv CS.AI·16/04/2026

ReSS: Learning Reasoning Models for Tabular Data Prediction via Symbolic Scaffold

ReSS est un cadre qui relie les modèles de raisonnement symboliques et neuronaux pour la prédiction de données tabulaires, visant à la fois une grande précision et un raisonnement compréhensible. Il exploite des arbres de décision pour extraire des échafaudages symboliques qui guident un LLM à générer un raisonnement en langage naturel, utilisé ensuite pour l'affinement des LLM spécialisés dans le raisonnement tabulaire.

machine learning Explainable AI tabular data large language models

ARTICLEDEV.to AI·21/04/2026

The Physics Wall in 2026: 3 Papers That Show Why Node Shrinks Won't Save Us

L'article affirme que la simple réduction des nœuds semi-conducteurs ne garantit plus des gains significatifs de performance ou d'efficacité énergétique, citant des recherches récentes. Il analyse le « mur de la physique » actuel à l'aide de benchmarks d'inférence de LLM et propose des prédictions jusqu'en 2030.

technology limitations AI hardware semiconductors Performance optimization

NEWSDEV.to AI·il y a 18j

Google: Recaps Dialogues Stage at I/O 2026

Google a publié un récapitulatif des sessions de la scène Dialogues de sa conférence I/O 2026, incluant des discussions avec Sundar Pichai et d'autres leaders de l'IA. Le récapitulatif souligne les avancées de l'entreprise en intelligence artificielle, son intégration dans les produits et le développement responsable, notamment les LLMs et la personnalisation des expériences.

AI applications Google AI large language models AI development

RESEARCHarXiv CS.CL·13/04/2026

Medical Reasoning with Large Language Models: A Survey and MR-Bench

Cet article propose une revue complète du raisonnement médical avec les Grands Modèles Linguistiques (LLM), le conceptualisant comme un processus itératif d'abduction, de déduction et d'induction. Il organise les méthodes existantes en sept voies techniques et effectue une évaluation unifiée des modèles représentatifs.

Medical Reasoning LLMs in Medicine large language models healthcare AI

ARTICLEDEV.to AI·il y a 21j

Airflow to the Rescue: How AI Powers Better DAG Failures

Cet article présente une approche implémentée en production pour améliorer la détection et le diagnostic des pannes dans Apache Airflow. Il utilise des grands modèles de langage, des méthodes statistiques et l'apprentissage automatique traditionnel pour analyser les logs étendus et classer les messages.

data engineering machine learning AI large language models

RESEARCHarXiv CS.AI·13/04/2026

StaRPO: Stability-Augmented Reinforcement Policy Optimization

StaRPO est un nouveau cadre d'apprentissage par renforcement conçu pour améliorer la cohérence logique et la structure des grands modèles de langage dans les tâches de raisonnement complexes. Il intègre explicitement des métriques de stabilité, telles que la fonction d'autocorrélation et l'efficacité du chemin, pour évaluer la cohérence locale et l'orientation globale du processus de raisonnement.

Policy optimization LLMs reinforcement learning Reasoning

RESEARCHarXiv CS.CL·11/05/2026

MELD: Multi-Task Equilibrated Learning Detector for AI-Generated Text

MELD est un nouveau détecteur de texte généré par IA déployable qui enrichit la détection binaire avec une supervision auxiliaire multi-tâches. Il vise la robustesse face aux attaques, la transférabilité à des générateurs inconnus et de faibles taux de faux positifs.

security large language models AI-generated text detection

RESEARCHarXiv CS.AI·11/05/2026

More Thinking, More Bias: Length-Driven Position Bias in Reasoning Models

Une nouvelle recherche indique que le biais de position dans les modèles de raisonnement, tels que Chain-of-thought, augmente avec la longueur de la trajectoire de raisonnement. Cet effet a été observé dans diverses configurations de modèles et benchmarks, suggérant que « penser davantage » peut exacerber certains biais.

AI bias Natural Language Processing reasoning models Machine learning research

RESEARCHarXiv CS.CL·07/04/2026

SoLA: Leveraging Soft Activation Sparsity and Low-Rank Decomposition for Large Language Model Compression

SoLA é um novo método de compressão sem treinamento para LLMs, que utiliza esparsidade de ativação suave e decomposição de baixo-rank. Ele identifica componentes cruciais para a inferência e comprime a maioria, visando reduzir parâmetros de modelos de linguagem grandes de forma eficiente e acessível.

Sparsity Low-Rank Decomposition LLM compression large language models

RESEARCHarXiv CS.AI·01/05/2026

Think it, Run it: Autonomous ML pipeline generation via self-healing multi-agent AI

Cet article propose une architecture d'IA multi-agents unifiée pour automatiser la génération de pipelines d'apprentissage automatique (ML) de bout en bout à partir de jeux de données et d'objectifs en langage naturel. Le système à cinq agents intègre RAG, un recommandeur hybride explicable et un mécanisme d'auto-réparation basé sur les LLM, atteignant un taux de réussite de 84,7% et une robustesse améliorée.

Retrieval Augmented Generation multi-agent AI large language models ML Automation

RESEARCHarXiv CS.AI·il y a 7j

Thinking Past the Answer: Evaluating Harmful Overthinking in Large Reasoning Models

Cet article évalue la "surréflexion nuisible" dans les grands modèles de raisonnement, où un raisonnement continu après une réponse correcte peut déstabiliser la trajectoire. Il introduit un protocole pour distinguer la surréflexion verbeuse de la nuisible, identifiant des problèmes dans les benchmarks multimodaux.

multimodal AI Overthinking Model Evaluation AI Reasoning

RESEARCHarXiv CS.CL·il y a 21j

MMoA: An AI-Agent framework with recurrence for Memoried Mixure-of-Agent

MMoA est une architecture récurrente de Mixture-of-Agents (MoA) qui intègre un routage basé sur LSTM pour une sélection adaptative d'agents. Il améliore les performances des LLM en activant dynamiquement moins d'agents tout en atteignant une précision comparable sur des benchmarks comme AlpacaEval 2.0.

benchmarking Recurrence Mixture-of-Agents large language models

RESEARCHarXiv CS.CL·il y a 22j

Language Acquisition Device in Large Language Models

Cet article propose un pré-entraînement inspiré du Dispositif d'Acquisition du Langage (LAD) en utilisant MP-STRUCT, un langage formel qui reflète les structures du langage naturel, afin d'améliorer l'efficacité des données des Grands Modèles de Langage. Un bref pré-entraînement avec MP-STRUCT atteint l'efficacité des tokens des références de langages formels solides et confère une résistance similaire à celle des humains aux langages structurellement invraisemblables.

Formal Languages Pre-pretraining Language Acquisition MP-STRUCT

DOCDEV.to AI·il y a 6j

One API Key to Rule All AI Models: A Developer's Guide to TokenEase

TokenEase est une passerelle d'agrégation d'API IA qui fournit une clé API unique compatible OpenAI pour accéder à plusieurs modèles de langage de premier plan. Cela simplifie le développement d'applications IA en éliminant la nécessité de gérer différentes clés, points d'accès et limites de débit pour chaque modèle.

AI integration API Management large language models developer tools

NEWSDEV.to AI·il y a 18j

Qwen3-Coder-Next: 80B total, 3B active, 70.6 on SWE-Bench

Qwen3-Coder-Next est un modèle MoE épars de 80 milliards de paramètres au total (3 milliards actifs) qui atteint un score de 70.6 sur SWE-Bench Verified. Il intègre un mécanisme d'attention hybride et des poids Apache 2.0, étant une variante optimisée pour le codage.

benchmarking code generation Mixture of Experts large language models

ARTICLEDEV.to AI·26/04/2026

DeepSeek V4: Million-Token Context That Actually Works

DeepSeek V4 offre un contexte de 1 million de tokens réellement utilisable, résolvant le problème de mémoire GPU grâce à une architecture d'attention hybride qui compresse le cache KV de près de 9x. Cela en fait une solution pratique pour l'inférence à long contexte, contrairement à de nombreux autres modèles.

DeepSeek AI models Model Architecture large language models