LLMs

714 items

ARTICLEDEV.to AI·il y a 1j

Top AI App Development Trends Every Business Should Watch in 2026

L'Intelligence Artificielle est devenue le fondement de l'innovation numérique moderne, les entreprises en 2026 tirant parti des applications basées sur l'IA pour automatiser les opérations et personnaliser les expériences. L'avancement rapide de l'IA générative, des LLM et de l'IA multimodale transforme le développement d'applications, rendant essentiel pour les entreprises de comprendre ces tendances pour rester compétitives.

AI applications LLMs AI trends AI development

ARTICLEDEV.to AI·15/04/2026

Technical Guide to GEO Optimization

Ce guide souligne un changement fondamental dans le comportement des utilisateurs qui se tournent vers les modèles d'IA pour les problèmes complexes, rendant le SEO traditionnel insuffisant. Il introduit l'Optimisation des Moteurs Génératifs (GEO), un nouveau cadre développé par TeviroAI, qui optimise le contenu pour l'ingestion par les modèles d'IA en cartographiant les relations entre les entités plutôt que les mots-clés.

LLMs GEO AI Generative Engine Optimization

RESEARCHarXiv CS.AI·il y a 1j

SafeGene: Reusable Adapters for Transferable Safety Alignment

SafeGene présente un module adaptateur de sécurité réutilisable conçu pour relever le défi récurrent du maintien de l'alignement de sécurité dans les LLM open-weight affinés. Il découple les capacités de sécurité des mises à jour spécifiques aux tâches, les traitant comme une représentation d'adaptateur indépendante et transférable pour atténuer la vulnérabilité aux invites malveillantes.

LLMs security

RESEARCHarXiv CS.AI·il y a 1j

Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory

L'article présente Lean4Agent, un cadre utilisant Lean4 pour la modélisation et la vérification formelle du comportement des agents, notamment pour les workflows multi-étapes pilotés par les LLM. Il vise à pallier le manque de méthodes formales dans les systèmes d'agents actuels, permettant des vérifications de cohérence sémantique et la localisation des échecs d'exécution.

Lean4 LLMs workflow automation Formal verification

RESEARCHarXiv CS.CL·il y a 1j

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Cette recherche introduit PolyFact, un ensemble de données de QA factuel multilingue, pour aborder l'incohérence factuelle interlingue dans les LLMs. Elle constate que l'apprentissage par renforcement via GRPO améliore constamment le rappel factuel interlingue et la généralisation par rapport à l'ajustement fin supervisé.

Multilingual AI LLMs reinforcement learning machine learning

RESEARCHarXiv CS.CL·il y a 1j

UnpredictaBench: A Benchmark for Evaluating Distributional Randomness in LLMs

UnpredictaBench est présenté comme un nouveau benchmark pour évaluer la capacité des LLM à capturer de véritables distributions sous-jacentes, résolvant leur tendance à converger vers une seule réponse. Il propose 448 problèmes et une métrique KS@N pour tester les résultats d'échantillonnage à partir de diverses distributions cibles.

AI models LLMs evaluation Benchmarking

RESEARCHarXiv CS.CL·il y a 1j

What Do People Actually Want From AI? Mapping Preference Plurality

Cette étude examine ce que les gens attendent réellement des systèmes d'IA en analysant 1 500 réponses ouvertes de 75 pays. Elle révèle que les méthodes actuelles d'ajustement fin des LLM, telles que le RLHF, présentent des limites en agrégeant des préférences diverses et souvent contradictoires, soulignant la pluralité des valeurs et des interprétations.

LLMs Human Alignment RLHF User studies

RESEARCHarXiv CS.LG·il y a 1j

Skip a Layer or Loop It? Learning Program-of-Layers in LLMs

Cette recherche propose le concept de "program-of-layers (PoLar)" pour les LLM, permettant de sauter ou de boucler dynamiquement des couches pré-entraînées pendant l'inférence pour obtenir une précision équivalente ou supérieure avec des chemins d'exécution plus courts. Un réseau de prédiction léger apprend à générer ces programmes personnalisés, démontrant une performance améliorée sur les benchmarks de raisonnement mathématique.

neural networks mathematical reasoning inference LLMs

ARTICLEDEV.to AI·23/04/2026

Serving Infrastructure — Deep Dive + Problem: Softmax Function

L'infrastructure de service est cruciale pour déployer et gérer les grands modèles de langage (LLM) en production, assurant une livraison efficace et fiable des prédictions. Elle fait le lien entre le développement du modèle et son application réelle, influençant directement la performance, la scalabilité et la maintenabilité.

Scalability Optimization LLMs deployment

ARTICLEDEV.to AI·il y a 14h

Vector Databases in AI Projects: Are They Really Necessary?

Cet article remet en question la nécessité absolue des bases de données vectorielles dans les projets d'IA, en particulier ceux utilisant les LLM et le RAG. Il vise à explorer leurs avantages, inconvénients, alternatives et à fournir des éclaircissements pour de meilleures décisions architecturales.

AI architecture LLMs Vector Databases RAG

ARTICLEDEV.to AI·il y a 14h

Artificial Intelligence in 2026: How AI Is Reshaping Software Development

L'Intelligence Artificielle a rapidement évolué pour devenir une technologie essentielle qui remodèle le développement logiciel moderne, influençant la génération de code, l'automatisation et divers secteurs industriels. D'ici 2026, l'IA est considérée comme une technologie fondamentale pour les entreprises et les développeurs, avec une exploration accrue des LLM, des agents d'IA et des frameworks d'apprentissage automatique.

LLMs Software Development machine learning artificial intelligence

ARTICLEDEV.to AI·17/04/2026

How I Use OpenCode, Oh-My-OpenCode-Slim, and OpenSpec to Build My Own AI Coding Environment

L'auteur partage son expérience dans la construction d'un environnement de codage IA personnalisé en utilisant des outils open source comme OpenCode, Oh-My-OpenCode-Slim et OpenSpec. Il affirme que les modèles open source de pointe, lorsqu'ils sont correctement utilisés avec les bons outils et spécifications, peuvent gérer efficacement les tâches de codage quotidiennes, soulignant la puissance de la communauté.

LLMs open-source AI coding environment multi-agent systems

RESEARCHarXiv CS.CL·il y a 19h

Post-training is (Massive) Supervised Learning

Cet article soutient que le paradigme dominant de post-formation pour les LLM, impliquant SFT et RL, revient effectivement à l'approche "pré-entraîner puis affiner", adaptant explicitement les modèles à des benchmarks spécifiques. Des preuves empiriques montrent que les modèles post-entraînés à partir de zéro peuvent produire des performances non négligeables sur des ensembles de données de raisonnement.

LLMs machine learning Benchmarking Training

RESEARCHarXiv CS.AI·il y a 19h

OmniMem: Perturbation-aware Memory Compression for Streaming Audio-Visual LLMs

OmniMem est un cadre de streaming économe en mémoire pour les LLM audio-visuels, conçu pour surmonter les limitations de l'inférence vidéo longue dues à l'augmentation des jetons vidéo et des caches KV. Il utilise une allocation de mémoire sensible à la modalité et une sélection de mémoire consciente des perturbations pour préserver les états KV informatifs, améliorant la compression et la compréhension à longue portée.

LLMs Audio-Visual AI deep learning Streaming

RESEARCHarXiv CS.CL·il y a 19h

TinyJudge: Unverifiable Constraint Alignment via Lightweight Specialist Ensembles

L'article introduit TinyJudge, un cadre qui utilise un ensemble de petits modèles de langage spécialisés (0.6B) pour fournir des récompenses légères et de haute précision pour les contraintes douces et invérifiables dans le suivi d'instructions par les LLM. Cette approche vise à résoudre les problèmes d'évasion des récompenses et de surcharge computationnelle des méthodes traditionnelles d'alignement des contraintes.

Tiny Models Model Alignment LLMs reinforcement learning

RESEARCHarXiv CS.CL·il y a 19h

ABLE: Representing and Mapping LLMs via Attribution-Based Large-model Embedding

ABLE (Attribution-Based Large-model Embedding) propose un cadre pour représenter les grands modèles linguistiques en exploitant l'espace d'interprétabilité. Il améliore la comparaison systématique des modèles en agrégeant les attributions de caractéristiques basées sur le gradient pour saisir les modèles de sensibilité d'entrée spécifiques au modèle.

LLMs model representation security model comparison

RESEARCHarXiv CS.CL·il y a 19h

BEACON: Behavioral Entropy Aggregation for Cross-Model Hallucination Detection in Large Language Models

L'article présente BEACON, un cadre de détection d'hallucinations en boîte noire pour les LLM qui analyse uniquement les sorties du modèle. Il extrait un vecteur de caractéristiques de 31 dimensions, et un classifieur atteint 0,8123 AUROC, surpassant les méthodes existantes.

LLMs hallucination machine learning detection

ARTICLEDEV.to AI·il y a 1j

Keeping a chat app's token bill flat as conversations grow

Cet article aborde le problème de l'augmentation des coûts des jetons dans les applications de chat IA à mesure que les conversations s'allongent, en raison de l'envoi de l'historique complet de la conversation à chaque tour. Il présente une solution utilisant un "résumé glissant" combiné à une "fenêtre verbatim" pour optimiser l'utilisation des jetons et contrôler les dépenses.

token management chatbots LLMs Cost Optimization

ARTICLEDEV.to AI·il y a 2j

The Five Faculties: A Tour of SAFi's Cognitive Architecture

Le contenu présente SAFi (Self-Alignment Framework Interface), une architecture de gouvernance de l'IA qui s'écarte de l'alignement au niveau de l'invite en répartissant la cognition sur cinq facultés spécialisées. Ce système vise à dissocier la génération, l'évaluation et l'exécution de l'IA, en commençant par une barrière de sécurité de pré-génération pour prévenir les injections d'invites et autres menaces.

AI architecture LLMs AI alignment security

ARTICLE↑ trendingHacker News (AI)·il y a 5j

OpenAI CEO Sam Altman admits AI token costs are becoming 'an issue'

Sam Altman, PDG d'OpenAI, reconnaît que les coûts des tokens d'IA deviennent un problème majeur pour l'entreprise. OpenAI cherche à améliorer la valeur et l'efficacité, car les dépenses excessives sont devenues un sujet de moquerie.

AI costs OpenAI LLMs efficiency