← heapsort-ai

LLMs

714 items

ARTICLEDEV.to AI·il y a 1j

Top AI App Development Trends Every Business Should Watch in 2026

L'Intelligence Artificielle est devenue le fondement de l'innovation numérique moderne, les entreprises en 2026 tirant parti des applications basées sur l'IA pour automatiser les opérations et personnaliser les expériences. L'avancement rapide de l'IA générative, des LLM et de l'IA multimodale transforme le développement d'applications, rendant essentiel pour les entreprises de comprendre ces tendances pour rester compétitives.

62
ARTICLEDEV.to AI·15/04/2026

Technical Guide to GEO Optimization

Ce guide souligne un changement fondamental dans le comportement des utilisateurs qui se tournent vers les modèles d'IA pour les problèmes complexes, rendant le SEO traditionnel insuffisant. Il introduit l'Optimisation des Moteurs Génératifs (GEO), un nouveau cadre développé par TeviroAI, qui optimise le contenu pour l'ingestion par les modèles d'IA en cartographiant les relations entre les entités plutôt que les mots-clés.

61
RESEARCHarXiv CS.AI·il y a 1j

SafeGene: Reusable Adapters for Transferable Safety Alignment

SafeGene présente un module adaptateur de sécurité réutilisable conçu pour relever le défi récurrent du maintien de l'alignement de sécurité dans les LLM open-weight affinés. Il découple les capacités de sécurité des mises à jour spécifiques aux tâches, les traitant comme une représentation d'adaptateur indépendante et transférable pour atténuer la vulnérabilité aux invites malveillantes.

60
RESEARCHarXiv CS.AI·il y a 1j

Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory

L'article présente Lean4Agent, un cadre utilisant Lean4 pour la modélisation et la vérification formelle du comportement des agents, notamment pour les workflows multi-étapes pilotés par les LLM. Il vise à pallier le manque de méthodes formales dans les systèmes d'agents actuels, permettant des vérifications de cohérence sémantique et la localisation des échecs d'exécution.

60
RESEARCHarXiv CS.CL·il y a 1j

Improving Cross-Lingual Factual Recall via Consistency-Driven Reinforcement Learning

Cette recherche introduit PolyFact, un ensemble de données de QA factuel multilingue, pour aborder l'incohérence factuelle interlingue dans les LLMs. Elle constate que l'apprentissage par renforcement via GRPO améliore constamment le rappel factuel interlingue et la généralisation par rapport à l'ajustement fin supervisé.

60
RESEARCHarXiv CS.CL·il y a 1j

What Do People Actually Want From AI? Mapping Preference Plurality

Cette étude examine ce que les gens attendent réellement des systèmes d'IA en analysant 1 500 réponses ouvertes de 75 pays. Elle révèle que les méthodes actuelles d'ajustement fin des LLM, telles que le RLHF, présentent des limites en agrégeant des préférences diverses et souvent contradictoires, soulignant la pluralité des valeurs et des interprétations.

60
RESEARCHarXiv CS.LG·il y a 1j

Skip a Layer or Loop It? Learning Program-of-Layers in LLMs

Cette recherche propose le concept de "program-of-layers (PoLar)" pour les LLM, permettant de sauter ou de boucler dynamiquement des couches pré-entraînées pendant l'inférence pour obtenir une précision équivalente ou supérieure avec des chemins d'exécution plus courts. Un réseau de prédiction léger apprend à générer ces programmes personnalisés, démontrant une performance améliorée sur les benchmarks de raisonnement mathématique.

60
ARTICLEDEV.to AI·il y a 14h

Artificial Intelligence in 2026: How AI Is Reshaping Software Development

L'Intelligence Artificielle a rapidement évolué pour devenir une technologie essentielle qui remodèle le développement logiciel moderne, influençant la génération de code, l'automatisation et divers secteurs industriels. D'ici 2026, l'IA est considérée comme une technologie fondamentale pour les entreprises et les développeurs, avec une exploration accrue des LLM, des agents d'IA et des frameworks d'apprentissage automatique.

58
ARTICLEDEV.to AI·17/04/2026

How I Use OpenCode, Oh-My-OpenCode-Slim, and OpenSpec to Build My Own AI Coding Environment

L'auteur partage son expérience dans la construction d'un environnement de codage IA personnalisé en utilisant des outils open source comme OpenCode, Oh-My-OpenCode-Slim et OpenSpec. Il affirme que les modèles open source de pointe, lorsqu'ils sont correctement utilisés avec les bons outils et spécifications, peuvent gérer efficacement les tâches de codage quotidiennes, soulignant la puissance de la communauté.

56
RESEARCHarXiv CS.CL·il y a 19h

Post-training is (Massive) Supervised Learning

Cet article soutient que le paradigme dominant de post-formation pour les LLM, impliquant SFT et RL, revient effectivement à l'approche "pré-entraîner puis affiner", adaptant explicitement les modèles à des benchmarks spécifiques. Des preuves empiriques montrent que les modèles post-entraînés à partir de zéro peuvent produire des performances non négligeables sur des ensembles de données de raisonnement.

55
RESEARCHarXiv CS.AI·il y a 19h

OmniMem: Perturbation-aware Memory Compression for Streaming Audio-Visual LLMs

OmniMem est un cadre de streaming économe en mémoire pour les LLM audio-visuels, conçu pour surmonter les limitations de l'inférence vidéo longue dues à l'augmentation des jetons vidéo et des caches KV. Il utilise une allocation de mémoire sensible à la modalité et une sélection de mémoire consciente des perturbations pour préserver les états KV informatifs, améliorant la compression et la compréhension à longue portée.

54
RESEARCHarXiv CS.CL·il y a 19h

TinyJudge: Unverifiable Constraint Alignment via Lightweight Specialist Ensembles

L'article introduit TinyJudge, un cadre qui utilise un ensemble de petits modèles de langage spécialisés (0.6B) pour fournir des récompenses légères et de haute précision pour les contraintes douces et invérifiables dans le suivi d'instructions par les LLM. Cette approche vise à résoudre les problèmes d'évasion des récompenses et de surcharge computationnelle des méthodes traditionnelles d'alignement des contraintes.

54
RESEARCHarXiv CS.CL·il y a 19h

ABLE: Representing and Mapping LLMs via Attribution-Based Large-model Embedding

ABLE (Attribution-Based Large-model Embedding) propose un cadre pour représenter les grands modèles linguistiques en exploitant l'espace d'interprétabilité. Il améliore la comparaison systématique des modèles en agrégeant les attributions de caractéristiques basées sur le gradient pour saisir les modèles de sensibilité d'entrée spécifiques au modèle.

54
ARTICLEDEV.to AI·il y a 1j

Keeping a chat app's token bill flat as conversations grow

Cet article aborde le problème de l'augmentation des coûts des jetons dans les applications de chat IA à mesure que les conversations s'allongent, en raison de l'envoi de l'historique complet de la conversation à chaque tour. Il présente une solution utilisant un "résumé glissant" combiné à une "fenêtre verbatim" pour optimiser l'utilisation des jetons et contrôler les dépenses.

52
ARTICLEDEV.to AI·il y a 2j

The Five Faculties: A Tour of SAFi's Cognitive Architecture

Le contenu présente SAFi (Self-Alignment Framework Interface), une architecture de gouvernance de l'IA qui s'écarte de l'alignement au niveau de l'invite en répartissant la cognition sur cinq facultés spécialisées. Ce système vise à dissocier la génération, l'évaluation et l'exécution de l'IA, en commençant par une barrière de sécurité de pré-génération pour prévenir les injections d'invites et autres menaces.

49