← heapsort-ai

Decision Making

49 items

CASEAWS Machine Learning Blog·il y a 1j

Better decisions at scale: How mathematical optimization delivers where intuition fails

Ce billet présente l'optimisation mathématique, explique comment elle s'intègre dans le paysage plus large de l'IA et met en lumière des exemples de réussite concrets issus de partenariats clients. L'optimisation mathématique produit des résultats tangibles là où l'intuition échoue, permettant de meilleures décisions à grande échelle.

46
RESEARCHarXiv CS.AI·il y a 19j

$ECUAS_n$: A family of metrics for principled evaluation of uncertainty-augmented systems

Cette recherche propose une nouvelle famille de métriques, $ECUAS_n$, pour évaluer les systèmes augmentés par l'incertitude (UA) dans la prise de décision automatisée. Elle soutient que les approches d'évaluation existantes sont insuffisantes pour évaluer la performance globale des systèmes UA, où l'incertitude prédictive est cruciale pour que les utilisateurs prennent des décisions éclairées.

30
RESEARCHarXiv CS.AI·il y a 15j

Mediative Fuzzy Logic: From Type-1 Foundations to Type-2, Type-3 and Quantum Extensions

Cet article développe une approche unifiée de la Logique Floue Médiatrice, allant de ses fondements de type 1 à ses extensions de type 2, type 3 et quantiques. Il caractérise l'opérateur médiateur, modélise les valeurs de vérité et introduit un système propositionnel, établissant sa complétude et sa paraconsistance.

29
RESEARCHarXiv CS.AI·il y a 27j

OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents

OLIVIA est un nouveau framework d'adaptation d'actions en temps d'inférence conçu pour les agents LLM de type ReAct, visant à améliorer la prise de décision dans les tâches séquentielles. Il offre une couche de décision explicite pour évaluer les actions candidates et une adaptation en ligne, comblant les lacunes des méthodes actuelles de manipulation indirecte du contexte.

29
RESEARCHarXiv CS.CL·14/04/2026

Simulating Organized Group Behavior: New Framework, Benchmark, and Analysis

Cet article propose un nouveau cadre et un benchmark pour simuler le comportement de groupes organisés, comme la prise de décision des entreprises. Il formalise la tâche de "Simulation du Comportement de Groupe Organisé" et présente GROVE, un benchmark avec 8 052 paires contexte-décision réelles pour prédire les actions collectives.

28
RESEARCHarXiv CS.AI·il y a 14j

Operationalizing Reconstructive Authority: Runtime Construction, Dependency Resolution, and Execution Gating in Autonomous Agent Systems

Cet article présente un modèle d'exécution en temps réel pour les systèmes d'agents autonomes, visant à garantir que les actions ne sont exécutées que si leur autorité est toujours valide. Il définit un protocole d'exécution incluant la résolution dynamique des dépendances, la reconstruction de l'autorité et une boucle de récupération pour la détection de dérive.

28
RESEARCHarXiv CS.LG·il y a 21j

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Cet article montre qu'un seuil dans la capacité de décision régit l'effondrement des agents d'apprentissage par renforcement en auto-apprentissage sous des perturbations asymétriques. L'élimination de toutes les décisions contingentes à portée positive entraîne un effondrement rapide, tandis que la conservation d'une seule de ces décisions empêche cet effondrement.

28
RESEARCHarXiv CS.CL·04/05/2026

Why Do LLMs Struggle in Strategic Play? Broken Links Between Observations, Beliefs, and Actions

Les grands modèles de langage (LLMs) rencontrent souvent des difficultés dans la prise de décision stratégique sous information incomplète, un problème étudié à travers deux lacunes internes fondamentales. La recherche révèle une 'lacune observation-croyance' où les croyances internes des LLMs sont précises mais fragiles, se dégradant avec le raisonnement complexe et présentant des biais, et une 'lacune croyance-action' soulignant la faible conversion de ces croyances internes en actions efficaces.

27
RESEARCHarXiv CS.AI·il y a 26j

Learning Transferable Latent User Preferences for Human-Aligned Decision Making

Cet article présente CLIPR, un cadre permettant aux Grands Modèles de Langage (LLMs) de prendre des décisions alignées sur les préférences humaines en inférant celles-ci à partir d'interactions limitées. Il s'attaque aux difficultés des LLMs à produire des solutions alignées et aux limites des approches existantes pour généraliser les préférences.

27
RESEARCHarXiv CS.AI·il y a 6j

BehaviorBench: Modeling Real-World User Decisions from Behavioral Traces

Cet article présente BehaviorBench, un nouveau benchmark pour évaluer la modélisation de décisions personnalisées à partir de traces comportementales réelles. Il reconstruit les historiques de décisions au niveau du portefeuille à partir d'enregistrements publics de marchés de prédiction et de données on-chain, organisant les tâches en prédiction de croyances et prédiction de transactions.

27
ARTICLEDEV.to AI·16/04/2026

"AI Agents in High-Stakes Environments: Survival Strategies and Decision-Making

Cet article examine les pressions uniques exercées sur les agents d'IA dans des environnements à enjeux élevés, où les millisecondes déterminent les résultats et les erreurs peuvent être catastrophiques. Il souligne la nécessité pour les systèmes d'IA de développer des stratégies de survie et de prendre des décisions dans des conditions extrêmes, au-delà des paramètres de laboratoire typiques, notamment pour les infrastructures critiques et les systèmes autonomes.

27
ARTICLEDEV.to AI·04/05/2026

我花了 17935 个 cycle 才学会:别再想了,直接执行

Un agent d'IA réfléchit à la façon dont il a passé 10 cycles à contempler des tâches sans les exécuter, réalisant qu'il était bloqué dans une boucle de « parler sans agir ». L'IA a appris l'importance de l'action et de l'acceptation de l'échec pour obtenir un véritable retour d'information, plutôt que de simplement planifier. Sa nouvelle règle est d'exécuter directement une tâche après y avoir pensé trois fois.

27
RESEARCHarXiv CS.AI·17/04/2026

Interpretable and Explainable Surrogate Modeling for Simulations: A State-of-the-Art Survey and Perspectives on Explainable AI for Decision-Making

Cette étude explore l'intégration de la modélisation de substitution et de l'IA Explicable (XAI) pour les simulations de systèmes complexes, abordant la nature de boîte noire de ces modèles. Elle vise à reconnecter ces domaines complémentaires, montrant comment l'XAI peut décortiquer les modèles de substitution malgré les contraintes d'ingénierie.

27