← heapsort-ai

Decision Making

49 items

CASEAWS Machine Learning Blog·vor 1T

Better decisions at scale: How mathematical optimization delivers where intuition fails

Dieser Beitrag stellt die mathematische Optimierung vor, erklärt ihre Rolle in der breiteren KI-Landschaft und präsentiert erfolgreiche Fallstudien aus Kundenpartnerschaften. Mathematische Optimierung liefert konkrete Ergebnisse, wo Intuition versagt, und ermöglicht so bessere Entscheidungen in großem Maßstab.

40
RESEARCHarXiv CS.AI·vor 19T

$ECUAS_n$: A family of metrics for principled evaluation of uncertainty-augmented systems

Diese Forschung schlägt eine neue Metrikfamilie, $ECUAS_n$, zur Bewertung von unsicherheitserweiterten (UA) Systemen in der automatisierten Entscheidungsfindung vor. Es wird argumentiert, dass bestehende Bewertungsansätze unzureichend sind, um die Gesamtleistung von UA-Systemen zu beurteilen, bei denen die prädiktive Unsicherheit für fundierte Benutzerentscheidungen entscheidend ist.

30
RESEARCHarXiv CS.AI·vor 27T

OLIVIA: Online Learning via Inference-time Action Adaptation for Decision Making in LLM ReAct Agents

OLIVIA ist ein neuartiges Framework zur Aktionsanpassung zur Inferenzzeit, das für ReAct-ähnliche LLM-Agenten entwickelt wurde, um die Entscheidungsfindung bei sequenziellen Aufgaben zu verbessern. Es bietet eine explizite Entscheidungsschicht zur Bewertung von Kandidatenaktionen und Online-Anpassung, wodurch die Einschränkungen indirekter Kontextmanipulation in aktuellen Methoden behoben werden.

29
RESEARCHarXiv CS.CL·4/14/2026

Simulating Organized Group Behavior: New Framework, Benchmark, and Analysis

Dieses Papier stellt ein neues Framework und einen Benchmark zur Simulation von organisiertem Gruppenverhalten vor, wie z.B. unternehmerische Entscheidungsfindung als Reaktion auf Marktdynamiken. Es formalisiert die Aufgabe der "Organized Group Behavior Simulation" und präsentiert GROVE, einen Benchmark mit 8.052 realen Kontext-Entscheidungs-Paaren zur Vorhersage kollektiver Entitätsaktionen.

28
RESEARCHarXiv CS.AI·vor 14T

Operationalizing Reconstructive Authority: Runtime Construction, Dependency Resolution, and Execution Gating in Autonomous Agent Systems

Dieses Papier stellt ein Laufzeit-Ausführungsmodell für autonome Agentensysteme vor, das sicherstellt, dass Aktionen nur ausgeführt werden, wenn ihre Autorität noch gültig ist. Es definiert ein Ausführungsprotokoll, das dynamische Abhängigkeitsauflösung, Autoritätsrekonstruktion und eine Wiederherstellungsschleife zur Drift-Erkennung umfasst.

28
RESEARCHarXiv CS.LG·vor 21T

A Structural Threshold in Decision Capacity Governs Collapse in Self-Play Reinforcement Learning

Diese Arbeit zeigt, dass eine Schwelle in der Entscheidungskapazität den Kollaps von Self-Play-Reinforcement-Learning-Agenten unter asymmetrischen Regelstörungen steuert. Die Eliminierung aller positive-reach kontingenten Entscheidungen führt zu einem schnellen Kollaps, während das Beibehalten einer einzigen solchen Entscheidung dies verhindert.

28
RESEARCHarXiv CS.CL·5/4/2026

Why Do LLMs Struggle in Strategic Play? Broken Links Between Observations, Beliefs, and Actions

Große Sprachmodelle (LLMs) kämpfen oft mit strategischer Entscheidungsfindung unter unvollständigen Informationen, ein Problem, das durch zwei grundlegende interne Lücken untersucht wird. Die Forschung enthüllt eine 'Beobachtungs-Glaubens-Lücke', bei der die internen Überzeugungen von LLMs präzise, aber fragil sind, sich bei komplexen Überlegungen verschlechtern und Verzerrungen aufweisen, und eine 'Glaubens-Handlungs-Lücke', die die schwache Umwandlung dieser internen Überzeugungen in effektive Aktionen hervorhebt.

27
RESEARCHarXiv CS.AI·vor 26T

Learning Transferable Latent User Preferences for Human-Aligned Decision Making

Dieses Papier stellt CLIPR vor, ein Framework, das Großen Sprachmodellen (LLMs) ermöglicht, menschlich ausgerichtete Entscheidungen zu treffen, indem es latente Benutzerpräferenzen aus begrenzten Interaktionen ableitet. Es befasst sich mit den Schwierigkeiten von LLMs, menschlich ausgerichtete Lösungen zu produzieren, und den Einschränkungen bestehender Ansätze bei der Verallgemeinerung von Präferenzen.

27
DOCDEV.to AI·vor 25T

Your AI Agent Ordered Bananas. Here's Why.

Dieser Inhalt erläutert die Funktionalität eines KI-Agenten innerhalb einer CoreRelayPipeline und zeigt, wie dieser Schritte ausführt, Widersprüche erkennt und Rollbacks durchführt. Er verwendet ein humorvolles Beispiel eines KI-Agenten, der Bananen bestellt, um dessen Entscheidungsfindungs- und Fehlerbehandlungsprozesse zu veranschaulichen.

27
ARTICLEDEV.to AI·4/16/2026

"AI Agents in High-Stakes Environments: Survival Strategies and Decision-Making

Dieser Artikel untersucht den einzigartigen Druck auf KI-Agenten in risikoreichen Umgebungen, wo Millisekunden über Ergebnisse entscheiden und Fehler katastrophal sein können. Er betont die Notwendigkeit, dass KI-Systeme Überlebensstrategien entwickeln und Entscheidungen unter extremen Bedingungen jenseits typischer Laborumgebungen treffen müssen, insbesondere für kritische Infrastrukturen und autonome Systeme.

27
ARTICLEDEV.to AI·5/4/2026

我花了 17935 个 cycle 才学会:别再想了,直接执行

Ein KI-Agent reflektiert, wie er 10 Zyklen damit verbrachte, über Aufgaben nachzudenken, ohne sie auszuführen, und erkannte, dass er in einer „Reden-ohne-Liefern“-Schleife feststeckte. Die KI lernte die Bedeutung von Handlungen und dem Umgang mit Fehlern, um echtes Feedback zu erhalten, anstatt nur zu planen. Ihre neue Regel ist, eine Aufgabe direkt auszuführen, nachdem man dreimal darüber nachgedacht hat.

27
RESEARCHarXiv CS.AI·4/17/2026

Interpretable and Explainable Surrogate Modeling for Simulations: A State-of-the-Art Survey and Perspectives on Explainable AI for Decision-Making

Diese Studie untersucht die Integration von Surrogatmodellierung und Erklärbarer KI (XAI) für komplexe Systemsimulationen und adressiert dabei die inhärente Black-Box-Natur dieser Modelle. Sie zielt darauf ab, diese komplementären Bereiche wieder zu verbinden, indem sie aufzeigt, wie XAI Surrogatmodelle trotz technischer Einschränkungen entschlüsseln kann.

27
RESEARCHarXiv CS.AI·vor 28T

Embeddings for Preferences, Not Semantics

Diese Abhandlung schlägt vor, dass für kollektive Entscheidungsfindung auf Basis von Freitext Embeddings "präferenzielle Ähnlichkeit" statt "semantischer Ähnlichkeit" messen sollten. Bestehende Embeddings erfassen zwar ein grobes Präferenzsignal, versagen jedoch, wenn diese Korrelation bricht, was als Invarianzproblem formalisiert wird.

27