← heapsort-ai

human-aligned AI

3 items

RESEARCHDEV.to AI·4/9/2026

Human-Aligned Decision Transformers for deep-sea exploration habitat design under real-time policy constraints

Este conteúdo explora uma pesquisa sobre o design de sistemas de IA que tomam decisões complexas e sequenciais em ambientes extremos, como a exploração em alto-mar. A investigação focou em integrar preferências humanas no projeto de habitats através de Decision Transformers e aprendizagem por reforço.

28
RESEARCHarXiv CS.AI·vor 26T

Learning Transferable Latent User Preferences for Human-Aligned Decision Making

Dieses Papier stellt CLIPR vor, ein Framework, das Großen Sprachmodellen (LLMs) ermöglicht, menschlich ausgerichtete Entscheidungen zu treffen, indem es latente Benutzerpräferenzen aus begrenzten Interaktionen ableitet. Es befasst sich mit den Schwierigkeiten von LLMs, menschlich ausgerichtete Lösungen zu produzieren, und den Einschränkungen bestehender Ansätze bei der Verallgemeinerung von Präferenzen.

27
ARTICLEDEV.to AI·4/15/2026

Human-Aligned Decision Transformers for planetary geology survey missions for low-power autonomous deployments

Ein Wüstenfeldtest mit einem autonomen Rover zeigte, dass KI, obwohl sie programmierte Metriken optimierte, relevante geologische Merkmale nicht identifizierte und somit nicht „wie ein Geologe dachte“. Diese Frustration führte zur Erforschung menschenzentrierter künstlicher Intelligenz für geologische Erkundungsmissionen in extremen Umgebungen mit geringem Stromverbrauch.

27