user preferences — KI-Artikel, Nachrichten & Forschung

RESEARCHarXiv CS.AI·vor 26T

Learning Transferable Latent User Preferences for Human-Aligned Decision Making

Dieses Papier stellt CLIPR vor, ein Framework, das Großen Sprachmodellen (LLMs) ermöglicht, menschlich ausgerichtete Entscheidungen zu treffen, indem es latente Benutzerpräferenzen aus begrenzten Interaktionen ableitet. Es befasst sich mit den Schwierigkeiten von LLMs, menschlich ausgerichtete Lösungen zu produzieren, und den Einschränkungen bestehender Ansätze bei der Verallgemeinerung von Präferenzen.

user preferences LLMs Decision Making learning