RESEARCHarXiv CS.AI·vor 26T
Learning Transferable Latent User Preferences for Human-Aligned Decision Making
Dieses Papier stellt CLIPR vor, ein Framework, das Großen Sprachmodellen (LLMs) ermöglicht, menschlich ausgerichtete Entscheidungen zu treffen, indem es latente Benutzerpräferenzen aus begrenzten Interaktionen ableitet. Es befasst sich mit den Schwierigkeiten von LLMs, menschlich ausgerichtete Lösungen zu produzieren, und den Einschränkungen bestehender Ansätze bei der Verallgemeinerung von Präferenzen.
27