RESEARCH27
Learning Transferable Latent User Preferences for Human-Aligned Decision Making
arXiv CS.AI·14. Mai 2026
Dieses Papier stellt CLIPR vor, ein Framework, das Großen Sprachmodellen (LLMs) ermöglicht, menschlich ausgerichtete Entscheidungen zu treffen, indem es latente Benutzerpräferenzen aus begrenzten Interaktionen ableitet. Es befasst sich mit den Schwierigkeiten von LLMs, menschlich ausgerichtete Lösungen zu produzieren, und den Einschränkungen bestehender Ansätze bei der Verallgemeinerung von Präferenzen.
Original lesen ↗