RESEARCH27

Learning Transferable Latent User Preferences for Human-Aligned Decision Making

arXiv CS.AI·14 de mayo de 2026

El artículo presenta CLIPR, un marco para Grandes Modelos de Lenguaje (LLMs) que infiere preferencias latentes del usuario a partir de interacciones limitadas para una toma de decisiones alineada con los humanos. Aborda las dificultades de los LLMs para producir soluciones alineadas y las limitaciones de los enfoques existentes en la generalización de preferencias.

user preferences LLMs Decision Making learning human-aligned AI

Leer original ↗