RESEARCH27
Learning Transferable Latent User Preferences for Human-Aligned Decision Making
arXiv CS.AI·14 de mayo de 2026
El artículo presenta CLIPR, un marco para Grandes Modelos de Lenguaje (LLMs) que infiere preferencias latentes del usuario a partir de interacciones limitadas para una toma de decisiones alineada con los humanos. Aborda las dificultades de los LLMs para producir soluciones alineadas y las limitaciones de los enfoques existentes en la generalización de preferencias.
Leer original ↗