user preferences — artículos, noticias e investigación de IA

RESEARCHarXiv CS.AI·hace 27d

Learning Transferable Latent User Preferences for Human-Aligned Decision Making

El artículo presenta CLIPR, un marco para Grandes Modelos de Lenguaje (LLMs) que infiere preferencias latentes del usuario a partir de interacciones limitadas para una toma de decisiones alineada con los humanos. Aborda las dificultades de los LLMs para producir soluciones alineadas y las limitaciones de los enfoques existentes en la generalización de preferencias.

user preferences LLMs Decision-making learning