RESEARCH27
Learning Transferable Latent User Preferences for Human-Aligned Decision Making
arXiv CS.AI·14 de maio de 2026
O artigo apresenta CLIPR, uma estrutura para Grandes Modelos de Linguagem (LLMs) que infere preferências latentes do usuário a partir de interações limitadas para decisões alinhadas a humanos. Ele aborda as dificuldades dos LLMs em produzir soluções alinhadas e as limitações das abordagens existentes na generalização de preferências.
Ler original ↗