RESEARCH27

Learning Transferable Latent User Preferences for Human-Aligned Decision Making

arXiv CS.AI·14 de maio de 2026

O artigo apresenta CLIPR, uma estrutura para Grandes Modelos de Linguagem (LLMs) que infere preferências latentes do usuário a partir de interações limitadas para decisões alinhadas a humanos. Ele aborda as dificuldades dos LLMs em produzir soluções alinhadas e as limitações das abordagens existentes na generalização de preferências.

user preferences LLMs Decision-making learning human-aligned AI

Ler original ↗