RESEARCH27
ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment
arXiv CS.CL·28 de maio de 2026
O artigo propõe ICG, um novo framework para geração personalizada de imagens de capa que integra prompt baseado em MLLM com alinhamento de preferência. Ele utiliza características semânticas e embeddings de usuário para contextualizar o modelo de difusão e adota uma estratégia de aprendizado multi-recompensa para abordar a falta de supervisão rotulada.
Ler original ↗