RESEARCH27
ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment
arXiv CS.CL·28. Mai 2026
Der Artikel stellt ICG vor, ein neuartiges Framework zur personalisierten Titelbilderzeugung, das MLLM-basiertes Prompting mit Präferenzanpassung kombiniert. Es nutzt semantische Merkmale und Benutzer-Embeddings zur Kontextualisierung des Diffusionsmodells und wendet eine Multi-Reward-Lernstrategie an, um den Mangel an beschrifteter Überwachung zu beheben.
Original lesen ↗