← heapsort-ai

MLLMs

7 items

RESEARCHarXiv CS.LG·4/21/2026

SaFeR-Steer: Evolving Multi-Turn MLLMs via Synthetic Bootstrapping and Feedback Dynamics

SaFeR-Steer ist ein neuer Rahmen zur Sicherheitsausrichtung von MLLMs in mehrstufigen Dialogen, der Angriffe bekämpft, die den visuellen und textlichen Verlauf sowie den Sicherheitsverfall in langen Kontexten ausnutzen. Diese Methode verwendet synthetisches Bootstrapping und Feedback-Dynamik und führt zudem den STEER-Datensatz für Training und Bewertung ein.

27
RESEARCHarXiv CS.CL·vor 12T

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

Der Artikel stellt ICG vor, ein neuartiges Framework zur personalisierten Titelbilderzeugung, das MLLM-basiertes Prompting mit Präferenzanpassung kombiniert. Es nutzt semantische Merkmale und Benutzer-Embeddings zur Kontextualisierung des Diffusionsmodells und wendet eine Multi-Reward-Lernstrategie an, um den Mangel an beschrifteter Überwachung zu beheben.

27