← heapsort-ai

MLLMs

7 items

RESEARCHarXiv CS.AI·hace 20h

PathoSage: Towards Multi-Source Evidence Adjudication in Pathology via Experience-Aware Agentic Workflow

PathoSage es un marco de tres etapas que aborda la adjudicación de evidencia en patología, separando explícitamente la recuperación de conocimiento, la recopilación y la adjudicación de evidencia. Utiliza un sistema agéntico con Deliberación Estructurada de Evidencia para evaluar de forma independiente la evidencia heterogénea y reducir el sesgo de anclaje.

54
RESEARCHarXiv CS.LG·21/4/2026

SaFeR-Steer: Evolving Multi-Turn MLLMs via Synthetic Bootstrapping and Feedback Dynamics

SaFeR-Steer es un nuevo marco para la alineación de seguridad de MLLMs en diálogos multi-turno, abordando ataques que explotan el historial visual-textual y la degradación de la seguridad en contextos largos. Este método utiliza bootstrapping sintético y dinámica de retroalimentación, y también introduce el conjunto de datos STEER para entrenamiento y evaluación.

27
RESEARCHarXiv CS.CL·hace 12d

ICG: Improving Cover Image Generation via MLLM-based Prompting and Personalized Preference Alignment

El artículo propone ICG, un nuevo marco para la generación personalizada de imágenes de portada que integra el prompting basado en MLLM con la alineación de preferencias. Utiliza características semánticas e incrustaciones de usuario para contextualizar el modelo de difusión y adopta una estrategia de aprendizaje de recompensas múltiples para abordar la falta de supervisión etiquetada.

27