RESEARCH27
Balancing Multimodal Learning through Label Space Reshaping
arXiv CS.LG·29 de mayo de 2026
El artículo aborda el desequilibrio de modalidades en el aprendizaje multimodal, donde algunas modalidades dominan la optimización. Propone que esta discrepancia surge de diferentes dificultades de mapeo entre el espacio de características específicas de la modalidad y el espacio de etiquetas compartido, introduciendo BMLR para igualar esta dificultad.
Leer original ↗