RESEARCH27

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

arXiv CS.CL·12. Mai 2026

Diese Arbeit stellt GELATO vor, einen neuartigen Ansatz für multimodale Embedding-Modelle, der VLM-Architekturen erweitert. Dies führt zur jina-embeddings-v5-omni-Suite, die Text, Bilder, Audio und Video effizient in einen einzigen semantischen Embedding-Raum kodiert, indem Basis-Textmodelle eingefroren und nur Verbindungskomponenten trainiert werden.

embedding models multimodal AI deep learning machine learning AI research

Original lesen ↗