RESEARCH27
jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers
arXiv CS.CL·12. Mai 2026
Diese Arbeit stellt GELATO vor, einen neuartigen Ansatz für multimodale Embedding-Modelle, der VLM-Architekturen erweitert. Dies führt zur jina-embeddings-v5-omni-Suite, die Text, Bilder, Audio und Video effizient in einen einzigen semantischen Embedding-Raum kodiert, indem Basis-Textmodelle eingefroren und nur Verbindungskomponenten trainiert werden.
Original lesen ↗