heapsort
RESEARCH27

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

arXiv CS.CL·12 mai 2026

Ce travail présente GELATO, une nouvelle approche pour les modèles d'embedding multimodaux qui étend les architectures de type VLM. Il en résulte la suite jina-embeddings-v5-omni, qui encode efficacement texte, image, audio et vidéo dans un espace d'embedding sémantique unique en gelant les modèles de texte principaux et en entraînant uniquement les composants de connexion.

Lire l'original