RESEARCH27

jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers

arXiv CS.CL·12 de maio de 2026

Este trabalho apresenta GELATO, uma nova abordagem para modelos de embedding multimodais que estende arquiteturas VLM. Resulta na suíte jina-embeddings-v5-omni, que codifica texto, imagem, áudio e vídeo em um único espaço de embedding semântico com eficiência, congelando modelos de texto base e treinando apenas componentes de conexão.

embedding models multimodal AI deep learning machine learning AI Research

Ler original ↗