RESEARCH27
jina-embeddings-v5-omni: Geometry-preserving Embeddings via Locked Aligned Towers
arXiv CS.CL·12 de maio de 2026
Este trabalho apresenta GELATO, uma nova abordagem para modelos de embedding multimodais que estende arquiteturas VLM. Resulta na suíte jina-embeddings-v5-omni, que codifica texto, imagem, áudio e vídeo em um único espaço de embedding semântico com eficiência, congelando modelos de texto base e treinando apenas componentes de conexão.
Ler original ↗