← heapsort-ai

Tokenization

11 items

RESEARCH↑ trendingReddit r/MachineLearning·hace 19d

Do VLMs in production still use fixed-patch ViTs for their vision capabilities? [D]

Esta discusión cuestiona si los Modelos de Lenguaje Visual (VLMs) en producción aún utilizan ViTs de parche fijo para sus capacidades de visión, a pesar de la existencia de métodos de tokenización más eficientes. Explora posibles razones para esto, como ganancias marginales, limitaciones de tubería o leyes de escala no claras para el "patching" adaptativo.

42
RESEARCHarXiv CS.LG·hace 11d

Continuity and Ordinality Matter: Constraining Time Series Tokens for Effective Time Series Analysis with Large Language Models

Este artículo presenta COM (Continuity and Ordinality Matter), una estrategia que integra restricciones geométricas en las etapas de inicialización y entrenamiento de los grandes modelos de lenguaje basados en tokens (TS-LLMs) para el análisis de series temporales. La investigación demuestra que preservar la continuidad y la ordinalidad en los embeddings de tokens de series temporales mejora significativamente el rendimiento y la generalizabilidad del modelo.

27
RESEARCHarXiv CS.AI·hace 13d

BrickAnything: Geometry-Conditioned Buildable Brick Generation with Structure-Aware Tokenization

Este trabajo presenta BrickAnything, un marco autorregresivo condicionado por la geometría para generar estructuras de ladrillos construibles físicamente a partir de diversas formas 3D. Utiliza nubes de puntos como interfaz geométrica unificada y predice secuencias de ladrillos que reconstruyen la forma objetivo bajo restricciones de ensamblaje, introduciendo una tokenización de árbol sensible a la estructura.

27