← heapsort-ai

Theoretical AI

3 items

RESEARCHarXiv CS.LG·19d atrás

Provably Learning Diffusion Models under the Manifold Hypothesis: Collapse and Refine

Este artigo propõe uma explicação teórica para a eficiência dos modelos de difusão na aprendizagem da função de score para dados de alta dimensão em variedades de baixa dimensão. Ele identifica um mecanismo de "colapso e refinamento" impulsionado pela geometria da própria função de score, onde o mapa de denoising se projeta na variedade de dados e refina a densidade intrínseca.

29
RESEARCHarXiv CS.LG·23/04/2026

Rethinking Reinforcement Fine-Tuning in LVLM: Convergence, Reward Decomposition, and Generalization

Esta pesquisa introduz o Processo de Decisão de Markov Aumentado por Ferramentas (TA-MDP) para modelar formalmente a tomada de decisão agêntica multimodal, abordando lacunas teóricas no ajuste fino por reforço para Grandes Modelos Visão-Linguagem (LVLMs). O estudo investiga como as recompensas verificáveis afetam a convergência do GRPO e a generalização de LVLMs agênticos para domínios fora de distribuição.

28