Theoretical AI

3 items

RESEARCH↑ trendingReddit r/MachineLearning·il y a 27j

Human-level performance via ML was not proven impossible with complexity theory [D]

Un nouvel article réfute le "Théorème Ingenia", qui prétendait prouver l'impossibilité de l'AGI via l'apprentissage automatique en utilisant la théorie de la complexité. La réfutation soutient que la preuve originale est erronée en raison d'une définition indéfinie de "classificateur de niveau humain" et d'un échange de définitions formelles.

Theoretical AI Proof Refutation AGI machine learning

RESEARCHarXiv CS.LG·il y a 19j

Provably Learning Diffusion Models under the Manifold Hypothesis: Collapse and Refine

Cet article propose une explication théorique de l'efficacité des modèles de diffusion pour l'apprentissage de la fonction de score sur des données de haute dimension reposant sur des variétés de basse dimension. Il identifie un mécanisme de « collapse et raffinement » basé sur la géométrie de la fonction de score, où le mappage de débruitage se projette sur la variété de données et affine la densité intrinsèque.

Diffusion Models Theoretical AI machine learning Manifold Learning

RESEARCHarXiv CS.LG·23/04/2026

Rethinking Reinforcement Fine-Tuning in LVLM: Convergence, Reward Decomposition, and Generalization

Cette recherche introduit le Processus de Décision de Markov Augmenté par Outils (TA-MDP) pour modéliser formellement la prise de décision agentique multimodale, comblant les lacunes théoriques dans le réglage fin par renforcement pour les Grands Modèles Vision-Langage (LVLM). Elle examine comment les récompenses vérifiables composites affectent la convergence de GRPO et pourquoi l'entraînement sur de petits ensembles de données se généralise à des domaines hors distribution pour les LVLM agentiques.

Theoretical AI reinforcement learning vision models large language models

Theoretical AI

Human-level performance via ML was *not* proven impossible with complexity theory [D]

Provably Learning Diffusion Models under the Manifold Hypothesis: Collapse and Refine

Rethinking Reinforcement Fine-Tuning in LVLM: Convergence, Reward Decomposition, and Generalization

Human-level performance via ML was not proven impossible with complexity theory [D]