← heapsort-ai

World Models

12 items

ARTICLE↑ trendingReddit r/LocalLLaMA·18/04/2026

I made a tiny world model game that runs locally on iPad

L'utilisateur a développé un prototype de jeu de conduite pour iPad qui utilise des modèles de monde entraînés localement pour interpréter des photos ou des dessins en un gameplay contrôlable. Bien qu'il soit encore "gluant", le projet vise à évoluer vers une boucle de jeu complète, démontrant les applications de l'IA sur l'appareil.

I made a tiny world model game that runs locally on iPad
43
RESEARCH↑ trendingReddit r/MachineLearning·18/04/2026

Zero-shot World Models Are Developmentally Efficient Learners [R]

Le Zero-shot World Model (ZWM) améliore considérablement l'efficacité des données de l'IA, permettant une compétence visuelle avec beaucoup moins de données que les modèles actuels. Entraîné sur l'expérience visuelle d'un seul enfant, BabyZWM égale les modèles de pointe sur diverses tâches visuo-cognitives sans entraînement spécifique, ouvrant la voie à des systèmes d'IA plus efficaces.

Zero-shot World Models Are Developmentally Efficient Learners [R]
42
RESEARCHarXiv CS.LG·22/04/2026

Curiosity-Critic: Cumulative Prediction Error Improvement as a Tractable Intrinsic Reward for World Model Training

Curiosity-Critic introduit une récompense intrinsèque pour l'entraînement des modèles de monde, en se concentrant sur l'amélioration de l'erreur de prédiction cumulative plutôt que sur les transitions actuelles. Il utilise un critique appris pour estimer une base d'erreur asymptotique, séparant efficacement les erreurs épistémiques des erreurs aléatoires et orientant l'exploration vers les transitions apprenables.

27
NEWSDEV.to AI·il y a 24j

NVIDIA libera SANA-WM: world model eficiente a escala de minuto

NVIDIA Research a lancé SANA-WM, une extension du modèle SANA axée sur la modélisation de monde à l'échelle de la minute. Ce modèle permet des simulations visuelles cohérentes sur de longues séquences avec un coût computationnel réduit, renforçant l'engagement de NVIDIA à rendre la génération de vidéo et d'environnements accessible.

27
ARTICLEDEV.to AI·24/04/2026

Sentie. The Automated AI Consultant

Sentie résout l'échec courant des agents d'IA dans les tâches multi-étapes, attribuant le problème à des défauts architecturaux plutôt qu'aux seules capacités des LLM. La plateforme déploie des agents d'IA autonomes en utilisant un modèle de monde basé sur JEPA pour une meilleure fiabilité en production.

27
RESEARCHarXiv CS.LG·il y a 7j

World Models: A Comprehensive Survey of Architectures, Methodologies, Reasoning Paradigms, and Applications

Cette étude aborde le manque de cadre unifié pour les modèles de monde, des simulateurs internes utilisés en IA pour la prédiction, la planification et le raisonnement. Elle propose une taxonomie multi-axes organisant leurs divers aspects tels que l'architecture, la méthodologie, les paradigmes de raisonnement et les applications dans des domaines comme l'apprentissage par renforcement et la robotique.

27
RESEARCHarXiv CS.LG·il y a 20j

PROWL: Prioritized Regret-Driven Optimization for World Model Learning

PROWL introduit un programme adversarial contraint par KL où une politique expose des trajectoires à forte erreur d'un modèle du monde basé sur la diffusion. Cette méthode améliore la robustesse du modèle en se concentrant sur les transitions rares et critiques pour l'interaction, transformant les échecs en un signal d'entraînement stable sans dériver vers l'exploitation hors distribution.

27
RESEARCHarXiv CS.LG·il y a 11j

Emergent Semantic Representations in World Models through Physical Interaction without Linguistic Supervision

Cette recherche explore comment les modèles du monde apprennent des représentations sémantiques à partir de l'exploration physique sans supervision linguistique. Elle révèle que leur espace latent développe une structure sémantique spatiale qui reflète la géométrie physique, et l'alignement sémantique s'améliore avec les performances de prédiction.

27
RESEARCHarXiv CS.AI·il y a 8j

Physically Viable World Models: A Case for Query-Conditioned Embodied AI

Les modèles du monde pour l'IA incarnée doivent être physiquement viables, représentant la structure physique qui gouverne les résultats des actions plutôt que de simplement prédire des observations futures. Cet article expose que les modèles prédictifs d'observation existants peuvent produire des déroulements visuellement plausibles mais physiquement erronés, et soutient que l'IA incarnée nécessite des modèles du monde qui identifient l'abstraction physique la plus simple pour répondre aux requêtes d'intervention.

27
ARTICLEMIT Tech Review AI·21/04/2026

World models

Alors que les systèmes d'IA maîtrisent le monde numérique, le domaine physique reste un défi majeur pour l'humanité. Des tâches comme plier le linge ou naviguer en ville s'avèrent plus difficiles pour l'IA que de composer des romans ou de coder des applications.

21