← heapsort-ai

World Models

12 items

RESEARCH↑ trendingReddit r/MachineLearning·18/4/2026

Zero-shot World Models Are Developmentally Efficient Learners [R]

El Zero-shot World Model (ZWM) mejora significativamente la eficiencia de datos de la IA, permitiendo la competencia visual con órdenes de magnitud menos datos que los modelos actuales. Entrenado con la experiencia visual de un solo niño, BabyZWM iguala a los modelos de vanguardia en diversas tareas visuo-cognitivas sin entrenamiento específico, avanzando hacia sistemas de IA más eficientes.

Zero-shot World Models Are Developmentally Efficient Learners [R]
42
RESEARCHarXiv CS.LG·22/4/2026

Curiosity-Critic: Cumulative Prediction Error Improvement as a Tractable Intrinsic Reward for World Model Training

Curiosity-Critic presenta una recompensa intrínseca para el entrenamiento de modelos de mundo, centrada en la mejora del error de predicción acumulativo en lugar de solo las transiciones actuales. Utiliza un crítico aprendido para estimar una línea base de error asintótico, separando eficazmente los errores epistémicos de los aleatorios y dirigiendo la exploración hacia transiciones aprendibles.

27
ARTICLEDEV.to AI·24/4/2026

Sentie. The Automated AI Consultant

Sentie aborda el fallo común de los agentes de IA en tareas de varios pasos, atribuyendo el problema a fallos arquitectónicos en lugar de solo a las capacidades del LLM. La plataforma utiliza un modelo mundial basado en JEPA para desplegar agentes de IA autónomos con mayor fiabilidad en entornos de producción.

27
RESEARCHarXiv CS.LG·hace 7d

World Models: A Comprehensive Survey of Architectures, Methodologies, Reasoning Paradigms, and Applications

Esta encuesta aborda la falta de un marco unificado para los modelos de mundo, simuladores internos utilizados en IA para la predicción, planificación y razonamiento. Propone una taxonomía multieje que organiza sus diversos aspectos como arquitectura, metodología, paradigmas de razonamiento y aplicaciones en campos como el aprendizaje por refuerzo y la robótica.

27
RESEARCHarXiv CS.LG·hace 20d

PROWL: Prioritized Regret-Driven Optimization for World Model Learning

PROWL introduce un currículo adversarial con restricción KL donde una política expone trayectorias de alto error de un modelo de mundo basado en difusión. Este método mejora la robustez del modelo al enfocarse en transiciones raras y críticas para la interacción, convirtiendo los fallos en una señal de entrenamiento estable sin desviarse a la explotación fuera de distribución.

27
RESEARCHarXiv CS.LG·hace 11d

Emergent Semantic Representations in World Models through Physical Interaction without Linguistic Supervision

Esta investigación explora cómo los modelos de mundo aprenden representaciones semánticas a partir de la exploración física sin supervisión lingüística. Se encuentra que su espacio latente desarrolla una estructura semántica espacial que refleja la geometría física, y el alineamiento semántico mejora con el rendimiento predictivo.

27
RESEARCHarXiv CS.AI·hace 8d

Physically Viable World Models: A Case for Query-Conditioned Embodied AI

Los modelos del mundo para la IA encarnada deben ser físicamente viables, representando la estructura física que rige los resultados de las acciones en lugar de simplemente predecir observaciones futuras. Este trabajo expone que los modelos predictivos de observación existentes pueden producir simulaciones visualmente plausibles pero físicamente incorrectas, argumentando que la IA encarnada requiere modelos del mundo que identifiquen la abstracción física más simple para responder a consultas de intervención.

27
ARTICLEMIT Tech Review AI·21/4/2026

World models

Los sistemas de IA han logrado un dominio impresionante en el mundo digital, pero el mundo físico sigue siendo un desafío importante para la humanidad. Tareas como doblar la ropa o navegar por una calle son más difíciles para la IA que componer novelas o codificar aplicaciones.

21