Data efficiency

4 items

RESEARCH↑ trendingReddit r/MachineLearning·18/4/2026

Zero-shot World Models Are Developmentally Efficient Learners [R]

El Zero-shot World Model (ZWM) mejora significativamente la eficiencia de datos de la IA, permitiendo la competencia visual con órdenes de magnitud menos datos que los modelos actuales. Entrenado con la experiencia visual de un solo niño, BabyZWM iguala a los modelos de vanguardia en diversas tareas visuo-cognitivas sin entrenamiento específico, avanzando hacia sistemas de IA más eficientes.

developmental AI Data efficiency World Models zero-shot learning

Zero-shot World Models Are Developmentally Efficient Learners [R]

RESEARCHarXiv CS.CL·hace 21d

Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free

El artículo propone la anotación legal multi-etiqueta como una tarea de recuperación, utilizando modelos congelados y k-vecinos más cercanos para asignar etiquetas. Este método logra una precisión competitiva y una alta eficiencia de datos en conjuntos de datos legales, reduciendo significativamente los costos computacionales en comparación con el ajuste fino de grandes modelos de lenguaje.

Multi-label Classification LLMs Legal AI Data efficiency

RESEARCHarXiv CS.LG·22/4/2026

Easy Samples Are All You Need: Self-Evolving LLMs via Data-Efficient Reinforcement Learning

Esta investigación introduce EasyRL, un nuevo enfoque de aprendizaje por refuerzo eficiente en datos para LLMs autoevolutivos, diseñado para superar los altos costos de anotación y problemas de rendimiento en métodos existentes. Inspirado en la teoría del aprendizaje cognitivo, EasyRL integra la transferencia de conocimiento de datos etiquetados fáciles con una estrategia progresiva de dividir y conquistar para datos no etiquetados difíciles.

Data efficiency reinforcement learning machine learning LLM

RESEARCHarXiv CS.CL·24/4/2026

Weighting What Matters: Boosting Sample Efficiency in Medical Report Generation via Token Reweighting

Este trabajo introduce una función de pérdida de reponderación de tokens para mejorar la eficiencia de datos en el entrenamiento de modelos de visión-lenguaje para la generación de informes médicos. Al priorizar tokens semánticamente importantes, el método logra una calidad de informe comparable utilizando hasta diez veces menos datos de entrenamiento.

Data efficiency machine learning computer vision natural language generation