Data efficiency

4 items

RESEARCH↑ trendingReddit r/MachineLearning·18/04/2026

Zero-shot World Models Are Developmentally Efficient Learners [R]

Le Zero-shot World Model (ZWM) améliore considérablement l'efficacité des données de l'IA, permettant une compétence visuelle avec beaucoup moins de données que les modèles actuels. Entraîné sur l'expérience visuelle d'un seul enfant, BabyZWM égale les modèles de pointe sur diverses tâches visuo-cognitives sans entraînement spécifique, ouvrant la voie à des systèmes d'IA plus efficaces.

developmental AI Data efficiency World Models zero-shot learning

Zero-shot World Models Are Developmentally Efficient Learners [R]

RESEARCHarXiv CS.CL·il y a 21j

Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free

L'article propose d'aborder l'annotation juridique multi-étiquettes comme une tâche de récupération, en utilisant des modèles figés et des k-plus proches voisins pour attribuer les étiquettes. Cette méthode atteint une précision compétitive et une forte efficacité des données sur des ensembles de données juridiques, réduisant considérablement les coûts de calcul par rapport au réglage fin des grands modèles linguistiques.

Multi-label Classification LLMs Legal AI Data efficiency

RESEARCHarXiv CS.LG·22/04/2026

Easy Samples Are All You Need: Self-Evolving LLMs via Data-Efficient Reinforcement Learning

Cette recherche présente EasyRL, une nouvelle approche d'apprentissage par renforcement économe en données pour les LLMs auto-évolutifs, conçue pour surmonter les coûts d'annotation élevés et les problèmes de performance des méthodes existantes. Inspiré par la théorie de l'apprentissage cognitif, EasyRL intègre le transfert de connaissances de données étiquetées faciles avec une stratégie progressive de diviser pour régner pour les données non étiquetées difficiles.

Data efficiency reinforcement learning machine learning LLM

RESEARCHarXiv CS.CL·24/04/2026

Weighting What Matters: Boosting Sample Efficiency in Medical Report Generation via Token Reweighting

Ce travail introduit une fonction de perte de repondération de jetons pour améliorer l'efficacité des données lors de l'entraînement de modèles vision-langage pour la génération de rapports médicaux. En priorisant les jetons sémantiquement pertinents, la méthode atteint une qualité de rapport comparable en utilisant jusqu'à dix fois moins de données d'entraînement.

Data efficiency machine learning computer vision natural language generation