Data efficiency

4 items

RESEARCH↑ trendingReddit r/MachineLearning·18/04/2026

Zero-shot World Models Are Developmentally Efficient Learners [R]

O Zero-shot World Model (ZWM) melhora significativamente a eficiência de dados da IA, permitindo competência visual com muito menos dados do que os modelos atuais. Treinado na experiência visual de uma única criança, o BabyZWM iguala os modelos de ponta em diversas tarefas visuo-cognitivas sem treinamento específico, abrindo caminho para sistemas de IA mais eficientes.

developmental AI Data efficiency World Models zero-shot learning

Zero-shot World Models Are Developmentally Efficient Learners [R]

RESEARCHarXiv CS.CL·21d atrás

Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free

O artigo propõe a anotação legal multi-rótulo como uma tarefa de recuperação, utilizando modelos congelados e k-vizinhos mais próximos para atribuir rótulos. Este método alcança precisão competitiva e alta eficiência de dados em conjuntos de dados jurídicos, reduzindo significativamente os custos computacionais em comparação com o ajuste fino de grandes modelos de linguagem.

Multi-label Classification LLMs Legal AI Data efficiency

RESEARCHarXiv CS.LG·22/04/2026

Easy Samples Are All You Need: Self-Evolving LLMs via Data-Efficient Reinforcement Learning

Esta pesquisa apresenta o EasyRL, uma nova abordagem de aprendizado por reforço eficiente em dados para LLMs auto-evolutivos, visando superar altos custos de anotação e problemas de desempenho em métodos existentes. Inspirado na teoria da aprendizagem cognitiva, o EasyRL integra transferência de conhecimento de dados rotulados fáceis com uma estratégia progressiva de dividir e conquistar para dados não rotulados difíceis.

Data efficiency reinforcement learning machine learning LLM

RESEARCHarXiv CS.CL·24/04/2026

Weighting What Matters: Boosting Sample Efficiency in Medical Report Generation via Token Reweighting

Este trabalho apresenta uma função de perda com reponderação de tokens para aumentar a eficiência de dados no treinamento de modelos de visão-linguagem para geração de relatórios médicos. Ao priorizar tokens semanticamente salientes, o método alcança qualidade de relatório comparável usando até dez vezes menos dados de treinamento.

Data efficiency machine learning computer vision natural language generation