Hybrid Models — artigos, notícias e pesquisas de IA

RESEARCHarXiv CS.CL·21/04/2026

Reciprocal Co-Training (RCT): Coupling Gradient-Based and Non-Differentiable Models via Reinforcement Learning

Este trabalho apresenta uma estrutura de co-treinamento recíproco que acopla um LLM a um classificador Random Forest via aprendizado por reforço. O sistema cria um loop de feedback iterativo onde cada modelo melhora usando sinais do outro, demonstrando ganhos de desempenho consistentes em conjuntos de dados médicos.

Random Forests LLMs reinforcement learning machine learning