← heapsort-ai

Hybrid Models

1 items

RESEARCHarXiv CS.CL·21/04/2026

Reciprocal Co-Training (RCT): Coupling Gradient-Based and Non-Differentiable Models via Reinforcement Learning

Este trabalho apresenta uma estrutura de co-treinamento recíproco que acopla um LLM a um classificador Random Forest via aprendizado por reforço. O sistema cria um loop de feedback iterativo onde cada modelo melhora usando sinais do outro, demonstrando ganhos de desempenho consistentes em conjuntos de dados médicos.

28