RESEARCH28
Reciprocal Co-Training (RCT): Coupling Gradient-Based and Non-Differentiable Models via Reinforcement Learning
arXiv CS.CL·21. April 2026
Diese Arbeit stellt einen reziproken Co-Training-Framework vor, der ein LLM mit einem Random Forest-Klassifikator über Reinforcement Learning koppelt. Es schafft eine iterative Feedback-Schleife, in der jedes Modell durch Signale des anderen verbessert wird, und zeigt konsistente Leistungssteigerungen über medizinische Datensätze hinweg.
Original lesen ↗