RESEARCH27
Plan Before You Trade: Inference-Time Optimization for RL Trading Agents
arXiv CS.LG·14. Mai 2026
Dieses Papier stellt FPILOT vor, ein Plugin-Inferenzzeit-Optimierungsframework für Reinforcement Learning Handelsagenten. Es nutzt vorhergesagte Preisverläufe, um die Strategie zur Inferenzzeit zu optimieren, bevor ein Handel ausgeführt wird, und ist mit jedem vortrainierten Agenten kompatibel.
Original lesen ↗