RESEARCH27

Plan Before You Trade: Inference-Time Optimization for RL Trading Agents

arXiv CS.LG·14. Mai 2026

Dieses Papier stellt FPILOT vor, ein Plugin-Inferenzzeit-Optimierungsframework für Reinforcement Learning Handelsagenten. Es nutzt vorhergesagte Preisverläufe, um die Strategie zur Inferenzzeit zu optimieren, bevor ein Handel ausgeführt wird, und ist mit jedem vortrainierten Agenten kompatibel.

Optimization financial trading reinforcement learning AI in finance portfolio management

Original lesen ↗