RESEARCHarXiv CS.LG·vor 26T
Plan Before You Trade: Inference-Time Optimization for RL Trading Agents
Dieses Papier stellt FPILOT vor, ein Plugin-Inferenzzeit-Optimierungsframework für Reinforcement Learning Handelsagenten. Es nutzt vorhergesagte Preisverläufe, um die Strategie zur Inferenzzeit zu optimieren, bevor ein Handel ausgeführt wird, und ist mit jedem vortrainierten Agenten kompatibel.
27