RESEARCHarXiv CS.LG·17/04/2026
Optimistic Policy Learning under Pessimistic Adversaries with Regret and Violation Guarantees
Esta pesquisa aborda o desafio da tomada de decisões em ambientes com adversários estratégicos ou fatores externos, onde políticas tradicionais podem falhar catastroficamente em cenários críticos de segurança. Propõe uma abordagem otimista de aprendizado de políticas projetada para considerar essas interações e oferecer garantias de arrependimento e violação.
28