RESEARCH28
Optimistic Policy Learning under Pessimistic Adversaries with Regret and Violation Guarantees
arXiv CS.LG·17 de abril de 2026
Esta pesquisa aborda o desafio da tomada de decisões em ambientes com adversários estratégicos ou fatores externos, onde políticas tradicionais podem falhar catastroficamente em cenários críticos de segurança. Propõe uma abordagem otimista de aprendizado de políticas projetada para considerar essas interações e oferecer garantias de arrependimento e violação.
Ler original ↗