heapsort
RESEARCH28

Optimistic Policy Learning under Pessimistic Adversaries with Regret and Violation Guarantees

arXiv CS.LG·17 de abril de 2026

Esta pesquisa aborda o desafio da tomada de decisões em ambientes com adversários estratégicos ou fatores externos, onde políticas tradicionais podem falhar catastroficamente em cenários críticos de segurança. Propõe uma abordagem otimista de aprendizado de políticas projetada para considerar essas interações e oferecer garantias de arrependimento e violação.

Ler original