← heapsort-ai

adversarial AI

3 items

RESEARCHarXiv CS.LG·17/4/2026

Optimistic Policy Learning under Pessimistic Adversaries with Regret and Violation Guarantees

Esta investigación aborda el desafío de la toma de decisiones en entornos con adversarios estratégicos o factores externos, donde las políticas tradicionales pueden fallar catastróficamente en entornos críticos para la seguridad. Propone un enfoque optimista de aprendizaje de políticas diseñado para tener en cuenta estas interacciones y proporcionar garantías de arrepentimiento y violación.

28