← heapsort-ai

robust AI

2 items

RESEARCHarXiv CS.LG·17/4/2026

Optimistic Policy Learning under Pessimistic Adversaries with Regret and Violation Guarantees

Esta investigación aborda el desafío de la toma de decisiones en entornos con adversarios estratégicos o factores externos, donde las políticas tradicionales pueden fallar catastróficamente en entornos críticos para la seguridad. Propone un enfoque optimista de aprendizaje de políticas diseñado para tener en cuenta estas interacciones y proporcionar garantías de arrepentimiento y violación.

28
RESEARCHarXiv CS.LG·17/4/2026

The Devil Is in Gradient Entanglement: Energy-Aware Gradient Coordinator for Robust Generalized Category Discovery

Este trabajo de investigación introduce un Coordinador de Gradiente Consciente de Energía para abordar el "entrelazamiento de gradiente", un desafío clave en la Descubierta Generalizada de Categorías Robusta. El método propuesto tiene como objetivo mejorar la robustez y el rendimiento de los modelos de IA en la identificación de nuevas categorías.

27