← heapsort-ai

robust AI

2 items

RESEARCHarXiv CS.LG·17/04/2026

Optimistic Policy Learning under Pessimistic Adversaries with Regret and Violation Guarantees

Cette recherche aborde le défi de la prise de décision dans des environnements avec des adversaires stratégiques ou des facteurs externes, où les politiques traditionnelles peuvent échouer catastrophiquement dans des contextes de sécurité critiques. Elle propose une approche d'apprentissage de politiques optimiste conçue pour tenir compte de ces interactions et fournir des garanties de regret et de violation.

28
RESEARCHarXiv CS.LG·17/04/2026

The Devil Is in Gradient Entanglement: Energy-Aware Gradient Coordinator for Robust Generalized Category Discovery

Cet article de recherche présente un Coordinateur de Gradient Sensible à l'Énergie pour aborder l'"enchevêtrement de gradient", un défi majeur dans la Découverte Généralisée de Catégories Robuste. La méthode proposée vise à améliorer la robustesse et les performances des modèles d'IA pour identifier de nouvelles catégories.

27