← heapsort-ai

robust AI

2 items

RESEARCHarXiv CS.LG·4/17/2026

Optimistic Policy Learning under Pessimistic Adversaries with Regret and Violation Guarantees

Diese Forschung befasst sich mit der Herausforderung der Entscheidungsfindung in Umgebungen mit strategischen Gegnern oder externen Faktoren, wo traditionelle Strategien in sicherheitskritischen Umfeldern katastrophal versagen können. Sie schlägt einen optimistischen Policy-Lernansatz vor, der darauf abzielt, diese Interaktionen zu berücksichtigen und Regret- sowie Verletzungsgarantien zu bieten.

28
RESEARCHarXiv CS.LG·4/17/2026

The Devil Is in Gradient Entanglement: Energy-Aware Gradient Coordinator for Robust Generalized Category Discovery

Dieses Forschungspapier stellt einen energiebewussten Gradientenkoordinator vor, um die "Gradientenverschränkung" anzugehen, eine zentrale Herausforderung bei der robusten verallgemeinerten Kategorieentdeckung. Die vorgeschlagene Methode zielt darauf ab, die Robustheit und Leistung von KI-Modellen bei der Identifizierung neuer Kategorien zu verbessern.

27