← heapsort-ai

robust AI

2 items

RESEARCHarXiv CS.LG·17/04/2026

Optimistic Policy Learning under Pessimistic Adversaries with Regret and Violation Guarantees

Esta pesquisa aborda o desafio da tomada de decisões em ambientes com adversários estratégicos ou fatores externos, onde políticas tradicionais podem falhar catastroficamente em cenários críticos de segurança. Propõe uma abordagem otimista de aprendizado de políticas projetada para considerar essas interações e oferecer garantias de arrependimento e violação.

28
RESEARCHarXiv CS.LG·17/04/2026

The Devil Is in Gradient Entanglement: Energy-Aware Gradient Coordinator for Robust Generalized Category Discovery

Este artigo de pesquisa apresenta um Coordenador de Gradiente Consciente de Energia para resolver o "entrelaçamento de gradiente", um desafio fundamental na Descoberta Generalizada de Categorias Robusta. O método proposto visa melhorar a robustez e o desempenho de modelos de IA na identificação de novas categorias.

27