Exploration

3 items

RESEARCHarXiv CS.LG·4/6/2026

OPRIDE: Offline Preference-based Reinforcement Learning via In-Dataset Exploration

O artigo aborda a baixa eficiência de consulta em Aprendizado por Reforço Baseado em Preferências (PbRL) offline, propondo o algoritmo OPRIDE. Este algoritmo visa melhorar a eficiência de consulta através de uma estratégia de exploração informativa e um mecanismo de agendamento de desconto para mitigar a superotimização da função de recompensa.

reinforcement learning Query Efficiency Exploration Offline Learning

RESEARCHarXiv CS.AI·8d ago

Uncertainty-Aware and Temporally Regulated Expert Advice in Reinforcement Learning for Autonomous Driving

This paper proposes an uncertainty-aware framework for reinforcement learning in autonomous driving, leveraging expert advice to guide exploration safely while avoiding long-term dependence. It employs adaptive thresholds for advice triggering and a commitment-cooldown strategy to regulate guidance, demonstrating improved performance in CARLA simulations.

reinforcement learning autonomous driving Exploration uncertainty

NEWSMIT Tech Review AI·5/1/2026

Inexpensive seafloor-hopping submersibles could stoke deep-sea science—and mining

NOAA's research vessel Rainier is mapping the Pacific seafloor between Australia and South America to find critical mineral deposits. This month-long mission will use seafloor-hopping submersibles for deep-sea science and mining.

mining Exploration robotics