Exploration

3 items

RESEARCHarXiv CS.LG·06/04/2026

OPRIDE: Offline Preference-based Reinforcement Learning via In-Dataset Exploration

O artigo aborda a baixa eficiência de consulta em Aprendizado por Reforço Baseado em Preferências (PbRL) offline, propondo o algoritmo OPRIDE. Este algoritmo visa melhorar a eficiência de consulta através de uma estratégia de exploração informativa e um mecanismo de agendamento de desconto para mitigar a superotimização da função de recompensa.

reinforcement learning Query Efficiency Exploration Offline Learning

RESEARCHarXiv CS.AI·9d atrás

Uncertainty-Aware and Temporally Regulated Expert Advice in Reinforcement Learning for Autonomous Driving

Este artigo propõe uma estrutura sensível à incerteza para aprendizado por reforço em direção autônoma, utilizando conselhos de especialistas para guiar a exploração com segurança e evitar a dependência de longo prazo. A metodologia emprega gatilhos de conselho adaptativos e uma estratégia de compromisso-cooldown para regular a orientação, demonstrando desempenho superior em simulações CARLA.

reinforcement learning autonomous driving Exploration uncertainty

NEWSMIT Tech Review AI·01/05/2026

Inexpensive seafloor-hopping submersibles could stoke deep-sea science—and mining

O navio de pesquisa Rainier da NOAA está a mapear o fundo do mar do Pacífico em busca de depósitos de minerais críticos. Esta missão de um mês utilizará submersíveis de salto no fundo do mar para ciência e mineração em águas profundas.

mining Exploration robotics