Deep Reinforcement Learning

4 items

RESEARCHDEV.to AI·4/11/2026

End-to-End Deep Reinforcement Learning for Lane Keeping Assist

Dieser Inhalt konzentriert sich auf die Anwendung von End-to-End Deep Reinforcement Learning für die Entwicklung von Spurhalteassistenzsystemen. Die Forschung untersucht den Einsatz fortschrittlicher KI zur Verbesserung der Fahrzeugsicherheit und -autonomie.

Deep Reinforcement Learning Machine Learning autonomous driving Lane Keeping Assist

RESEARCHarXiv CS.AI·4/13/2026

RAMP: Hybrid DRL for Online Learning of Numeric Action Models

RAMP schlägt eine neuartige Strategie vor, um numerische Planungs-Aktionsmodelle online durch Umweltinteraktionen zu lernen, indem es Deep Reinforcement Learning (DRL), Aktionsmodell-Lernen und Planung integriert. Dies erzeugt eine positive Rückkopplungsschleife, in der die RL-Strategie Daten sammelt, um das Aktionsmodell zu verfeinern, während der Planer Pläne generiert, um die RL-Strategie weiter zu trainieren.

Deep Reinforcement Learning Action Model Learning Numeric Planning reinforcement learning

RESEARCHarXiv CS.AI·4/6/2026

Interpretable Deep Reinforcement Learning for Element-level Bridge Life-cycle Optimization

O artigo aborda a aplicação de Aprendizado por Reforço Profundo interpretável para a otimização do ciclo de vida de pontes em nível de elemento. Ele busca oferecer transparência e eficiência na gestão da infraestrutura.

Deep Reinforcement Learning Optimization interpretable AI Civil Engineering

RESEARCHarXiv CS.AI·4/7/2026

When Adaptive Rewards Hurt: Causal Probing and the Switching-Stability Dilemma in LLM-Guided LEO Satellite Scheduling

Este artigo de pesquisa explora o design adaptativo de recompensas para DRL no agendamento de satélites LEO, revelando um dilema de estabilidade onde pesos de recompensa estáticos superam os dinâmicos devido à necessidade de um sinal quase estacionário para o PPO. O estudo introduz um método de sondagem causal para identificar a alavancagem de termos de recompensa específicos, descobrindo que um aumento na penalidade de switching melhora significativamente a taxa de dados.

Deep Reinforcement Learning satellite scheduling Reward Design