← heapsort-ai

safety-critical-ai

1 items

RESEARCHarXiv CS.LG·27d atrás

Learning When to Act: Communication-Efficient Reinforcement Learning via Run-Time Assurance

Este artigo propõe uma abordagem de aprendizado por reforço eficiente em comunicação, onde uma única política aprende decisões de controle e tempo, protegida por uma camada de segurança Lyapunov. Um sistema de garantia em tempo de execução anula a política para fornecer garantias de segurança mais fortes e aumentar significativamente os intervalos médios entre amostras em sistemas robóticos.

27