RESEARCHarXiv CS.CL·24/04/2026
Hierarchical Policy Optimization for Simultaneous Translation of Unbounded Speech
Este trabalho propõe a Otimização Hierárquica de Políticas (HPO) para Tradução Simultânea de Fala (SST) utilizando LLMs, abordando desafios como alto custo computacional e dados imperfeitos. O HPO emprega uma recompensa hierárquica para equilibrar qualidade de tradução e latência, mostrando melhorias substanciais em pontuações COMET e MetricX.
27