RESEARCH27
Hierarchical Policy Optimization for Simultaneous Translation of Unbounded Speech
arXiv CS.CL·24 avril 2026
Ce travail propose une Optimisation de Politique Hiérarchique (HPO) pour la Traduction Vocale Simultanée (SST) utilisant des LLM, s'attaquant aux coûts computationnels élevés et aux données d'entraînement imparfaites. Le HPO emploie une récompense hiérarchique pour équilibrer qualité de traduction et latence, démontrant des améliorations substantielles des scores COMET et MetricX.
Lire l'original ↗