RESEARCH27

Hierarchical Policy Optimization for Simultaneous Translation of Unbounded Speech

arXiv CS.CL·24 avril 2026

Ce travail propose une Optimisation de Politique Hiérarchique (HPO) pour la Traduction Vocale Simultanée (SST) utilisant des LLM, s'attaquant aux coûts computationnels élevés et aux données d'entraînement imparfaites. Le HPO emploie une récompense hiérarchique pour équilibrer qualité de traduction et latence, démontrant des améliorations substantielles des scores COMET et MetricX.

LLMs machine learning Natural Language Processing speech-translation

Lire l'original ↗