I can't believe text normalization is so underdiscussed in streaming text-to-speech [D]
El autor señala la poca discusión sobre la normalización de texto en modelos de TTS en streaming, donde fallan al pronunciar fechas, URLs y otros elementos básicos. Menciona un benchmark que compara modelos comerciales de TTS centrándose en estos desafíos específicos.
