I can't believe text normalization is so underdiscussed in streaming text-to-speech [D]
O autor destaca a pouca discussão sobre a normalização de texto em modelos de TTS streaming, onde falhas ocorrem na pronúncia de datas, URLs e outros elementos. Ele menciona um benchmark que compara modelos comerciais de TTS focando nesses desafios específicos.
