← heapsort-ai

voice recognition

2 items

ARTICLEDEV.to AI·hace 5h

How is speaker embedding used in voice recognition for transcripts?

Este artículo explica cómo la tecnología de incrustación de locutor (speaker embedding) resuelve el problema de "¿quién habló cuándo?" en las transcripciones de reuniones, representando numéricamente las características vocales únicas. Detalla el pipeline de diarización y los enfoques arquitectónicos para implementarlo en sistemas modernos de voz a texto.

63
ARTICLEDEV.to AI·hace 15d

The Voice-to-Material Magic: How AI Turns On-Site Dictation into Precise Parts Lists

La automatización de IA puede transformar notas de voz y fotos in situ en listas de piezas precisas, reduciendo significativamente el tiempo y los errores de la compilación manual de materiales. Este proceso de "voz a material" implica transcripción precisa y reconocimiento de intención/entidad para identificar cantidades y productos.

27