← heapsort-ai

voice recognition

2 items

ARTICLEDEV.to AI·il y a 5h

How is speaker embedding used in voice recognition for transcripts?

Cet article explique comment la technologie d'intégration de locuteur (speaker embedding) résout le problème de l'identification de l'orateur dans les transcriptions de réunions, en représentant numériquement les caractéristiques vocales uniques. Il détaille le pipeline de diarisation et les approches architecturales pour l'implémenter dans les systèmes modernes de reconnaissance vocale.

63
ARTICLEDEV.to AI·il y a 15j

The Voice-to-Material Magic: How AI Turns On-Site Dictation into Precise Parts Lists

L'automatisation de l'IA peut transformer les notes vocales et les photos prises sur site en listes de pièces précises, réduisant considérablement le temps et les erreurs associées à la compilation manuelle de matériaux. Ce processus "voix-vers-matériel" implique une transcription précise et une reconnaissance d'intention/d'entité.

27