Dieser Browser wird nicht mehr unterstützt.
Führen Sie ein Upgrade auf Microsoft Edge durch, um die neuesten Features, Sicherheitsupdates und den technischen Support zu nutzen.
Welche Aktivität geschieht während der Vorverarbeitungsphase der Spracherkennung?
Die Audiodaten werden in .wmv Format konvertiert.
Hintergrundgeräusche werden dem Audiosignal hinzugefügt.
Featurevektoren werden aus der Audiowellenform für die Modellierung extrahiert.
Was sind Phoneme?
Artefakte, die im Rahmen des Bereinigungsprozesses aus dem Signal entfernt werden.
Die kleinste Klangeinheit in der Sprache.
KI-Modelle, die Audio generieren.
Warum ist es wichtig, prosody in der Sprachsynthese zu erzeugen?
Prosody maximiert die Lautstärke der Audioausgabe.
Prosody übersetzt die Rede in die Sprache des Zuhörers.
Prosody sorgt für natürliche Aussprache und Sprachrhythmik.
Sie müssen alle Fragen beantworten, bevor Sie Ihre Arbeit überprüfen können.
War diese Seite hilfreich?
Benötigen Sie Hilfe zu diesem Thema?
Möchten Sie versuchen, Ask Learn zu verwenden, um Sie durch dieses Thema zu klären oder zu leiten?