Modulbewertung

1.

Welche Aktivität geschieht während der Vorverarbeitungsphase der Spracherkennung?

Die Audiodaten werden in .wmv Format konvertiert.

Hintergrundgeräusche werden dem Audiosignal hinzugefügt.

Featurevektoren werden aus der Audiowellenform für die Modellierung extrahiert.

2.

Was sind Phoneme?

Artefakte, die im Rahmen des Bereinigungsprozesses aus dem Signal entfernt werden.

Die kleinste Klangeinheit in der Sprache.

KI-Modelle, die Audio generieren.

3.

Warum ist es wichtig, prosody in der Sprachsynthese zu erzeugen?

Prosody maximiert die Lautstärke der Audioausgabe.

Prosody übersetzt die Rede in die Sprache des Zuhörers.

Prosody sorgt für natürliche Aussprache und Sprachrhythmik.

Überprüfen Sie Ihr Wissen