Worum handelt es sich bei der Speech-Befehlszeilenschnittstelle?

Die Speech-Befehlszeilenschnittstelle ist ein Befehlszeilentool, mit dem der Speech-Dienst verwendet werden kann, ohne Code zu schreiben. Die Speech CLI erfordert eine minimale Einrichtung. Sie können sie einfach verwenden, um mit wichtigen Features des Speech-Diensts zu experimentieren und zu sehen, wie er für Ihre Anwendungsfälle funktioniert. Innerhalb weniger Minuten können einfache Testworkflows wie etwa eine Batchspracherkennung auf der Grundlage eines Verzeichnisses mit Dateien oder eine Textsynthese für eine Sammlung von Zeichenfolgen aus einer Datei ausgeführt werden. Die Speech-Befehlszeilenschnittstelle kann jedoch nicht nur für einfache Workflows genutzt werden. Sie ist produktionsbereit und hochskalierbar, um umfangreichere Prozesse mit automatisierten Batches (.bat) oder Shellskripts auszuführen.

Über die Speech-Befehlszeilenschnittstelle stehen die meisten Features des Speech SDK zur Verfügung, und einige erweiterte Features und Anpassungen sind in der Speech-Befehlszeilenschnittstelle vereinfacht. Bei Ihrer Entscheidung für die Verwendung der Speech CLI oder des Speech SDK können Sie sich an der folgenden Anleitung orientieren.

Verwenden Sie in folgenden Fällen die Speech-Befehlszeilenschnittstelle:

  • Sie möchten mit minimalem Einrichtungs- und ohne Programmieraufwand mit Features des Speech-Diensts experimentieren.
  • Sie haben relativ einfache Anforderungen an eine Produktionsanwendung, für die der Speech-Dienst genutzt wird.

Verwenden Sie in folgenden Fällen das Speech SDK:

  • Sie möchten Funktionen des Speech-Diensts im Rahmen einer bestimmten Sprache oder Plattform (z. B. C#, Python oder C++) integrieren.
  • Sie haben komplexe Anforderungen, die möglicherweise erweiterte Dienstanforderungen erfordern.
  • Sie entwickeln benutzerdefiniertes Verhalten, einschließlich Antwortstreaming.

Wichtige Funktionen

  • Spracherkennung: Konvertieren Sie Sprache aus Audiodateien oder direkt über ein Mikrofon in Text, oder erstellen Sie ein Transkript einer aufgezeichneten Unterhaltung.

  • Sprachsynthese: Konvertieren Sie Text in Sprache, und verwenden Sie als Eingabe entweder Textdateien oder direkte Befehlszeileneingaben. Passen Sie die Merkmale der Sprachausgabe mit SSML-Konfigurationen (Speech Synthesis Markup Language) und neuronalen Stimmen an.

  • Sprachübersetzung: Übersetzen Sie Audio aus einer Ausgangssprache in Text oder Audio in einer Zielsprache.

  • Ausführung in Azure-Computeressourcen: Senden Sie Speech CLI-Befehle für die Ausführung in einer Azure-Remotecomputeressource unter Verwendung von spx webjob.

Erste Schritte

Informationen zu den ersten Schritten mit der Speech-Befehlszeilenschnittstelle finden Sie in der Schnellstartanleitung. In diesem Artikel erfahren Sie, wie Sie einige grundlegende Befehle ausführen. Außerdem werden etwas komplexere Befehle zum Ausführen von Batchvorgängen für Spracherkennung und Sprachsynthese vorgestellt. Nachdem Sie den Artikel zu den Grundlagen gelesen haben, sollten Sie die Syntax gut genug verstehen, um mit dem Schreiben einiger benutzerdefinierter Befehle zu beginnen oder einfache Vorgänge des Speech-Diensts zu automatisieren.

Nächste Schritte