Worum handelt es sich bei der Speech-Befehlszeilenschnittstelle?

Artikel
24.09.2024

Die Speech-Befehlszeilenschnittstelle ist ein Befehlszeilentool, mit dem der Speech-Dienst verwendet werden kann, ohne Code zu schreiben. Die Speech CLI erfordert eine minimale Einrichtung. Sie können sie einfach verwenden, um mit wichtigen Features des Speech-Diensts zu experimentieren und zu sehen, wie er für Ihre Anwendungsfälle funktioniert. Innerhalb weniger Minuten können Sie einfache Testworkflows durchführen, wie etwa eine Batch-Spracherkennung aus einem Verzeichnis von Dateien oder eine Sprachsynthese für eine Sammlung von Zeichenfolgen aus einer Datei. Die Speech-Befehlszeilenschnittstelle kann jedoch nicht nur für einfache Workflows genutzt werden. Sie ist produktionsbereit und hochskalierbar, um umfangreichere Prozesse mit automatisierten Batches (.bat) oder Shellskripts auszuführen.

Über die Speech-Befehlszeilenschnittstelle stehen die meisten Features des Speech SDK zur Verfügung, und einige erweiterte Features und Anpassungen sind in der Speech-Befehlszeilenschnittstelle vereinfacht. Bei Ihrer Entscheidung für die Verwendung der Speech CLI oder des Speech SDK können Sie sich an der folgenden Anleitung orientieren.

Verwenden Sie in folgenden Fällen die Speech-Befehlszeilenschnittstelle:

Sie möchten mit minimalem Einrichtungs- und ohne Programmieraufwand mit Features des Speech-Diensts experimentieren.
Sie haben relativ einfache Anforderungen an eine Produktionsanwendung, für die der Speech-Dienst genutzt wird.

Verwenden Sie in folgenden Fällen das Speech SDK:

Sie möchten Funktionen des Speech-Diensts im Rahmen einer bestimmten Sprache oder Plattform (z. B. C#, Python oder C++) integrieren.
Sie haben komplexe Anforderungen, die möglicherweise erweiterte Dienstanforderungen erfordern.
Sie entwickeln benutzerdefiniertes Verhalten, einschließlich Antwortstreaming.

Wichtige Funktionen

Spracherkennung: Konvertieren Sie Sprache aus Audiodateien oder direkt über ein Mikrofon in Text, oder erstellen Sie ein Transkript einer aufgezeichneten Unterhaltung.
Sprachsynthese: Konvertieren Sie Text in Sprache, und verwenden Sie als Eingabe entweder Textdateien oder direkte Befehlszeileneingaben. Passen Sie die Merkmale der Sprachausgabe mit SSML-Konfigurationen (Speech Synthesis Markup Language, Markupsprache für Sprachsynthese) an.
Sprachübersetzung: Übersetzen Sie Audio aus einer Ausgangssprache in Text oder Audio in einer Zielsprache.
Ausführung in Azure-Computeressourcen: Senden Sie Speech CLI-Befehle für die Ausführung in einer Azure-Remotecomputeressource unter Verwendung von spx webjob.

Erste Schritte

Informationen zu den ersten Schritten mit der Speech-Befehlszeilenschnittstelle finden Sie in der Schnellstartanleitung. In diesem Artikel erfahren Sie, wie Sie einige grundlegende Befehle ausführen. Außerdem sind etwas komplexere Befehle zum Ausführen von Batchvorgängen für Spracherkennung und Sprachsynthese enthalten. Nachdem Sie den Artikel zu den Grundlagen gelesen haben, sollten Sie genug von der Syntax verstehen, um mit dem Schreiben einiger benutzerdefinierter Befehle zu beginnen oder einfache Vorgänge des Speech-Diensts zu automatisieren.

Nächste Schritte

Zusätzliche Ressourcen

Dokumentation

Konfigurieren der Sprach-CLI-Ausgabeoptionen: Speech-Dienst - Azure AI services

Hier erfahren Sie, wie Sie Ausgabeoptionen mit der Speech-CLI konfigurieren.
Informationen zum Speech SDK – Spracherkennungsdienst - Azure AI services

Das Speech SDK (Software Development Kit) macht viele der Funktionen des Spracherkennungsdienstes verfügbar und erleichtert Ihnen das Entwickeln sprachaktivierter Anwendungen.
Generieren einer REST-API-Clientbibliothek: Speech-Dienst - Azure AI services

Die Swagger-Dokumentation kann zum automatischen Generieren von SDKs für viele Programmiersprachen verwendet werden.
Übersicht über Speech Studio: Speech-Dienst - Azure AI services

Speech Studio besteht aus einer Reihe von benutzeroberflächenbasierten Tools zum Erstellen und Integrieren von Features aus dem Speech-Dienst in Ihre Anwendungen.
Installieren des Speech SDK - Azure AI services

In dieser Schnellstartanleitung erfahren Sie, wie Sie das Speech SDK für Ihre bevorzugte Programmiersprache installieren.
Worum handelt es sich beim Speech-Dienst? - Azure AI services

Der Speech-Dienst bietet mit einer Azure Ressource Funktionen für die Spracherkennung (Sprache-in-Text), Sprachsynthese (Text-zu-Sprache) und Sprachübersetzung. Über das Speech SDK, das Speech Studio oder REST-APIs können Sie Ihren Anwendungen, Tools und Geräten Sprachfunktionen hinzufügen.
Konfigurieren des Speech-CLI-Datenspeichers: Speech-Dienst - Azure AI services

Hier erfahren Sie, wie Sie den Speech-CLI-Datenspeicher konfigurieren.
Ausführen von Batchvorgängen mit der Speech-Befehlszeilenschnittstelle: Speech-Dienst - Azure AI services

Hier erfahren Sie, wie Sie mithilfe der Speech-Befehlszeilenschnittstelle Batchvorgänge für die Spracherkennung (Sprache-in-Text) und für die Sprachsynthese (Text-zu-Sprache) ausführen.

Schulung

Modul

Erstellen Ihrer ersten Azure KI-Spracherkennungsanwendung - Training

In diesem Modul erfahren Sie, wie Sie Azure KI Services verwenden, um eine Spracherkennungsanwendung zu erstellen.

Zertifizierung

Microsoft Certified: Azure AI Fundamentals - Certifications

Zeigen Sie Ihre Kenntnisse von grundlegenden KI-Konzepten im Zusammenhang mit der Entwicklung von Software und Diensten von Microsoft Azure zum Erstellen von KI-Lösungen.

Ereignisse

Erstellen von KI-Apps und Agents

17. März, 21 Uhr - 21. März, 10 Uhr

Nehmen Sie an der Meetup-Serie teil, um skalierbare KI-Lösungen basierend auf realen Anwendungsfällen mit Mitentwicklern und Experten zu erstellen.

Jetzt registrieren

Teilen über

Worum handelt es sich bei der Speech-Befehlszeilenschnittstelle?

Wichtige Funktionen

Erste Schritte

Nächste Schritte

Feedback

Zusätzliche Ressourcen