Ereignisse
Erstellen von KI-Apps und Agents
17. März, 21 Uhr - 21. März, 10 Uhr
Nehmen Sie an der Meetup-Serie teil, um skalierbare KI-Lösungen basierend auf realen Anwendungsfällen mit Mitentwicklern und Experten zu erstellen.
Jetzt registrierenDieser Browser wird nicht mehr unterstützt.
Führen Sie ein Upgrade auf Microsoft Edge aus, um die neuesten Funktionen, Sicherheitsupdates und technischen Support zu nutzen.
Die Speech-Befehlszeilenschnittstelle ist ein Befehlszeilentool, mit dem der Speech-Dienst verwendet werden kann, ohne Code zu schreiben. Die Speech CLI erfordert eine minimale Einrichtung. Sie können sie einfach verwenden, um mit wichtigen Features des Speech-Diensts zu experimentieren und zu sehen, wie er für Ihre Anwendungsfälle funktioniert. Innerhalb weniger Minuten können Sie einfache Testworkflows durchführen, wie etwa eine Batch-Spracherkennung aus einem Verzeichnis von Dateien oder eine Sprachsynthese für eine Sammlung von Zeichenfolgen aus einer Datei. Die Speech-Befehlszeilenschnittstelle kann jedoch nicht nur für einfache Workflows genutzt werden. Sie ist produktionsbereit und hochskalierbar, um umfangreichere Prozesse mit automatisierten Batches (.bat
) oder Shellskripts auszuführen.
Über die Speech-Befehlszeilenschnittstelle stehen die meisten Features des Speech SDK zur Verfügung, und einige erweiterte Features und Anpassungen sind in der Speech-Befehlszeilenschnittstelle vereinfacht. Bei Ihrer Entscheidung für die Verwendung der Speech CLI oder des Speech SDK können Sie sich an der folgenden Anleitung orientieren.
Verwenden Sie in folgenden Fällen die Speech-Befehlszeilenschnittstelle:
Verwenden Sie in folgenden Fällen das Speech SDK:
Spracherkennung: Konvertieren Sie Sprache aus Audiodateien oder direkt über ein Mikrofon in Text, oder erstellen Sie ein Transkript einer aufgezeichneten Unterhaltung.
Sprachsynthese: Konvertieren Sie Text in Sprache, und verwenden Sie als Eingabe entweder Textdateien oder direkte Befehlszeileneingaben. Passen Sie die Merkmale der Sprachausgabe mit SSML-Konfigurationen (Speech Synthesis Markup Language, Markupsprache für Sprachsynthese) an.
Sprachübersetzung: Übersetzen Sie Audio aus einer Ausgangssprache in Text oder Audio in einer Zielsprache.
Ausführung in Azure-Computeressourcen: Senden Sie Speech CLI-Befehle für die Ausführung in einer Azure-Remotecomputeressource unter Verwendung von spx webjob
.
Informationen zu den ersten Schritten mit der Speech-Befehlszeilenschnittstelle finden Sie in der Schnellstartanleitung. In diesem Artikel erfahren Sie, wie Sie einige grundlegende Befehle ausführen. Außerdem sind etwas komplexere Befehle zum Ausführen von Batchvorgängen für Spracherkennung und Sprachsynthese enthalten. Nachdem Sie den Artikel zu den Grundlagen gelesen haben, sollten Sie genug von der Syntax verstehen, um mit dem Schreiben einiger benutzerdefinierter Befehle zu beginnen oder einfache Vorgänge des Speech-Diensts zu automatisieren.
Ereignisse
Erstellen von KI-Apps und Agents
17. März, 21 Uhr - 21. März, 10 Uhr
Nehmen Sie an der Meetup-Serie teil, um skalierbare KI-Lösungen basierend auf realen Anwendungsfällen mit Mitentwicklern und Experten zu erstellen.
Jetzt registrierenSchulung
Modul
Erstellen Ihrer ersten Azure KI-Spracherkennungsanwendung - Training
In diesem Modul erfahren Sie, wie Sie Azure KI Services verwenden, um eine Spracherkennungsanwendung zu erstellen.
Zertifizierung
Microsoft Certified: Azure AI Fundamentals - Certifications
Zeigen Sie Ihre Kenntnisse von grundlegenden KI-Konzepten im Zusammenhang mit der Entwicklung von Software und Diensten von Microsoft Azure zum Erstellen von KI-Lösungen.
Dokumentation
Konfigurieren der Sprach-CLI-Ausgabeoptionen: Speech-Dienst - Azure AI services
Hier erfahren Sie, wie Sie Ausgabeoptionen mit der Speech-CLI konfigurieren.
Informationen zum Speech SDK – Spracherkennungsdienst - Azure AI services
Das Speech SDK (Software Development Kit) macht viele der Funktionen des Spracherkennungsdienstes verfügbar und erleichtert Ihnen das Entwickeln sprachaktivierter Anwendungen.
Generieren einer REST-API-Clientbibliothek: Speech-Dienst - Azure AI services
Die Swagger-Dokumentation kann zum automatischen Generieren von SDKs für viele Programmiersprachen verwendet werden.