Ereignisse
Erstellen von KI-Apps und Agents
17. März, 21 Uhr - 21. März, 10 Uhr
Nehmen Sie an der Meetup-Serie teil, um skalierbare KI-Lösungen basierend auf realen Anwendungsfällen mit Mitentwicklern und Experten zu erstellen.
Jetzt registrierenDieser Browser wird nicht mehr unterstützt.
Führen Sie ein Upgrade auf Microsoft Edge durch, um die neuesten Features, Sicherheitsupdates und den technischen Support zu nutzen.
Der Speech-Dienst verfügt über eine Swagger-Spezifikation zum Interagieren mit einigen REST-APIs, die zum Importieren von Daten, Erstellen von Modellen, Testen der Modellgenauigkeit, Erstellen von benutzerdefinierten Endpunkten, Einreihen von Batchtranskriptionen in die Warteschlange und Verwalten von Abonnements verwendet werden. Die meisten Vorgänge, die über den Custom Speech-Bereich von Speech Studio verfügbar sind, können mit diesen APIs programmgesteuert durchgeführt werden.
Hinweis
Der Speech-Dienst verfügt über mehrere REST-APIs für die Spracherkennung und die Sprachsynthese.
In der Swagger-Spezifikation sind jedoch nur die Sprachausgabe für DIE REST-API und die benutzerdefinierte VoIP-REST-API dokumentiert. Informationen zu allen anderen REST-APIs der Speech-Dienste finden Sie in den Dokumenten, auf die im vorherigen Abschnitt verwiesen wurde.
Die Swagger-Spezifikation verfügt über Optionen, die Ihnen das schnelle Testen für verschiedene Pfade ermöglichen. Es kann aber auch der Fall sein, dass Code für alle Pfade generiert werden soll, um eine zentrale Bibliothek mit Aufrufen zu erstellen, die als Grundlage für zukünftige Lösungen dienen kann. Nun wird der Prozess zum Generieren einer Python-Bibliothek für die Spracherkennungs-REST-API Version 3.1 beschrieben.
Swagger muss auf die Region Ihrer Speech-Ressource festgelegt werden. Die Region können Sie im Azure-Portal im Bereich Übersicht Ihrer Speech-Ressourceneinstellungen überprüfen. Die vollständige Liste der unterstützten Regionen finden Sie hier.
https://github.com/Azure/azure-rest-api-specs/blob/master/specification/cognitiveservices/data-plane/Speech/SpeechToText/stable/v3.1/speechtotext.json
ein, und wählen Sie OK aus..zip
-Datei auf den Computer heruntergeladen.tar -xf
verwenden, um alles zu extrahieren.pip install path/to/package/python-client
swagger_client
. Überprüfen Sie, ob die Installation erfolgreich war:python -c "import swagger_client"
Sie können die Python-Bibliothek verwenden, die Sie mit den Speech-Dienstbeispielen auf GitHub generiert haben.
Ereignisse
Erstellen von KI-Apps und Agents
17. März, 21 Uhr - 21. März, 10 Uhr
Nehmen Sie an der Meetup-Serie teil, um skalierbare KI-Lösungen basierend auf realen Anwendungsfällen mit Mitentwicklern und Experten zu erstellen.
Jetzt registrierenTraining
Modul
Erstellen Ihrer ersten Azure KI-Spracherkennungsanwendung - Training
In diesem Modul erfahren Sie, wie Sie Azure KI Services verwenden, um eine Spracherkennungsanwendung zu erstellen.
Dokumentation
Installieren des Speech SDK - Azure AI services
In dieser Schnellstartanleitung erfahren Sie, wie Sie das Speech SDK für Ihre bevorzugte Programmiersprache installieren.
Informationen zum Speech SDK – Spracherkennungsdienst - Azure AI services
Das Speech SDK (Software Development Kit) macht viele der Funktionen des Spracherkennungsdienstes verfügbar und erleichtert Ihnen das Entwickeln sprachaktivierter Anwendungen.
Problembehandlung für das Speech SDK – Spracherkennungsdienst - Azure AI services
Dieser Artikel enthält Informationen zur Lösung von Problemen, die bei Verwendung des Spracherkennungs-SDK auftreten können.