Co to jest zestaw SPEECH SDK?

Artykuł
01/22/2024

Zestaw SPEECH SDK (software development kit) uwidacznia wiele funkcji usługi Mowa, dzięki czemu można tworzyć aplikacje obsługujące mowę. Zestaw SPEECH SDK jest dostępny w wielu językach programowania i na różnych platformach. Zestaw SPEECH SDK jest idealny zarówno w przypadku scenariuszy czasu rzeczywistego, jak i nie w czasie rzeczywistym, przy użyciu urządzeń lokalnych, plików, usługi Azure Blob Storage oraz strumieni wejściowych i wyjściowych.

W niektórych przypadkach nie można używać zestawu SDK usługi Mowa lub nie należy ich używać. W takich przypadkach możesz użyć interfejsów API REST, aby uzyskać dostęp do usługi Mowa. Na przykład użyj interfejsu API REST zamiany mowy na tekst na potrzeby transkrypcji wsadowej i niestandardowej mowy.

Obsługiwane języki

Zestaw SPEECH SDK obsługuje następujące języki i platformy:

Język programowania	Odwołanie	Obsługa platform
C#¹	.NET	Windows, Linux, macOS, Mono, Xamarin.iOS, Xamarin.Mac, Xamarin.Android, UWP, Unity
C++²	C++	Windows, Linux, macOS
Przejdź	Przejdź	Linux
Java	Java	Android, Windows, Linux, macOS
JavaScript	JavaScript	Przeglądarka, Node.js
Objective-C	Objective-C	iOS, macOS
Python	Python	Windows, Linux, macOS
Swift	Objective-C³	iOS, macOS

^{1 Przykłady kodu języka C# są dostępne w dokumentacji. Zestaw SPEECH SDK dla języka C# jest oparty na platformie .NET Standard 2.0, więc obsługuje wiele platform i języków programowania. Aby uzyskać więcej informacji, zobacz Obsługa implementacji platformy .NET.}
^{2 C nie jest obsługiwanym językiem programowania dla zestawu SPEECH SDK.}
^{3 Zestaw SPEECH SDK dla języka Swift udostępnia biblioteki klienta i dokumentację referencyjną za pomocą zestawu Speech SDK dla języka Objective-C.}

Ważne

Pobierając dowolne zestawy SDK usługi Mowa usługi Azure AI, akceptujesz jego licencję. Aby uzyskać więcej informacji, zobacz:

Pokaz zestawu SDK usługi Mowa

W poniższym wideo pokazano, jak zainstalować zestaw SPEECH SDK dla języka C# i napisać aplikację konsolową platformy .NET na potrzeby zamiany mowy na tekst.

Przykłady kodu

Przykłady kodu zestawu SPEECH SDK są dostępne w dokumentacji i usłudze GitHub.

Przykłady dokumentacji

W górnej części stron dokumentacji, które zawierają przykłady, opcje wyboru obejmują C#, C++, Go, JavaScript, Objective-C, Python lub Swift.

Screenshot showing how to select a programming language in the documentation.

Jeśli przykład nie jest dostępny w preferowanym języku programowania, możesz wybrać inny język programowania, aby rozpocząć pracę i zapoznać się z pojęciami, lub zapoznać się z dokumentacją i przykładami połączonymi od początku artykułu.

Przykłady GitHub

Szczegółowe przykłady są dostępne w repozytorium Azure-Samples/cognitive-services-speech-sdk w witrynie GitHub. Istnieją przykłady dla języka C# (w tym platformy UWP, Unity i Xamarin), C++, Java, JavaScript (w tym Przeglądarka i Node.js), Objective-C, Python i Swift. Przykłady kodu dla języka Go są dostępne w repozytorium Microsoft/cognitive-services-speech-sdk-go w witrynie GitHub.

Opcje pomocy

Fora Microsoft Q&A i Stack Overflow są dostępne dla społeczności deweloperów, aby zadawać i odpowiadać na pytania dotyczące usługi Azure Cognitive Speech i innych usług. Firma Microsoft monitoruje fora i odpowiada na pytania, na które społeczność jeszcze nie odpowiedziała. Aby upewnić się, że widzisz pytanie, oznacz je tagiem "azure-speech".

Możesz zasugerować pomysł lub zgłosić usterkę, tworząc problem w usłudze GitHub:

Zobacz również pomoc techniczną dotyczącą usług sztucznej inteligencji platformy Azure i opcje pomocy, aby uzyskać pomoc techniczną, być na bieżąco, przesyłać opinie i zgłaszać błędy dla usług azure AI.