Udostępnij za pośrednictwem


Co to jest zestaw SPEECH SDK?

Zestaw SPEECH SDK (software development kit) uwidacznia wiele funkcji usługi Mowa, dzięki czemu można tworzyć aplikacje obsługujące mowę. Zestaw SPEECH SDK jest dostępny w wielu językach programowania i na różnych platformach. Zestaw SPEECH SDK jest idealny zarówno w przypadku scenariuszy czasu rzeczywistego, jak i nie w czasie rzeczywistym, przy użyciu urządzeń lokalnych, plików, usługi Azure Blob Storage oraz strumieni wejściowych i wyjściowych.

W niektórych przypadkach nie można używać zestawu SDK usługi Mowa lub nie należy ich używać. W takich przypadkach możesz użyć interfejsów API REST, aby uzyskać dostęp do usługi Mowa. Na przykład użyj interfejsu API REST zamiany mowy na tekst na potrzeby transkrypcji wsadowej i niestandardowego zarządzania modelami mowy .

Obsługiwane języki

Zestaw SPEECH SDK obsługuje następujące języki i platformy:

Język programowania Odwołanie Obsługa platform
C# 1 .NET Windows, Linux, macOS, Mono, Xamarin.iOS, Xamarin.Mac, Xamarin.Android, UWP, Unity
C++ 2 C++ Windows, Linux, macOS
Przejdź Przejdź Linux
Java Java Android, Windows, Linux, macOS
JavaScript JavaScript Przeglądarka, Node.js
Objective-C Objective-C iOS, macOS
Python Python Windows, Linux, macOS
Swift Objective-C 3 iOS, macOS

1 Przykłady kodu języka C# są dostępne w dokumentacji. Zestaw SPEECH SDK dla języka C# jest oparty na platformie .NET Standard 2.0, więc obsługuje wiele platform i języków programowania. Aby uzyskać więcej informacji, zobacz Obsługa implementacji platformy .NET.
2 C nie jest obsługiwanym językiem programowania dla zestawu SPEECH SDK.
3 Zestaw SPEECH SDK dla języka Swift udostępnia biblioteki klienta i dokumentację referencyjną za pomocą zestawu Speech SDK dla języka Objective-C.

Ważne

Pobierając dowolne zestawy SDK usługi Mowa usługi Azure AI, akceptujesz jego licencję. Aby uzyskać więcej informacji, zobacz:

Pokaz zestawu SDK usługi Mowa

W poniższym wideo pokazano, jak zainstalować zestaw SPEECH SDK dla języka C# i napisać aplikację konsolową platformy .NET na potrzeby zamiany mowy na tekst.

Przykłady kodu

Przykłady kodu zestawu SPEECH SDK są dostępne w dokumentacji i usłudze GitHub.

Przykłady dokumentacji

W górnej części stron dokumentacji, które zawierają przykłady, opcje wyboru obejmują C#, C++, Go, JavaScript, Objective-C, Python lub Swift.

Zrzut ekranu przedstawiający sposób wybierania języka programowania w dokumentacji.

Jeśli przykład nie jest dostępny w preferowanym języku programowania, możesz wybrać inny język programowania, aby rozpocząć pracę i zapoznać się z pojęciami, lub zapoznać się z dokumentacją i przykładami połączonymi od początku artykułu.

Przykłady GitHub

Szczegółowe przykłady są dostępne w repozytorium Azure-Samples/cognitive-services-speech-sdk w witrynie GitHub. Istnieją przykłady dla języka C# (w tym platformy UWP, Unity i Xamarin), C++, Java, JavaScript (w tym Przeglądarka i Node.js), Objective-C, Python i Swift. Przykłady kodu dla języka Go są dostępne w repozytorium Microsoft/cognitive-services-speech-sdk-go w witrynie GitHub.

Opcje pomocy

Fora Microsoft Q&A i Stack Overflow są dostępne dla społeczności deweloperów, aby zadawać i odpowiadać na pytania dotyczące usługi Azure Cognitive Speech i innych usług. Firma Microsoft monitoruje fora i odpowiada na pytania, na które społeczność jeszcze nie odpowiedziała. Aby upewnić się, że widzisz pytanie, oznacz je tagiem "azure-speech".

Możesz zasugerować pomysł lub zgłosić usterkę, tworząc problem w usłudze GitHub:

Zobacz również pomoc techniczną dotyczącą usług sztucznej inteligencji platformy Azure i opcje pomocy, aby uzyskać pomoc techniczną, być na bieżąco, przesyłać opinie i zgłaszać błędy dla usług azure AI.

Następne kroki