快速入門:安裝語音 SDK
本文內容
參考文件 | 套件 (NuGet) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 C# 的 語音 SDK 。
檔中的程式代碼範例是以 C# 8 撰寫,並在 .NET standard 2.0 上執行。
適用於 C# 的語音 SDK 與 Windows、Linux 和 macOS 相容。
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
適用於 C# 的語音 SDK 僅支援 x64、ARM32 (Debian/Ubuntu) 和 ARM64 (Debian/Ubuntu) 架構上的下列散發套件:
Ubuntu 18.04/20.04
Debian 10/11
Red Hat Enterprise Linux (RHEL) 7/8
CentOS 7
重要
使用 Linux 發行版的最新 LTS 版本。 例如,如果您使用Ubuntu 20.04 LTS,請使用最新版的Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統連結庫:
GNU C 連結庫的共享連結庫,包括 POSIX 線程程式設計連結庫 。 libpthreads
OpenSSL 連結庫 (libssl
) 1.x 版和憑證 (ca-certificates
)。
ALSA 應用程式的共享連結庫 (libasound
)。
您也應該安裝 ca-certificates
以建立安全的 Websocket,並避免 WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED
發生錯誤。
重要
語音 SDK 尚未支援 OpenSSL 3.0,這是 Ubuntu 22.04 和 Debian 12 中的預設值。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
若要在 Alpine Linux 中使用語音 SDK,請建立 Debian chroot 環境,如執行 glibc 程式的 Alpine Linux Wiki 中所述。 然後遵循這裡的Debian指示。
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
安裝開發工具與連結庫:
sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget
重要
在 RHEL/CentOS 7 上,遵循如何設定 RHEL/CentOS 7 for Speech SDK 的指示 。
在 RHEL 上,遵循如何設定 Linux OpenSSL 的指示 。
安裝適用於 C 的語音 SDK#
適用於 C# 的語音 SDK 可作為 NuGet 套件,並實作 .NET Standard 2.0。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech 。
您可以使用下列 dotnet add
命令,從 .NET CLI 安裝適用於 C# 的語音 SDK:
dotnet add package Microsoft.CognitiveServices.Speech
您可以使用下列 Install-Package
命令來安裝適用於 C# 的語音 SDK:
Install-Package Microsoft.CognitiveServices.Speech
您可以遵循這些指南以取得更多選項。
本指南說明如何安裝 適用於 .NET Framework (Windows) 控制台應用程式的語音 SDK 。
本指南需要:
建立 Visual Studio 專案並安裝語音 SDK
您必須安裝 語音 SDK NuGet 套件 ,才能在程式碼中參考它。 若要這樣做,您必須先建立 helloworld 專案。 如果您已經有具有 .NET 桌面開發工作負載的專案,您可以使用該專案並跳至使用 NuGet 封裝管理員 安裝語音 SDK 。
建立 helloworld 專案
開啟 Visual Studio。
在 [開始使用] 底下,選取 [建立新專案 ]。
在 [建立新專案 ] 中,選擇 [控制台應用程式][.NET Framework] ,然後選取 [ 下一步 ]。
在 [設定新專案] 中,針對 [項目 名稱 ] 輸入 helloworld ,選擇或建立 [位置] 中的 目錄路徑,然後選取 [建立 ]。
從 Visual Studio 選單欄,選取 [工具 >取得工具和功能 ]。 此步驟 Visual Studio 安裝程式 開啟,並顯示 [修改] 對話框。
檢查 .NET 桌面開發工作負載是否 可用。 如果未安裝工作負載,請加以選取,然後選取 [修改 ] 以開始安裝。 下載並安裝可能需要幾分鐘的時間。
如果 已選取 .NET 桌面開發 ,請選取 [關閉 ] 以關閉對話框。
關閉 Visual Studio 安裝程式。
使用 NuGet 封裝管理員 安裝語音 SDK
在 方案總管 中,以滑鼠右鍵按兩下 helloworld 專案,然後選取 [管理 NuGet 套件 ] 以顯示 NuGet 封裝管理員。
在右上角尋找 [ 套件來源 ] 下拉式方塊,並確定 已選取 nuget.org 。
在左上角,選取 [ 瀏覽 ]。
在搜尋方塊中,輸入 Microsoft.CognitiveServices.Speech ,然後選取 Enter 。
從搜尋結果中,選取 Microsoft.CognitiveServices.Speech 套件,然後選取 [ 安裝 ] 以安裝最新的穩定版本。
接受所有合約和授權以開始安裝。
安裝套件之後,確認會出現在 [控制台] 視窗中 封裝管理員 。
選擇目標架構
若要建置並執行主控台應用程式,請建立符合您電腦架構的平台組態。
從功能表中,選取 [建 >置組態管理員]。 [組態管理員] 對話方塊隨即出現。
在 [作用中 解決方案平臺] 下拉式方塊中,選取 [ 新增 ]。 [新增方案平台] 對話方塊隨即出現。
在 [ 輸入或選取新的平臺 ] 下拉式方塊中:
如果您正在執行 64 位 Windows,請選取 x64 。
如果您正在執行 32 位 Windows,請選取 [x86 ]。
選取 [確定],然後選取 [關閉 ]。
本指南說明如何安裝 適用於 .NET Core 控制台應用程式的語音 SDK 。 .NET Core 是實作 .NET Standard 規格的開放原始碼跨平臺 .NET 平臺。
本指南需要:
建立 Visual Studio 專案並安裝語音 SDK
啟動 Visual Studio 2017。
請確定 .NET 跨平台開發 工作負載可供使用。 從 Visual Studio 選單欄選取 [工具> 取得工具和功能 ],以開啟 Visual Studio 安裝程式。 如果已啟用此工作負載,請關閉對話方塊。
否則,請選取 [.NET Core 跨平台開發 ],然後選取 [ 修改 ]。 安裝新功能需要一些時間。
在 [ 新增專案 ] 對話框中建立新的 Visual C# .NET Core 控制台應用程式。 從左窗格中,展開 [已安裝 >的 Visual C#> .NET Core]。 然後選取 [控制台應用程式] [.NET Core]。 針對專案名稱,輸入 helloworld 。
安裝和參考 語音 SDK NuGet 套件 。 在 方案總管 中,以滑鼠右鍵按兩下解決方案,然後選取 [管理方案的 NuGet 套件]。
選取 [瀏覽 ],然後在右上角,針對 [套件來源 ] 選取 [nuget.org ]。
搜尋 Microsoft.CognitiveServices.Speech 套件,並將其安裝至 helloworld 專案。
接受顯示的授權,開始安裝 NuGet 套件。
安裝套件之後,確認會出現在 封裝管理員 控制台中 。
本指南說明如何安裝適用於 Unity 的語音 SDK 。
針對 Unity 開發,語音 SDK 支援 Windows Desktop(x86 和 x64)或 通用 Windows 平台 (x86、x64、ARM/ARM64)、Android (x86、ARM32/64)、iOS (x64 模擬器和 ARM64)和 Mac (x64)。
必要條件
本指南需要:
安裝適用於 Unity 的語音 SDK
若要安裝適用於 Unity 的語音 SDK,請遵循下列步驟:
下載並開啟適用於 Unity 的 語音 SDK。 SDK 會封裝為 Unity 資產套件 (.unitypackage ),且應該已經與 Unity 相關聯。 當資產套件開啟時, [匯入 Unity 套件 ] 對話框隨即出現。 您可能需要建立並開啟空白專案,此步驟才能運作。
確定已選取所有檔案,然後選取 [ 匯入 ]。 幾分鐘后,Unity 資產套件會匯入您的專案。
如需將資產套件匯入 Unity 的詳細資訊,請參閱 Unity 檔 。
本指南說明如何建立 通用 Windows 平台 (UWP) 專案,並安裝適用於 C# 的語音 SDK 。 通用 Windows 平台 可讓您開發可在支援 Windows 10 的任何裝置上執行的應用程式,包括計算機、Xbox、Surface Hub 和其他裝置。
本指南需要:
建立 Visual Studio 專案並安裝語音 SDK
若要建立適用於 UWP 開發的 Visual Studio 專案,您需要:
設定 Visual Studio 開發選項。
建立項目並選取目標架構。
設定音訊擷取。
安裝語音 SDK。
設定 Visual Studio 開發選項
請確定您已在 Visual Studio 中正確設定 UWP 開發:
開啟 Visual Studio 以顯示開始視窗。
選取 [ 繼續但不執行程序代碼 ] 以移至 Visual Studio IDE。
從 Visual Studio 選單欄中,選取 [工具> 取得工具和功能 ] 以開啟 Visual Studio 安裝程式 並檢視 [修改] 對話方塊。
在 [工作負載] 索引 標籤上,尋找 通用 Windows 平台 開發 工作負載。 如果已選取該工作負載,請關閉 [修改] 對話框並關閉 Visual Studio 安裝程式。 略過此程序的其餘部分。
選取 [通用 Windows 平台 開發 ],然後選取 [修改 ]。
在 [ 開始之前] 對話框中,選取 [ 繼續 ] 以安裝 UWP 開發工作負載。 安裝新功能可能需要一些時間。
關閉 Visual Studio 安裝程式。
建立專案
接下來,建立您的項目並選取目標架構:
在 Visual Studio 選單欄上,選取 [檔案 >新> 專案 ] 以顯示 [建立新專案 ] 視窗。
尋找並選取 [空白應用程式] [通用 Windows]。 請確定您選取此項目類型的 C# 版本,而不是 Visual Basic。
選取 [下一步]。
在 [設定新專案] 對話框的 [項目 名稱] 中 ,輸入 helloworld 。
在 [位置] 中,移至並選取或建立您要儲存項目的資料夾。
選取 建立 。
在 [新增 通用 Windows 平台 專案 ] 視窗中,選取 [最低版本 ] (第二個下拉式方塊),選取 [Windows 10 Fall Creators Update] (10.0;組建 16299) 。 該需求是語音 SDK 的最低需求。
在 [目標版本 ][第一個] 下拉式方塊中,選擇與 [最低版本] 中的值相同或更新版本的值 。
選取 [確定]。 您會返回 Visual Studio IDE,並在 [方案總管] 窗格中建立並顯示 新專案。
選取您的目標平台架構。 在 Visual Studio 工具列上,尋找 [ 方案平臺] 下拉式方塊。 如果您沒有看到,請選取 [檢視 >工具列> 標準 ] 以顯示包含解決方案平臺的 工具列。
如果您正在執行 64 位 Windows,請在下拉式方塊中選取 x64 。 64 位 Windows 也可以執行 32 位應用程式,因此您可以視需要選擇 x86 。
注意
語音 SDK 支援所有 Intel 相容的處理器,但 只支援 x64 版本的 ARM 處理器。
設定音訊擷取
允許項目擷取音訊輸入:
在 方案總管 中,選取 [Package.appxmanifest ] 以開啟封裝應用程式指令清單。
選取 [功能] 索引 標籤,然後選取 [麥克風 ] 功能。
從功能表欄,選取 [檔案 >儲存 Package.appxmanifest ] 以儲存變更。
安裝適用於UWP的語音SDK
最後,安裝 語音 SDK NuGet 套件 ,並參考專案中的語音 SDK:
在 方案總管 中,以滑鼠右鍵按兩下您的解決方案,然後選取 [管理方案的 NuGet 套件] 以移至 [NuGet - 方案 ] 視窗。
選取瀏覽 。 在 [套件來源 ] 中,選取 [nuget.org ]。
在 [ 搜尋 ] 方塊中,輸入 Microsoft.CognitiveServices.Speech 。 在搜尋結果中顯示套件之後,請選擇該套件。
在搜尋結果旁邊的套件狀態窗格中,選取 helloworld 專案。
選取 [安裝]。
在 [ 預覽變更 ] 對話框中,選取 [ 套用 ]。
在 [ 授權接受 ] 對話框中,檢視授權,然後選取 [ 我接受 ]。 套件安裝隨即開始。
安裝完成時,[ 輸出 ] 窗格會顯示類似下列文字的訊息: Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld
。
本指南說明如何建立 Xamarin 窗體專案並安裝 語音 SDK 。 Xamarin 是一個開放原始碼平臺,可使用 .NET 建置適用於 iOS、Android 和 Windows 的新式和高效能應用程式。
針對 Xamarin 開發,語音 SDK 支援:
Windows Desktop x86 和 x64
通用 Windows 平台 x86、x64、ARM/ARM64
Android x86、ARM32/64
iOS x64 模擬器和ARM64
本指南需要:
建立 Visual Studio 專案並安裝語音 SDK
若要使用 .NET 和 Xamarin 建立適用於跨平臺行動應用程式開發的 Visual Studio 專案,您需要:
設定 Visual Studio 開發選項。
建立項目並選取目標架構。
安裝語音 SDK。
設定 Visual Studio 開發選項
請確定您已在 Visual Studio 中正確設定,以使用 .NET 進行跨平臺行動裝置開發:
開啟 Visual Studio 2019。 然後選取 [ 不使用程式代碼 繼續]。
從 Visual Studio 選單中,選取 [工具> 取得工具和功能 ] 以開啟 Visual Studio 安裝程式 並檢視 [修改] 對話方塊。
在 [ 工作負載] 索引 標籤上 ,尋找 [使用 .NET 進行行動裝置開發] 工作負載。 如果已選取該工作負載,請關閉 [修改] 對話框並關閉 Visual Studio 安裝程式。 略過此程序的其餘部分。
選取 [使用 .NET 進行行動裝置開發],然後選取 [ 修改 ]。
在 [ 開始之前] 對話框中,選取 [繼續 ] 以安裝使用 .NET 進行行動裝置開發的工作負載。 安裝新功能可能需要一些時間。
關閉 Visual Studio 安裝程式。
建立專案
接下來,建立您的項目並選取目標架構:
在 Visual Studio 選單欄上,選取 [檔案 >新> 專案 ] 以顯示 [建立新專案 ] 視窗。
尋找並選取 [行動應用程式] [Xamarin.Forms]。
選取 [下一步]。
在 [設定新專案] 對話框的 [項目 名稱] 中 ,輸入 helloworld 。
在 [位置] 中,移至並選取或建立您要儲存項目的資料夾。
選取 建立 。
在 [新增跨平臺應用程式 ] 視窗中,選取 [空白 ] 範本,然後選取 [Android ]、[iOS ] 和 [Windows][UWP]。 選取 建立 。
選取 [確定]。 您會返回 Visual Studio IDE,並在 [方案總管] 窗格中建立並顯示 新專案。
選取您的目標平台架構和啟動專案。 在 Visual Studio 工具列上,尋找 [ 方案平臺] 下拉式方塊。 如果您沒有看到,請選取 [檢視 >工具列> 標準 ] 以顯示包含解決方案平臺的 工具列。
如果您正在執行 64 位 Windows,請在下拉式方塊中選取 x64 。 如果您想要的話,您可以選取 x86 ,因為 64 位 Windows 也可以執行 32 位應用程式。
在 [ 啟動專案 ] 下拉式方塊中,選取 helloworld。UWP (通用 Windows) 。
安裝適用於 Xamarin 的語音 SDK
安裝語音 SDK NuGet 套件 ,並參考專案中的語音 SDK:
在 方案總管 中,以滑鼠右鍵按兩下您的解決方案。 選取 [管理方案的 NuGet 套件] 以移至 [NuGet - 方案] 視窗。
選取瀏覽 。
在 [套件來源 ] 中,選取 [nuget.org ]。
在 [ 搜尋 ] 方塊中,輸入 Microsoft.CognitiveServices.Speech 。 然後在搜尋結果中出現后選取該套件。
注意
Microsoft.CognitiveServices.Speech NuGet 內的 iOS 連結庫未啟用位碼。 如果您需要為應用程式啟用 Bitcode 連結庫,請特別針對 iOS 專案使用 Microsoft.CognitiveServices.Speech.Xamarin.iOS NuGet。
在搜尋結果旁邊的套件狀態窗格中,選取所有專案。
選取 [安裝]。
在 [ 預覽變更 ] 對話框中,選取 [ 確定 ]。
在 [ 授權接受 ] 對話框中,檢視授權,然後選取 [ 我接受 ]。 安裝所有項目的語音 SDK 套件參考。
安裝順利完成之後,您可能會看到 helloworld.iOS 的下列警告 。 此警告是已知問題,不應該影響您應用程式的功能。
Could not resolve reference "C:\Users\Default\.nuget\packages\microsoft.cognitiveservices.speech\1.7.0\build\Xamarin.iOS\libMicrosoft.CognitiveServices.Speech.core.a". If this reference is required by your code, you may get compilation errors.
現在已安裝語音 SDK。 您現在可以刪除或重複使用 您在先前步驟中建立的 helloworld 專案。
參考文件 | 套件 (NuGet) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 C++ 的 語音 SDK 。
適用於 C++ 的語音 SDK 與 Windows、Linux 和 macOS 相容。
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
適用於 C++ 的語音 SDK 僅支援 x86 (Debian/Ubuntu)、x64、ARM32 (Debian/Ubuntu) 和 ARM64 (Debian/Ubuntu) 架構上的下列散發套件:
Ubuntu 18.04/20.04
Debian 10/11
Red Hat Enterprise Linux (RHEL) 7/8
CentOS 7
重要
使用 Linux 發行版的最新 LTS 版本。 例如,如果您使用Ubuntu 20.04 LTS,請使用最新版的Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統連結庫:
GNU C 連結庫的共享連結庫,包括 POSIX 線程程式設計連結庫 。 libpthreads
OpenSSL 連結庫 (libssl
) 1.x 版和憑證 (ca-certificates
)。
ALSA 應用程式的共享連結庫 (libasound
)。
您也應該安裝 ca-certificates
以建立安全的 Websocket,並避免 WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED
發生錯誤。
重要
語音 SDK 尚未支援 OpenSSL 3.0,這是 Ubuntu 22.04 和 Debian 12 中的預設值。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
若要在 Alpine Linux 中使用語音 SDK,請建立 Debian chroot 環境,如執行 glibc 程式的 Alpine Linux Wiki 中所述。 然後遵循這裡的Debian指示。
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
安裝開發工具與連結庫:
sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget
重要
在 RHEL/CentOS 7 上,遵循如何設定 RHEL/CentOS 7 for Speech SDK 的指示 。
在 RHEL 上,遵循如何設定 Linux OpenSSL 的指示 。
安裝適用於 C++ 的語音 SDK
適用於 C++ 的語音 SDK 可作為 NuGet 套件。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech 。
您可以使用下列 dotnet add
命令,從 .NET CLI 安裝適用於 C++ 的語音 SDK:
dotnet add package Microsoft.CognitiveServices.Speech
您可以使用下列 Install-Package
命令來安裝適用於 C++ 的語音 SDK:
Install-Package Microsoft.CognitiveServices.Speech
您可以遵循這些指南以取得更多選項。
本指南說明如何安裝適用於Linux的 語音SDK 。
使用下列程式來下載並安裝 SDK。 這些步驟包括 將必要的連結庫和頭文件 下載為 .tar 檔案。
選擇語音 SDK 檔案的目錄。 將 SPEECHSDK_ROOT
環境變數設定為指向該目錄。 此變數可讓您輕鬆地在未來命令中參考目錄。
若要在主目錄中使用目錄 speechsdk ,請執行下列命令:
export SPEECHSDK_ROOT="$HOME/speechsdk"
如果目錄不存在,請建立目錄:
mkdir -p "$SPEECHSDK_ROOT"
下載並解壓縮 包含語音 SDK 二進位檔的 .tar.gz封存:
wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
驗證擷取套件的最上層目錄內容:
ls -l "$SPEECHSDK_ROOT"
目錄清單應包含合作夥伴通知和授權檔案。 清單也應該包含包含保存標頭 (.h ) 檔案的目錄 ,以及保存arm32、arm64、x64和 x86 連結庫的 lib 目錄。
路徑
描述
license.md
授權
ThirdPartyNotices.md
合作夥伴通知
REDIST.txt
轉散發通知
include
C++ 的必要頭檔
lib/arm32
連結應用程式所需的 ARM32 原生連結庫
lib/arm64
連結應用程式所需的 ARM64 原生連結庫
lib/x64
連結應用程式所需的 x64 原生連結庫
lib/x86
連結應用程式所需的 x86 原生連結庫
本指南說明如何在 macOS 10.14 或更新版本上安裝適用於 C++ 的 語音 SDK 。 這些步驟包括將必要的連結 庫和頭文件 下載為 .zip 檔案。
選擇語音 SDK 檔案的目錄。 將 SPEECHSDK_ROOT
環境變數設定為指向該目錄。 此變數可讓您輕鬆地在未來命令中參考目錄。
若要在主目錄中使用目錄 speechsdk ,請執行下列命令:
export SPEECHSDK_ROOT="$HOME/speechsdk"
如果目錄不存在,請建立目錄:
mkdir -p "$SPEECHSDK_ROOT"
下載並擷取 包含語音 SDK XCFramework 的 .zip封存:
wget -O SpeechSDK-macOS.zip https://aka.ms/csspeech/macosbinary
unzip SpeechSDK-macOS.zip -d "$SPEECHSDK_ROOT"
驗證擷取套件的最上層目錄內容:
ls -l "$SPEECHSDK_ROOT"
目錄清單應包含合作夥伴通知、授權檔案和 MicrosoftCognitiveServicesSpeech.xcframework 目錄。
本指南說明如何在 Windows 桌面作業系統上安裝適用於 C++ 的 語音 SDK 。
此設定指南需要:
在 Visual Studio 中建立專案並安裝語音 SDK
若要建立適用於 C++ 桌面開發的 Visual Studio 專案,您需要:
設定 Visual Studio 開發選項。
建立專案。
選取目標架構。
安裝語音 SDK。
設定 Visual Studio 開發選項
若要開始,請確定您已在 Visual Studio 中正確設定 C++ 桌面開發:
開啟 Visual Studio 2019 以顯示開始視窗。
選取 [ 繼續但不執行程序代碼 ] 以移至 Visual Studio IDE。
從 Visual Studio 選單欄中,選取 [工具> 取得工具和功能 ] 以開啟 Visual Studio 安裝程式 並檢視 [修改] 對話方塊。
在 [工作負載] 索引 卷標的 [Windows] 底下 ,尋找使用 C++ 進行桌面開發工作負載。 如果尚未選取該工作負載,請加以選取。
在 [ 個別元件 ] 索引標籤上,尋找 NuGet 套件管理員 。 如果尚未選取,請選取它。
選取 [關閉 ] 或 [修改 ]。 按鈕名稱會根據您是否選取任何安裝功能而有所不同。
如果您選取 [ 修改 ],就會開始安裝。 此程式可能需要一些時間。
關閉 Visual Studio 安裝程式。
建立專案
接下來,建立您的項目並選取目標架構:
從 Visual Studio 選單中,選取 [檔案 >新> 專案 ] 以顯示 [建立新專案 ] 視窗。
尋找並選取 [主控台應用程式 ]。 請確定您選取此項目類型的 C++ 版本,而不是 C# 或 Visual Basic。
選取 [下一步]。
在 [設定新專案] 對話框的 [項目 名稱] 中 ,輸入 helloworld 。
在 [位置] 中,移至 並選取或建立您要儲存專案的資料夾,然後選取 [ 建立 ]。
選取您的目標平台架構。 在 Visual Studio 工具列上,尋找 [ 方案平臺] 下拉式方塊。 如果您沒有看到,請選取 [檢視 >工具列> 標準 ] 以顯示包含解決方案平臺的 工具列。
如果您正在執行 64 位 Windows,請在下拉式方塊中選取 x64 。 64 位 Windows 也可以執行 32 位應用程式,因此您可以視需要選擇 x86 。
使用 Visual Studio 安裝語音 SDK
最後,安裝 語音 SDK NuGet 套件 ,並參考專案中的語音 SDK:
在 [方案總管] 中,以滑鼠右鍵按兩下您的解決方案,然後選取 [管理方案的 NuGet 套件] 以移至 [NuGet - 方案 ] 視窗。
選取瀏覽 。
在 [套件來源 ] 中,選取 [nuget.org ]。
在 [ 搜尋 ] 方塊中,輸入 Microsoft.CognitiveServices.Speech 。 在搜尋結果中顯示套件之後,請選擇該套件。
在搜尋結果旁邊的套件狀態窗格中,選取 helloworld 專案。
選取 [安裝]。
在 [ 預覽變更 ] 對話框中,選取 [ 確定 ]。
在 [ 授權接受 ] 對話框中,檢視授權,然後選取 [ 我接受 ]。 套件安裝隨即開始。 安裝完成時,[ 輸出 ] 窗格會顯示類似下列文字的訊息: Successfully installed 'Microsoft.CognitiveServices.Speech 1.15.0' to helloworld
。
參考文件 | 套件 (Go) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Go 的 語音 SDK 。
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
適用於 Go 的語音 SDK 支援 x64 架構上的下列散發套件:
Ubuntu 18.04/20.04
Debian 9/10/11
Red Hat Enterprise Linux (RHEL) 8
CentOS 7
重要
使用 Linux 發行版的最新 LTS 版本。 例如,如果您使用Ubuntu 20.04 LTS,請使用最新版的Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統連結庫:
GNU C 連結庫的共享連結庫,包括 POSIX 線程程式設計連結庫 。 libpthreads
OpenSSL 連結庫 (libssl
) 1.x 版和憑證 (ca-certificates
)。
ALSA 應用程式的共享連結庫 (libasound
)。
您也應該安裝 ca-certificates
以建立安全的 Websocket,並避免 WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED
發生錯誤。
重要
語音 SDK 尚未支援 OpenSSL 3.0,這是 Ubuntu 22.04 和 Debian 12 中的預設值。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
若要在 Alpine Linux 中使用語音 SDK,請建立 Debian chroot 環境,如執行 glibc 程式的 Alpine Linux Wiki 中所述。 然後遵循這裡的Debian指示。
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
安裝開發工具與連結庫:
sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget
重要
在 RHEL/CentOS 7 上,遵循如何設定 RHEL/CentOS 7 for Speech SDK 的指示 。
在 RHEL 上,遵循如何設定 Linux OpenSSL 的指示 。
安裝 Go 二進位版本 1.13 或更新版本 。
安裝適用於 Go 的語音 SDK
使用下列程式來下載並安裝 SDK。 這些步驟包括 將必要的連結庫和頭文件 下載為 .tar 檔案。
選擇語音 SDK 檔案的目錄。 將 SPEECHSDK_ROOT
環境變數設定為指向該目錄。 此變數可讓您輕鬆地在未來命令中參考目錄。
若要在主目錄中使用目錄 speechsdk ,請執行下列命令:
export SPEECHSDK_ROOT="$HOME/speechsdk"
如果目錄不存在,請建立目錄:
mkdir -p "$SPEECHSDK_ROOT"
下載並解壓縮 包含語音 SDK 二進位檔的 .tar.gz封存:
wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
驗證擷取套件的最上層目錄內容:
ls -l "$SPEECHSDK_ROOT"
目錄清單應包含合作夥伴通知和授權檔案。 清單也應該包含包含保存標頭 (.h ) 檔案的目錄 ,以及保存arm32、arm64、x64和 x86 連結庫的 lib 目錄。
路徑
描述
license.md
授權
ThirdPartyNotices.md
合作夥伴通知
REDIST.txt
轉散發通知
include
C++ 的必要頭檔
lib/arm32
連結應用程式所需的 ARM32 原生連結庫
lib/arm64
連結應用程式所需的 ARM64 原生連結庫
lib/x64
連結應用程式所需的 x64 原生連結庫
lib/x86
連結應用程式所需的 x86 原生連結庫
下列步驟可讓您的 Go 環境尋找語音 SDK。
因為系結依賴 cgo
,所以您必須設定環境變數,讓 Go 可以找到 SDK。
export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
重要
<architecture>
取代為 CPU 的處理器架構:x86
、x64
、 arm32
或 arm64
。
若要執行應用程式和 SDK,您必須告訴作業系統在哪裡尋找連結庫。
export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
重要
<architecture>
取代為 CPU 的處理器架構:x86
、x64
、 arm32
或 arm64
。
參考文件 | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Java 的 語音 SDK 。
選擇您的目標環境:
適用於 Java 的語音 SDK 與 Windows、Linux 和 macOS 相容。
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
適用於 Java 的語音 SDK 支援 x64、ARM32 (Debian/Ubuntu) 和 ARM64 (Debian/Ubuntu) 架構上的下列散發套件:
Ubuntu 18.04/20.04
Debian 10/11
Red Hat Enterprise Linux (RHEL) 7/8
CentOS 7
重要
使用 Linux 發行版的最新 LTS 版本。 例如,如果您使用Ubuntu 20.04 LTS,請使用最新版的Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統連結庫:
GNU C 連結庫的共享連結庫,包括 POSIX 線程程式設計連結庫 。 libpthreads
OpenSSL 連結庫 (libssl
) 1.x 版和憑證 (ca-certificates
)。
ALSA 應用程式的共享連結庫 (libasound
)。
您也應該安裝 ca-certificates
以建立安全的 Websocket,並避免 WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED
發生錯誤。
重要
語音 SDK 尚未支援 OpenSSL 3.0,這是 Ubuntu 22.04 和 Debian 12 中的預設值。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
若要在 Alpine Linux 中使用語音 SDK,請建立 Debian chroot 環境,如執行 glibc 程式的 Alpine Linux Wiki 中所述。 然後遵循這裡的Debian指示。
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
安裝開發工具與連結庫:
sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget
重要
在 RHEL/CentOS 7 上,遵循如何設定 RHEL/CentOS 7 for Speech SDK 的指示 。
在 RHEL 上,遵循如何設定 Linux OpenSSL 的指示 。
語音 SDK 與具有 32/64 位 ARM 處理器和 Intel x86/x64 相容處理器的 Android 裝置相容。
安裝 Java 開發工具組,例如 Azul Zulu OpenJDK 。 OpenJDK 的 Microsoft Build 或您慣用的 JDK 也應該運作。
安裝適用於 Java 的語音 SDK
某些指示會使用特定的 SDK 版本, 例如 1.24.2
。 若要檢查最新版本, 請搜尋我們的 GitHub 存放庫 。
選擇您的目標環境:
本指南說明如何在 Java 執行時間上安裝適用於 Java 的語音 SDK 。
受支援的作業系統
適用於 Java 的語音 SDK 套件適用於下列作業系統:
請遵循下列步驟,使用 Apache Maven 安裝適用於 Java 的語音 SDK:
安裝 Apache Maven 。
開啟您想要新專案的命令提示字元,然後建立新的 pom.xml 檔案。
將下列 XML 內容複製到 pom.xml :
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
<artifactId>quickstart-eclipse</artifactId>
<version>1.0.0-SNAPSHOT</version>
<build>
<sourceDirectory>src</sourceDirectory>
<plugins>
<plugin>
<artifactId>maven-compiler-plugin</artifactId>
<version>3.7.0</version>
<configuration>
<source>1.8</source>
<target>1.8</target>
</configuration>
</plugin>
</plugins>
</build>
<dependencies>
<dependency>
<groupId>com.microsoft.cognitiveservices.speech</groupId>
<artifactId>client-sdk</artifactId>
<version>1.37.0</version>
</dependency>
</dependencies>
</project>
執行下列 Maven 命令來安裝語音 SDK 和相依性。
mvn clean dependency:copy-dependencies
建立 Eclipse 專案並安裝語音 SDK
安裝 Eclipse Java IDE 。 此 IDE 需要已安裝 Java。
啟動 Eclipse。
在 Eclipse Launcher 的 [工作區 ] 方塊中,輸入新工作區目錄的名稱。 然後選取 [ 啟動 ]。
在片刻中,Eclipse IDE 的主視窗隨即出現。 如果出現歡迎 畫面,請關閉畫面。
從 Eclipse 功能表中,選取 [ 檔案 >新 >專案 ]。
[新增專案 ] 對話方塊隨即出現。 選取 [Java 專案 ],然後選取 [ 下一步 ]。
[新增 Java 專案精靈] 隨即 啟動。 在 [ 項目名稱] 欄位中,輸入 快速入門 。 選擇 [JavaSE-1.8 ] 作為執行環境。 選取 [完成 ]。
如果 [開啟相關聯的檢視方塊?] 窗口出現,請選取 [開啟檢視方塊 ]。
在 [套件總管] 中 ,以滑鼠右鍵按兩下 快速入門 專案。 從操作功能表中選取 [設定 >轉換為 Maven 專案]。
[ 建立新的 POM ] 視窗隨即出現。 在 [ 群組標識符 ] 字段中,輸入 com.microsoft.cognitiveservices.speech.samples 。 在 [ 成品標識符 ] 字段中,輸入 快速入門 。 然後選取 [完成] 。
開啟pom.xml 檔案並加以編輯:
在檔案末端的結尾標記 </project>
之前新增 dependencies
元素,並使用語音 SDK 作為相依性:
<dependencies>
<dependency>
<groupId>com.microsoft.cognitiveservices.speech</groupId>
<artifactId>client-sdk</artifactId>
<version>1.37.0</version>
</dependency>
</dependencies>
儲存變更。
Gradle 組態
Gradle 組態需要明確參考 .jar 相依性延伸模組:
// build.gradle
dependencies {
implementation group: 'com.microsoft.cognitiveservices.speech', name: 'client-sdk', version: "1.37.0", ext: "jar"
}
本指南說明如何在 Android 上安裝適用於 Java 的 語音 SDK 。
適用於 Android 的語音 SDK 會封裝為 Android 封存 (AAR) 檔案 ,其中包含必要的連結庫和必要的 Android 許可權。
使用 Android Studio 安裝語音 SDK
在 Android Studio 中建立新專案,並將適用於 Java 的語音 SDK 新增為連結庫相依性。 此設定是以語音 SDK Maven 套件和 Android Studio Chipmunk 2021.2.1 為基礎。
建立空白專案
開啟 Android Studio,然後選取 [ 新增專案 ]。
在出現的 [新增專案 ] 視窗中,選取 [電話] 和 [平板計算機 >空白活動 ],然後選取 [下一步 ]。
在 [名稱 ] 文本框中輸入 SpeechQuickstart 。
在 [套件名稱 ] 文本框中輸入 samples.speech.cognitiveservices.microsoft.com 。
在 [ 儲存位置 ] 選取方塊中選取項目目錄。
在 [語言] 選取方塊中選取 [Java ]。
在 [最低 API 層級] 選取方塊中 ,選取 [API 23:Android 6.0(Marshmallow] 。
選取 [完成 ]。
Android Studio 需要一些時間來準備您的新專案。 第一次使用 Android Studio 時,可能需要幾分鐘的時間才能設定喜好設定、接受授權,以及完成精靈。
在 Android 上安裝適用於 Java 的語音 SDK
將語音 SDK 新增為專案中的相依性。
選取 [檔案> 項目結構 >相依性> ] 應用程式。
選取加號 (+ ) 以在 [宣告的相依性] 底下 新增相依性 。 然後從下拉功能表中選取 [ 連結庫相依性 ]。
在出現的 [ 新增連結庫相依性 ] 視窗中,輸入適用於Java的語音 SDK 名稱和版本: com.microsoft.cognitiveservices.speech:client-sdk:1.37.0 。 然後選取 [ 搜尋 ]。
請確定選取 的群組標識符 為 com.microsoft.cognitiveservices.speech ,然後選取 [ 確定 ]。
選取 [ 確定 ] 以關閉 [ 項目結構] 視窗,並將變更套用至專案。
參考文件 | 套件 (npm) | GitHub 上的其他範例 | 程式庫原始程式碼
在本快速入門中,您會安裝適用於 JavaScript 的 語音 SDK 。
適用於 JavaScript 的語音 SDK 可作為 npm 套件。 請參閱 microsoft-cognitiveservices-speech-sdk 及其隨附 GitHub 存放庫 cognitive-services-speech-sdk-js 。
瞭解Node.js與用戶端網頁瀏覽器之間的架構影響。 例如, 檔案物件模型 (DOM) 不適用於伺服器端應用程式。 用戶端應用程式 無法使用Node.js檔案系統 。
安裝適用於 JavaScript 的語音 SDK
視目標環境而定,請使用下列其中一個指南:
本指南說明如何安裝適用於 JavaScript 的 語音 SDK ,以搭配Node.js使用。
安裝 Node.js 。
建立新的目錄、執行 npm init
,並逐步解說提示。
若要安裝適用於 JavaScript 的語音 SDK,請執行下列 npm install
命令:
npm install microsoft-cognitiveservices-speech-sdk
如需詳細資訊,請參閱 Node.js範例 。
本指南說明如何安裝適用於 JavaScript 的 語音 SDK ,以搭配網頁使用。
將資料夾解壓縮
建立新的空白資料夾。 如果您想要在網頁伺服器上裝載範例,請確定網頁伺服器可以存取資料夾。
將語音 SDK 下載為 .zip套件 ,並將它解壓縮到新建立的資料夾。 這些檔案已解除封裝:
microsoft.cognitiveservices.speech.sdk.bundle.js:人類可讀取的語音 SDK 版本。
microsoft.cognitiveservices.speech.sdk.bundle.js.map :用來偵錯 SDK 程式代碼的對應檔案。
microsoft.cognitiveservices.speech.sdk.bundle.d.ts:與 TypeScript 搭配使用的物件定義。
microsoft.cognitiveservices.speech.sdk.bundle-min.js:語音 SDK 的縮化版本。
speech-processor.js:程序代碼可改善某些瀏覽器的效能。
在資料夾中建立名為 index.html 的新檔案,並使用文字編輯器開啟此檔案。
HTML 文本標記
從適用於 JavaScript 的 語音 SDK 下載並擷取 microsoft.cognitiveservices.speech.sdk.bundle.js檔案。 將它放在 HTML 檔案可以存取的資料夾中。
<script src="microsoft.cognitiveservices.speech.sdk.bundle.js"></script>;
提示
如果您要以網頁瀏覽器為目標並使用 <script>
標籤,則不需要前置 sdk
詞。 前置 sdk
詞是用來命名模組的 require
別名。
或者,您可以直接在 HTML <head>
元素中包含標記<script>
,並依賴 JSDelivr 。
<script src="https://cdn.jsdelivr.net/npm/microsoft-cognitiveservices-speech-sdk@latest/distrib/browser/microsoft.cognitiveservices.speech.sdk.bundle-min.js">
</script>
如需詳細資訊,請參閱 瀏覽器型範例 。
使用語音 SDK
如需 的詳細資訊 import
,請參閱 在 JavaScript 網站上匯出和匯 入。
或者,您可以使用 require 語句:
const sdk = require("microsoft-cognitiveservices-speech-sdk");
參考文件 | 套件 (下載) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Objective-C 的 語音 SDK 。
安裝適用於 Objective-C 的語音 SDK
適用於 Objective-C 的語音 SDK 原生為 Mac x64 和 ARM 型系統的 CocoaPod 套件。
Mac 的系統需求:
macOS CocoaPod 套件可供下載並搭配 Xcode 9.4.1 或更新版本的整合開發環境使用(IDE)。
移至 . xcodeproj 項目檔所在的 Xcode 目錄。
執行 pod init
以建立名為 Podfile 的 Pod 檔案。
以下列內容取代 Podfile 的內容 。 將 target
名稱從 AppName
更新為應用程式的名稱。 視需要更新平臺或Pod版本。
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
end
執行 pod install
以安裝語音 SDK。
或者,下載 二進位CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增已擷取 的 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。
注意
.NET 開發人員可以使用 Xamarin.Mac 應用程式架構來建置原生 macOS 應用程式。 如需詳細資訊,請參閱 Xamarin.Mac 。
適用於 Objective-C 的語音 SDK 原生提供為 CocoaPod 套件。
iOS 的系統需求:
macOS 10.14 版或更新版本
目標 iOS 9.3 或更新版本
macOS CocoaPod 套件可供下載並搭配 Xcode 9.4.1 或更新版本的整合開發環境使用(IDE)。
移至 . xcodeproj 項目檔所在的 Xcode 目錄。
執行 pod init
以建立名為 Podfile 的 Pod 檔案。
以下列內容取代 Podfile 的內容 。 將 target
名稱從 AppName
更新為應用程式的名稱。 視需要更新平臺或Pod版本。
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.37.0'
end
執行 pod install
以安裝語音 SDK。
或者,下載 二進位CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增已擷取 的 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。
注意
.NET 開發人員可以使用 Xamarin.iOS 應用程式架構來建置原生 iOS 應用程式。 如需詳細資訊,請參閱 Xamarin.iOS 。
參考文件 | 套件 (下載) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Swift 的 語音 SDK 。
安裝適用於 Swift 的語音 SDK
適用於 Swift 的語音 SDK 原生為 Mac x64 和 ARM 型系統的 CocoaPod 套件。
Mac 的系統需求:
macOS CocoaPod 套件可供下載並搭配 Xcode 9.4.1 或更新版本的整合開發環境使用(IDE)。
移至 . xcodeproj 項目檔所在的 Xcode 目錄。
執行 pod init
以建立名為 Podfile 的 Pod 檔案。
以下列內容取代 Podfile 的內容 。 將 target
名稱從 AppName
更新為應用程式的名稱。 視需要更新平臺或Pod版本。
platform :osx, 10.14
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.37.0'
end
執行 pod install
以安裝語音 SDK。
或者,下載 二進位CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增已擷取 的 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。
注意
.NET 開發人員可以使用 Xamarin.Mac 應用程式架構來建置原生 macOS 應用程式。 如需詳細資訊,請參閱 Xamarin.Mac 。
適用於 Swift 的語音 SDK 原生提供為 CocoaPod 套件。
iOS 的系統需求:
macOS 10.14 版或更新版本
目標 iOS 9.3 或更新版本
macOS CocoaPod 套件可供下載並搭配 Xcode 9.4.1 或更新版本的整合開發環境使用(IDE)。
移至 . xcodeproj 項目檔所在的 Xcode 目錄。
執行 pod init
以建立名為 Podfile 的 Pod 檔案。
以下列內容 取代 Podfile 的內容。 將 target
名稱從 AppName
更新為應用程式的名稱。 視需要更新平臺或Pod版本。
platform :ios, '9.3'
use_frameworks!
target 'AppName' do
pod 'MicrosoftCognitiveServicesSpeech-iOS', '~> 1.37.0'
end
執行 pod install
以安裝語音 SDK。
或者,下載 二進位CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增已擷取 的 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。
注意
.NET 開發人員可以使用 Xamarin.iOS 應用程式架構來建置原生 iOS 應用程式。 如需詳細資訊,請參閱 Xamarin.iOS 。
參考文件 | 套件 (PyPi) | GitHub 上的其他範例
在本快速入門中,您會安裝適用於 Python 的 語音 SDK 。
適用於 Python 的語音 SDK 與 Windows、Linux 和 macOS 相容。
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
適用於 Python 的語音 SDK 支援 x64 和 ARM64 架構上的下列散發套件:
Ubuntu 18.04/20.04
Debian 10/11
Red Hat Enterprise Linux (RHEL) 8
CentOS 7
重要
使用 Linux 發行版的最新 LTS 版本。 例如,如果您使用Ubuntu 20.04 LTS,請使用最新版的Ubuntu 20.04.X。
語音 SDK 取決於下列 Linux 系統連結庫:
GNU C 連結庫的共享連結庫,包括 POSIX 線程程式設計連結庫 。 libpthreads
OpenSSL 連結庫 (libssl
) 1.x 版和憑證 (ca-certificates
)。
ALSA 應用程式的共享連結庫 (libasound
)。
您也應該安裝 ca-certificates
以建立安全的 Websocket,並避免 WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED
發生錯誤。
重要
語音 SDK 尚未支援 OpenSSL 3.0,這是 Ubuntu 22.04 和 Debian 12 中的預設值。
執行以下命令:
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
若要在 Alpine Linux 中使用語音 SDK,請建立 Debian chroot 環境,如執行 glibc 程式的 Alpine Linux Wiki 中所述。 然後遵循這裡的Debian指示。
sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget
警告
本文參考 CentOS,亦即接近生命週期結束 (EOL) 狀態的 Linux 發行版本。 請據此考量您的使用方式和規劃。 如需詳細資訊,請參閱 CentOS 生命週期結束指引 。
安裝開發工具與連結庫:
sudo yum update
sudo yum groupinstall "Development tools"
sudo yum install alsa-lib openssl wget
重要
在 RHEL/CentOS 7 上,遵循如何設定 RHEL/CentOS 7 for Speech SDK 的指示 。
在 RHEL 上,遵循如何設定 Linux OpenSSL 的指示 。
安裝 Python 從 3.7 或更新 的版本。
若要檢查您的安裝,請開啟終端機並執行 命令 python --version
。 如果 Python 已正確安裝,您會收到類似 的 Python 3.8.10
回應。
如果您使用macOS或Linux,您可能需要改為執行 命令 python3 --version
。
若要啟用 使用 python
而非 python3
,請執行 alias python='python3'
以設定別名。 語音 SDK 快速入門範例會指定 python
使用方式。
安裝適用於 Python 的語音 SDK
安裝適用於 Python 的語音 SDK 之前,請務必滿足 平臺需求 。
從 PyPI 安裝
若要安裝適用於 Python 的語音 SDK,請在主控台視窗中執行此指令:
pip install azure-cognitiveservices-speech
升級至最新的語音 SDK
若要升級至最新的語音 SDK,請在主控台視窗中執行此命令:
pip install --upgrade azure-cognitiveservices-speech
您可以藉由檢查 變數來檢查 azure.cognitiveservices.speech.__version__
目前已安裝的適用於 Python 的語音 SDK 版本。 例如,在主控台視窗中執行此指令:
pip list
使用 Visual Studio Code 安裝語音 SDK
若要安裝適用於 Python 的語音 SDK:
下載並安裝 Visual Studio Code 。
執行 Visual Studio Code 並安裝 Python 延伸模組:
選取 [檔案> 喜好設定> 擴展名]。
搜尋 Python、尋找由 Microsoft 發佈的 Visual Studio Code 的 Python 延伸模組,然後選取 [安裝 ]。
選取 [終端 >機] [新增終端機 ] 以在 Visual Studio Code 中開啟終端機。
在終端機提示字元中,執行下列命令以安裝適用於 Python 的語音 SDK 套件。
python -m pip install azure-cognitiveservices-speech
如需 Visual Studio Code 和 Python 的詳細資訊,請參閱 VS Code 中的 Visual Studio Code 和開始使用 Python。
使用語音 SDK
新增下列 import 語句,以在 Python 專案中使用語音 SDK:
import azure.cognitiveservices.speech as speechsdk
相關內容