快速入門:安裝語音 SDK

GitHub 上的參考檔 | 套件 (NuGet) | 其他範例

在本快速入門中,您會安裝適用於 C# 的 語音 SDK

檔中的程式代碼範例是以 C# 8 撰寫,並在 .NET standard 2.0 上執行。

平臺需求

適用於 C# 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位目標架構。 需要 Windows 10 或更新版本。

為您的平臺安裝適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft C++ 可轉散發套件。 第一次安裝此套件可能需要重新啟動。

安裝適用於 C 的語音 SDK#

適用於 C# 的語音 SDK 可作為 NuGet 套件,並實作 .NET Standard 2.0。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech

您可以使用下列 dotnet add 命令,從 .NET CLI 安裝適用於 C# 的語音 SDK:

dotnet add package Microsoft.CognitiveServices.Speech

您可以遵循這些指南以取得更多選項。

本指南說明如何安裝 適用於 .NET Framework (Windows) 控制台應用程式的語音 SDK

本指南需要:

建立 Visual Studio 專案並安裝語音 SDK

您必須安裝 語音 SDK NuGet 套件 ,才能在程式碼中參考它。 若要這樣做,您必須先建立 helloworld 專案。 如果您已經有具有 .NET 桌面開發工作負載的專案,您可以使用該專案並跳至使用 NuGet 封裝管理員 來安裝語音 SDK

建立 helloworld 專案

  1. 開啟 Visual Studio。

  2. 在 [開始使用] 底下,選取 [建立新專案]。

  3. [建立新專案] 中,選擇 [控制台應用程式][.NET Framework],然後選取 [ 下一步]。

  4. 在 [設定新專案] 中,針對 [項目名稱] 輸入 helloworld,選擇或建立 [位置] 中的目錄路徑,然後選取 [建立]。

  5. 從 Visual Studio 選單欄,選取 [工具>取得工具和功能]。 此步驟 Visual Studio 安裝程式 開啟,並顯示 [修改] 對話框。

  6. 檢查 .NET 桌面開發工作負載是否可用。 如果未安裝工作負載,請加以選取,然後選取 [修改 ] 以開始安裝。 下載並安裝可能需要幾分鐘的時間。

    如果 已選取 .NET 桌面開發 ,請選取 [關閉 ] 以關閉對話框。

    Screenshot that shows enabling .NET desktop development.

  7. 關閉 Visual Studio 安裝程式。

使用 NuGet 封裝管理員 安裝語音 SDK

  1. 在 方案總管 中,以滑鼠右鍵按兩下 helloworld 項目,然後選取 [管理 NuGet 套件] 以顯示 NuGet 封裝管理員。

  2. 在右上角尋找 [ 套件來源 ] 下拉式方塊,並確定 已選取 nuget.org

    Screenshot that shows NuGet Package Manager.

  3. 在左上角,選取 [ 瀏覽]。

  4. 在搜尋方塊中,輸入 Microsoft.CognitiveServices.Speech ,然後選取 Enter

  5. 從搜尋結果中,選取 Microsoft.CognitiveServices.Speech 套件,然後選取 [ 安裝 ] 以安裝最新的穩定版本。

    Screenshot that shows installing the Microsoft.CognitiveServices.Speech NuGet package.

  6. 接受所有合約和授權以開始安裝。

    安裝套件之後,確認會出現在 [封裝管理員 主控台] 視窗中。

選擇目標架構

若要建置並執行主控台應用程式,請建立符合您電腦架構的平台組態。

  1. 從功能表中,選取 [>置組態管理員]。 [組態管理員] 對話方塊隨即出現。

  2. 在 [作用中 解決方案平臺] 下拉式方塊中,選取 [ 新增]。 [新增方案平台] 對話方塊隨即出現。

    Screenshot that shows the Configuration Manager dialog box.

  3. 在 [ 輸入或選取新的平臺 ] 下拉式方塊中:

    • 如果您正在執行 64 位 Windows,請選取 x64
    • 如果您正在執行 32 位 Windows,請選取 [x86]。
  4. 選取 [確定],然後選取 [關閉]。

GitHub 上的參考檔 | 套件 (NuGet) | 其他範例

在本快速入門中,您會安裝適用於 C++ 的 語音 SDK

平臺需求

適用於 C++ 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位目標架構。 需要 Windows 10 或更新版本。

為您的平臺安裝適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft C++ 可轉散發套件。 第一次安裝此套件可能需要重新啟動。

安裝適用於 C++ 的語音 SDK

適用於 C++ 的語音 SDK 可作為 NuGet 套件。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech

您可以使用下列 dotnet add 命令,從 .NET CLI 安裝適用於 C++ 的語音 SDK:

dotnet add package Microsoft.CognitiveServices.Speech

您可以遵循這些指南以取得更多選項。

本指南說明如何安裝適用於Linux的 語音SDK

使用下列程式來下載並安裝 SDK。 這些步驟包括 將必要的連結庫和頭文件 下載為 .tar 檔案。

  1. 選擇語音 SDK 檔案的目錄。 將 SPEECHSDK_ROOT 環境變數設定為指向該目錄。 此變數可讓您輕鬆地在未來命令中參考目錄。

    若要在主目錄中使用目錄 speechsdk ,請執行下列命令:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 如果目錄不存在,請建立目錄:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. 下載並解壓縮 包含語音 SDK 二進位檔的 .tar.gz封存:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 驗證擷取套件的最上層目錄內容:

    ls -l "$SPEECHSDK_ROOT"
    

    目錄清單應包含合作夥伴通知和授權檔案。 清單也應該包含包含保存標頭 (.h) 檔案的目錄,以及保存arm32、arm64、x64和 x86 連結庫的 lib 目錄。

    路徑 描述
    license.md 授權
    ThirdPartyNotices.md 合作夥伴通知
    REDIST.txt 轉散發通知
    include C++ 的必要頭檔
    lib/arm32 連結應用程式所需的 ARM32 原生連結庫
    lib/arm64 連結應用程式所需的 ARM64 原生連結庫
    lib/x64 連結應用程式所需的 x64 原生連結庫
    lib/x86 連結應用程式所需的 x86 原生連結庫

GitHub 上的參考檔 | 套件 (Go) | 其他範例

在本快速入門中,您會安裝適用於 Go 的 語音 SDK

平臺需求

適用於 Go 的語音 SDK 支援 x64 架構上的下列散發套件:

  • Ubuntu 18.04/20.04/22.04
  • Debian 9/10/11
  • Red Hat Enterprise Linux (RHEL) 8
  • CentOS 8

重要

使用 Linux 發行版的最新 LTS 版本。 例如,如果您使用Ubuntu 20.04 LTS,請使用最新版的Ubuntu 20.04.X。

語音 SDK 取決於下列 Linux 系統連結庫:

  • GNU C 連結庫的共享連結庫,包括 POSIX 線程程式設計連結庫 。 libpthreads
  • OpenSSL 連結庫 (libssl) 1.x 版和憑證 (ca-certificates)。
  • ALSA 應用程式的共享連結庫 (libasound)。

您也應該安裝 ca-certificates 以建立安全的 Websocket,並避免 WS_OPEN_ERROR_UNDERLYING_IO_OPEN_FAILED 發生錯誤。

重要

語音 SDK 尚未支援 OpenSSL 3.0,這是 Ubuntu 22.04 和 Debian 12 中的預設值。

若要在 Debian/Ubuntu 型系統上從沒有 OpenSSL 1.x 的來源安裝 OpenSSL 1.x,請執行下列命令:

wget -O - https://www.openssl.org/source/openssl-1.1.1u.tar.gz | tar zxf -
cd openssl-1.1.1u
./config --prefix=/usr/local
make -j $(nproc)
sudo make install_sw install_ssldirs
sudo ldconfig -v
export SSL_CERT_DIR=/etc/ssl/certs

安裝注意事項:

  • 檢查 https://www.openssl.org/source/,以取得要使用的最新 OpenSSL 1.x 版本。

  • 的設定 SSL_CERT_DIR 必須在全系統範圍內或至少在控制台中啟動使用語音 SDK 的應用程式。 否則,安裝在 /usr/local 中的 OpenSSL 1.x 可能找不到憑證。

  • 請確定 來自 ldconfig -v 的控制台輸出包含 /usr/local/lib。 在新式系統上,預設應為 。 如果沒有,請設定LD_LIBRARY_PATH與 將 /usr/local/lib 新增至連結庫路徑相同的範圍SSL_CERT_DIR

    export LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH
    

執行以下命令:

sudo apt-get update
sudo apt-get install build-essential libssl-dev ca-certificates libasound2 wget

安裝 Go 二進位版本 1.13 或更新版本

安裝適用於 Go 的語音 SDK

使用下列程式來下載並安裝 SDK。 這些步驟包括 將必要的連結庫和頭文件 下載為 .tar 檔案。

  1. 選擇語音 SDK 檔案的目錄。 將 SPEECHSDK_ROOT 環境變數設定為指向該目錄。 此變數可讓您輕鬆地在未來命令中參考目錄。

    若要在主目錄中使用目錄 speechsdk ,請執行下列命令:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 如果目錄不存在,請建立目錄:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. 下載並解壓縮 包含語音 SDK 二進位檔的 .tar.gz封存:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 驗證擷取套件的最上層目錄內容:

    ls -l "$SPEECHSDK_ROOT"
    

    目錄清單應包含合作夥伴通知和授權檔案。 清單也應該包含包含保存標頭 (.h) 檔案的目錄,以及保存arm32、arm64、x64和 x86 連結庫的 lib 目錄。

    路徑 描述
    license.md 授權
    ThirdPartyNotices.md 合作夥伴通知
    REDIST.txt 轉散發通知
    include C++ 的必要頭檔
    lib/arm32 連結應用程式所需的 ARM32 原生連結庫
    lib/arm64 連結應用程式所需的 ARM64 原生連結庫
    lib/x64 連結應用程式所需的 x64 原生連結庫
    lib/x86 連結應用程式所需的 x86 原生連結庫

設定 Go 環境

下列步驟可讓您的 Go 環境尋找語音 SDK。

  1. 因為系結依賴 cgo,所以您必須設定環境變數,讓 Go 可以找到 SDK。

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    重要

    <architecture>取代為 CPU 的處理器架構:x86x64arm32arm64

  2. 若要執行應用程式和 SDK,您必須告訴作業系統在哪裡尋找連結庫。

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    重要

    <architecture>取代為 CPU 的處理器架構:x86x64arm32arm64

GitHub 上的參考檔 | 其他範例

在本快速入門中,您會安裝適用於 Java 的 語音 SDK

平臺需求

選擇您的目標環境:

適用於 Java 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位目標架構。 需要 Windows 10 或更新版本。

為您的平臺安裝適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft C++ 可轉散發套件。 第一次安裝此套件可能需要重新啟動。

適用於 Java 的語音 SDK 不支援 ARM64 上的 Windows。

安裝 Java 開發工具組,例如 Azul Zulu OpenJDKOpenJDK 的 Microsoft Build 或您慣用的 JDK 也應該運作。

安裝適用於 Java 的語音 SDK

某些指示會使用特定的 SDK 版本, 例如 1.24.2。 若要檢查最新版本, 請搜尋我們的 GitHub 存放庫

選擇您的目標環境:

本指南說明如何在 Java 執行時間上安裝適用於 Java 的語音 SDK

受支援的作業系統

適用於 Java 的語音 SDK 套件適用於下列作業系統:

請遵循下列步驟,使用 Apache Maven 安裝適用於 Java 的語音 SDK:

  1. 安裝 Apache Maven

  2. 開啟您想要新專案的命令提示字元,然後建立新的 pom.xml 檔案。

  3. 將下列 XML 內容複製到 pom.xml

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.35.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. 執行下列 Maven 命令來安裝語音 SDK 和相依性。

    mvn clean dependency:copy-dependencies
    

GitHub Library 原始程式碼上的參考文件 | 套件 (npm) | 其他範例 |

在本快速入門中,您會安裝適用於 JavaScript 的 語音 SDK

適用於 JavaScript 的語音 SDK 可作為 npm 套件。 請參閱 microsoft-cognitiveservices-speech-sdk 及其隨附 GitHub 存放庫 cognitive-services-speech-sdk-js

平臺需求

瞭解Node.js與用戶端網頁瀏覽器之間的架構影響。 例如, 檔案物件模型 (DOM) 不適用於伺服器端應用程式。 用戶端應用程式 無法使用Node.js檔案系統

安裝適用於 JavaScript 的語音 SDK

視目標環境而定,請使用下列其中一個指南:

本指南說明如何安裝適用於 JavaScript 的 語音 SDK ,以搭配Node.js使用。

  1. 安裝 Node.js

  2. 建立新的目錄、執行 npm init,並逐步解說提示。

  3. 若要安裝適用於 JavaScript 的語音 SDK,請執行下列 npm install 命令:

    npm install microsoft-cognitiveservices-speech-sdk
    

如需詳細資訊,請參閱 Node.js範例

使用語音 SDK

  • 新增下列 import 語句,以在 JavaScript 專案中使用語音 SDK:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

如需 的詳細資訊 import,請參閱 在 JavaScript 網站上匯出和匯 入。

或者,您可以使用 require 語句:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

GitHub 上的參考檔 | 套件 (下載) | 其他範例

在本快速入門中,您會安裝適用於 Objective-C 的 語音 SDK

提示

如需使用適用於 Swift 的語音 SDK 的詳細資訊,請參閱 將 Objective-C 匯入 Swift

安裝適用於 Objective-C 的語音 SDK

適用於 Objective-C 的語音 SDK 原生為 Mac x64 和 ARM 型系統的 CocoaPod 套件。

Mac 的系統需求:

  • macOS 10.14 版或更新版本

macOS CocoaPod 套件可供下載並搭配 Xcode 9.4.1 或更新版本的整合開發環境使用(IDE)。

  1. 移至 . xcodeproj 項目檔所在的 Xcode 目錄。

  2. 執行 pod init 以建立名為 Podfile 的 Pod 檔案。

  3. 以下列內容取代 Podfile 的內容。 將 target 名稱從 AppName 更新為應用程式的名稱。 視需要更新平臺或Pod版本。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.35.0'
    end
    
  4. 執行 pod install 以安裝語音 SDK。

或者,下載 二進位CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增已擷取 的 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。

注意

.NET 開發人員可以使用 Xamarin.Mac 應用程式架構來建置原生 macOS 應用程式。 如需詳細資訊,請參閱 Xamarin.Mac

GitHub 上的參考檔 | 套件 (下載) | 其他範例

在本快速入門中,您會安裝適用於 Swift 的 語音 SDK

提示

如需使用適用於 Swift 的語音 SDK 的詳細資訊,請參閱 將 Objective-C 匯入 Swift

安裝適用於 Swift 的語音 SDK

適用於 Swift 的語音 SDK 原生為 Mac x64 和 ARM 型系統的 CocoaPod 套件。

Mac 的系統需求:

  • macOS 10.14 版或更新版本

macOS CocoaPod 套件可供下載並搭配 Xcode 9.4.1 或更新版本的整合開發環境使用(IDE)。

  1. 移至 . xcodeproj 項目檔所在的 Xcode 目錄。

  2. 執行 pod init 以建立名為 Podfile 的 Pod 檔案。

  3. 以下列內容取代 Podfile 的內容。 將 target 名稱從 AppName 更新為應用程式的名稱。 視需要更新平臺或Pod版本。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.35.0'
    end
    
  4. 執行 pod install 以安裝語音 SDK。

或者,下載 二進位CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增已擷取 的 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。

注意

.NET 開發人員可以使用 Xamarin.Mac 應用程式架構來建置原生 macOS 應用程式。 如需詳細資訊,請參閱 Xamarin.Mac

GitHub 上的參考檔 | 套件 (PyPi) | 其他範例

在本快速入門中,您會安裝適用於 Python 的 語音 SDK

平臺需求

適用於 Python 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位目標架構。 需要 Windows 10 或更新版本。

為您的平臺安裝適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft C++ 可轉散發套件。 第一次安裝此套件可能需要重新啟動。

重要

請確定已安裝相同目標架構的套件。 例如,如果您安裝 x64 可轉散發套件,請安裝 x64 Python 套件。

安裝 Python 從 3.7 或更新的版本。

  • 若要檢查您的安裝,請開啟終端機並執行 命令 python --version。 如果 Python 已正確安裝,您會收到類似 的 Python 3.8.10回應。

  • 如果您使用macOS或Linux,您可能需要改為執行 命令 python3 --version

    若要啟用 使用 python 而非 python3,請執行 alias python='python3' 以設定別名。 語音 SDK 快速入門範例會指定 python 使用方式。

安裝適用於 Python 的語音 SDK

安裝適用於 Python 的語音 SDK 之前,請務必滿足 平臺需求

從 PyPI 安裝

若要安裝適用於 Python 的語音 SDK,請在主控台視窗中執行此指令:

pip install azure-cognitiveservices-speech

升級至最新的語音 SDK

若要升級至最新的語音 SDK,請在主控台視窗中執行此命令:

pip install --upgrade azure-cognitiveservices-speech

您可以藉由檢查 變數來檢查 azure.cognitiveservices.speech.__version__ 目前已安裝的適用於 Python 的語音 SDK 版本。 例如,在主控台視窗中執行此指令:

pip list

使用語音 SDK

新增下列 import 語句,以在 Python 專案中使用語音 SDK:

import azure.cognitiveservices.speech as speechsdk