共用方式為


快速入門:安裝語音 SDK

參考文件 | 套件 (NuGet) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 C# 的 語音 SDK

平台需求

適用於 C# 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位元目標結構。 需要 Windows 10 或更新版本。

為您的平台安裝 適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft Visual C++ 可轉散發套件。 第一次安裝此套件時可能需要重新啟動。

安裝適用於 C# 的語音 SDK。

適用於 C# 的語音 SDK 可以 NuGet 套件的形式取得,並且實作 .NET Standard 2.0。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech

您可以使用下列 dotnet add 命令,從 .NET CLI 安裝適用於 C# 的語音 SDK:

dotnet add package Microsoft.CognitiveServices.Speech

參考文件 | 套件 (NuGet) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 C++ 的 語音 SDK

平台需求

適用於 C++ 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位元目標結構。 需要 Windows 10 或更新版本。

為您的平台安裝 適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft Visual C++ 可轉散發套件。 第一次安裝此套件時可能需要重新啟動。

安裝適用於 C++ 的語音 SDK

可以 NuGet 套件的形式取得適用於 C++ 的語音 SDK。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech

您可以使用下列 dotnet add 命令,從 .NET CLI 安裝適用於 C++ 的語音 SDK:

dotnet add package Microsoft.CognitiveServices.Speech

您可以遵循這些指南以取得更多選項。

本指南說明如何安裝適用於 Linux 的語音 SDK

使用下列程序下載並安裝 SDK。 這些步驟包括以 .zip 檔案形式 下載必要的連結庫和標頭檔

  1. 選擇語音 SDK 檔案的目錄。 設定 SPEECHSDK_ROOT 環境變數以指向該目錄。 此變數方便在未來命令中參考此目錄。

    若要在主目錄中使用目錄 speechsdk,請執行下列命令:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 如果目錄不存在,請建立目錄:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. 下載並解壓縮包含語音 SDK 二進位檔的 .tar.gz 封存:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 驗證已壓縮套件之最上層目錄的內容:

    ls -l "$SPEECHSDK_ROOT"
    

    目錄清單應包含合作夥伴通知和授權檔案。 此清單也應該包含其中保存標頭 (.h) 檔的 include 目錄,以及其中保存 arm32、arm64、x64 和 x86 程式庫的 lib 目錄。

    路徑 描述
    license.md 授權
    ThirdPartyNotices.md 合作夥伴通知
    REDIST.txt 轉散發注意事項
    包括 C++ 的必要標頭檔
    lib/arm32 要連結您應用程式所需的 ARM32 原生程式庫
    lib/arm64 要連結您應用程式所需的 ARM64 原生程式庫
    lib/x64 要連結您的應用程式所需的 x64 原生程式庫
    lib/x86 要連結您的應用程式所需的 x86 原生程式庫

參考文件 | 套件 (Go) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Go 的 語音 SDK

平台需求

適用於 Go 的語音 SDK 支援 x64 架構上的下列散發套件:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

重要

使用 Linux 發行版本的最新 LTS 版本。 例如,如果您使用 Ubuntu 20.04 LTS,請使用最新版的 Ubuntu 20.04.X。

語音 SDK 取決於下列 Linux 系統程式庫:

  • GNU C 程式庫的共用程式庫,包含 POSIX 執行緒程式設計程式庫。libpthreads
  • OpenSSL 程式庫 1.x 版 (libssl1) 或 3.x 版 (libssl3),以及憑證 (ca-certificates)。
  • ALSA 應用程式的共用程式庫 (libasound2)。

執行以下命令:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

安裝 Go 二進位版本 1.13 或更新版本

安裝適用於 Go 的語音 SDK

使用下列程序下載並安裝 SDK。 這些步驟包括以 .zip 檔案形式 下載必要的連結庫和標頭檔

  1. 選擇語音 SDK 檔案的目錄。 設定 SPEECHSDK_ROOT 環境變數以指向該目錄。 此變數方便在未來命令中參考此目錄。

    若要在主目錄中使用目錄 speechsdk,請執行下列命令:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 如果目錄不存在,請建立目錄:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. 下載並解壓縮包含語音 SDK 二進位檔的 .tar.gz 封存:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 驗證已壓縮套件之最上層目錄的內容:

    ls -l "$SPEECHSDK_ROOT"
    

    目錄清單應包含合作夥伴通知和授權檔案。 此清單也應該包含其中保存標頭 (.h) 檔的 include 目錄,以及其中保存 arm32、arm64、x64 和 x86 程式庫的 lib 目錄。

    路徑 描述
    license.md 授權
    ThirdPartyNotices.md 合作夥伴通知
    REDIST.txt 轉散發注意事項
    包括 C++ 的必要標頭檔
    lib/arm32 要連結您應用程式所需的 ARM32 原生程式庫
    lib/arm64 要連結您應用程式所需的 ARM64 原生程式庫
    lib/x64 要連結您的應用程式所需的 x64 原生程式庫
    lib/x86 要連結您的應用程式所需的 x86 原生程式庫

設定 Go 環境

下列步驟可讓 Go 環境尋找語音 SDK。

  1. 由於繫結仰賴 cgo,因此您必須設定環境變數,讓 Go 可以找到 SDK。

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    重要

    <architecture> 取代為您的 CPU 的處理器架構:x64arm32arm64

  2. 若要執行應用程式和 SDK,您必須告訴作業系統要在哪裡尋找程式庫。

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    重要

    <architecture> 取代為您的 CPU 的處理器架構:x64arm32arm64

參考文件 | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Java 的 語音 SDK

平台需求

選擇您的目標環境:

適用於 Java 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位元目標結構。 需要 Windows 10 或更新版本。

為您的平台安裝 適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft Visual C++ 可轉散發套件。 第一次安裝此套件時可能需要重新啟動。

適用於 Java 的語音 SDK 不支援 ARM64 上的 Windows。

安裝 Java 開發套件,例如 Azul Zulu OpenJDKMicrosoft Build of OpenJDK 或您慣用的 JDK 也應該可以運作。

安裝適用於 Java 的語音 SDK

某些指示會使用特定的 SDK 版本,例如 1.43.0。 若要檢查最新版本,請搜尋我們的 GitHub 存放庫

選擇您的目標環境:

本指南說明如何在 Java 執行階段上安裝適用於 Java 的語音 SDK

受支援的作業系統

適用於 Java 語音 SDK 套件適用於下列作業系統:

請遵循下列步驟,使用 Apache Maven 安裝適用於 Java 的語音 SDK:

  1. 安裝 Apache Maven

  2. 開啟您想要新專案的命令提示字元,並建立新的 pom.xml 檔案。

  3. 將下列 XML 內容複製到 pom.xml

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.43.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. 執行下列 Maven 命令來安裝語音 SDK 和相依性。

    mvn clean dependency:copy-dependencies
    

參考文件 | 套件 (npm) | GitHub 上的其他範例 | 程式庫原始程式碼

在本快速入門中,您會安裝適用於 JavaScript 的 語音 SDK

適用於 JavaScript 的語音 SDK 可做為 npm 套件使用。 請參閱 microsoft-cognitiveservices-speech-sdk 及其隨附的 GitHub 存放庫 cognitive-services-speech-sdk-js

平台需求

瞭解 Node.js與 用戶端網頁瀏覽器之間的架構影響。 例如,伺服器端應用程式無法使用 文件物件模型 (DOM)。 用戶端應用程式無法使用 Node.js 檔案系統

安裝適用於 JavaScript 的語音 SDK

根據目標環境而定,使用下列其中一個指南:

本指南說明如何安裝適用於 JavaScript 的語音 SDK,以與 Node.js 搭配使用。

  1. 安裝 Node.js

  2. 建立新目錄、執行 npm init,然後逐步完成其提示。

  3. 若要安裝適用於 JavaScript 的語音 SDK,請執行下列 npm install 命令:

    npm install microsoft-cognitiveservices-speech-sdk
    

如需詳細資訊,請參閱 Node.js 樣本

使用語音 SDK

  • 新增下列匯入陳述式,以在 JavaScript 專案中使用語音 SDK:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

如需 import 的詳細資訊,請參閱在 JavaScript 網站上匯出和匯入

或者,您可以使用需要陳述式:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

參考文件 | 套件 (下載) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Objective-C 的 語音 SDK

提示

如需如何使用適用於 Swift 的語音 SDK 詳細資訊,請參閱 將 Objective-C 匯入 Swift

安裝適用於 Objective-C 的語音 SDK

適用於 Objective-C 的語音 SDK 原生為 Mac x64 和 ARM 系統的 CocoaPod 套件。

Mac 的系統需求:

  • macOS 10.14 版或更新版本

macOS CocoaPod 套件可供下載,並可與 Xcode 9.4.1 (或更新版本) 整合式開發環境 (IDE) 搭配使用。

  1. 前往 .xcodeproj 專案檔所在的 Xcode 目錄。

  2. 執行 pod init 以建立名為 Podfile的 Pod 檔案。

  3. Podfile 的內容取代為以下內容。 將 target 名稱從 AppName 更新為應用程式的名稱。 視需要更新平台或 Pod 版本。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. 執行 pod install 來安裝語音 SDK。

或者,下載 二進位 CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增對已擷取 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。

參考文件 | 套件 (下載) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Swift 的 語音 SDK

提示

如需如何使用適用於 Swift 的語音 SDK 詳細資訊,請參閱 將 Objective-C 匯入 Swift

安裝適用於 Swift 的語音 SDK

適用於 Swift 的語音 SDK 原生為 Mac x64 和 ARM 系統的 CocoaPod 套件。

Mac 的系統需求:

  • macOS 10.14 版或更新版本

macOS CocoaPod 套件可供下載,並可與 Xcode 9.4.1 (或更新版本) 整合式開發環境 (IDE) 搭配使用。

  1. 前往 .xcodeproj 專案檔所在的 Xcode 目錄。

  2. 執行 pod init 以建立名為 Podfile的 Pod 檔案。

  3. Podfile 的內容取代為以下內容。 將 target 名稱從 AppName 更新為應用程式的名稱。 視需要更新平台或 Pod 版本。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. 執行 pod install 來安裝語音 SDK。

或者,下載 二進位 CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增對已擷取 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。

參考文件 | 套件 (PyPi) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Python 的 語音 SDK

平台需求

適用於 Python 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位元目標結構。 需要 Windows 10 或更新版本。

為您的平台安裝 適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft Visual C++ 可轉散發套件。 第一次安裝此套件時可能需要重新啟動。

重要

確定已安裝相同目標架構的套件。 例如,如果您安裝 x64 可轉散發套件,則必須安裝 x64 Python 套件。

安裝 Python 從 3.8 或更新的版本。

  • 若要檢查您的安裝,請開啟終端機,然後執行命令 python --version。 如果 Python 已正確安裝,您會收到類似 Python 3.8.10 的回應。

  • 如果您使用 macOS 或 Linux,則可能需要改為執行 命令 python3 --version

    若要使用 python 而非 python3,請執行 alias python='python3' 以設定別名。 語音 SDK 快速入門範例會指定 python 使用方式。

安裝適用於 Python 的語音 SDK

在安裝適用於 Python 的語音 SDK 之前,請務必滿足平台需求

從 PyPI 安裝

若要安裝適用於 Python 的語音 SDK,請在主控台視窗中執行此命令:

pip install azure-cognitiveservices-speech

升級至最新的語音 SDK

若要升級至最新的語音 SDK,請在主控台視窗中執行此命令:

pip install --upgrade azure-cognitiveservices-speech

您可以檢查 azure.cognitiveservices.speech.__version__ 變數來確認目前所安裝的適用於 Python 語音 SDK 版本。 例如,在主控台視窗中執行此命令:

pip list

使用語音 SDK

新增下列匯入陳述式,以在 Python 專案中使用語音 SDK:

import azure.cognitiveservices.speech as speechsdk

程式代碼範例

GitHub 上的 Azure-Samples/cognitive-services-speech-sdk 存放庫中提供深入範例。 C# 有範例(包括 UWP 和 Unity)、C++、Java、JavaScript(包括 Browser 和 Node.js)、Objective-C、Python 和 Swift。 Go 的程式代碼範例可在 GitHub 上的 Microsoft/cognitive-services-speech-sdk-go 存放庫中取得。