共用方式為


快速入門:安裝語音 SDK

參考文件 | 套件 (NuGet) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 C# 的 語音 SDK

文件中的程式碼範例是以 C# 8 撰寫,並在 .NET standard 2.0 上執行。

平台需求

適用於 C# 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位元目標結構。 需要 Windows 10 或更新版本。

為您的平台安裝 適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft Visual C++ 可轉散發套件。 第一次安裝此套件時可能需要重新啟動。

安裝適用於 C# 的語音 SDK。

適用於 C# 的語音 SDK 可以 NuGet 套件的形式取得,並且實作 .NET Standard 2.0。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech

您可以使用下列 dotnet add 命令,從 .NET CLI 安裝適用於 C# 的語音 SDK:

dotnet add package Microsoft.CognitiveServices.Speech

您可以遵循這些指南以取得更多選項。

本指南說明如何安裝適用於 .NET Framework (Windows) 主控台應用程式的語音 SDK

本指南需要:

建立 Visual Studio 專案並安裝語音 SDK

您需要安裝語音 SDK NuGet 套件,以便在程式碼中加以參考。 若要這麼做,您可能必須先建立 helloworld 專案。 如果您已經有 .NET 桌面開發工作負載的專案,您可以使用該專案,並跳至 使用 NuGet 套件管理員來安裝語音 SDK

建立 helloworld 專案

  1. 開啟 Visual Studio。

  2. [開始使用] 下,選取 [建立新專案]

  3. 在 [建立新專案] 中,選擇 [主控台應用程式 (.NET Framework)],然後選取 [下一步]

  4. [設定您的新專案] 視窗中,在 [專案名稱] 中輸入 helloworld、在 [位置] 中選擇或建立目錄路徑,然後選取 [建立]

  5. 從 Visual Studio 功能表列,選取 [工具] > [取得工具和功能]。 此步驟會開啟 Visual Studio 安裝程式,並顯示 [修改] 對話方塊。

  6. 請檢查 [.NET 桌面開發] 工作負載是否可用。 如果未安裝工作負載,請加以選取,然後選取 [修改] 以啟動安裝。 下載及安裝可能需要幾分鐘的時間。

    如果 [.NET 桌面開發] 旁邊的核取方塊已經選取,請選取 [關閉] 來關閉對話方塊。

    顯示啟用 .NET 桌面開發的螢幕擷取畫面。

  7. 關閉 Visual Studio 安裝程式。

使用 NuGet 套件管理員來安裝語音 SDK

  1. 在 [方案總管] 中,以滑鼠右鍵按一下 helloworld 專案,然後選取 [管理 NuGet 套件] 以顯示 NuGet 套件管理員。

  2. 在右上角找到 [套件來源] 下拉式方塊,並確定已選取 [nuget.org]

    顯示 NuGet 套件管理員的螢幕擷取畫面。

  3. 選取左上角的 [瀏覽]

  4. 在搜尋方塊中,輸入 Microsoft.CognitiveServices.Speech ,然後選取 [輸入]

  5. 從搜尋結果中,選取 [Microsoft.CognitiveServices.Speech] 套件,然後選取 [安裝] 以安裝最新的穩定版本。

    顯示安裝 Microsoft.CognitiveServices.Speech NuGet 套件的螢幕擷取畫面。

  6. 接受所有合約和授權,即可開始安裝。

    安裝套件之後,[套件管理員主控台] 視窗中會出現確認訊息。

選擇目標架構

若要建置及執行主控台應用程式,請建立符合電腦結構的平台設定。

  1. 從功能表中,選取 [組建]>Configuration Manager。 [組態管理員] 對話方塊隨即出現。

  2. [使用中的解決方案平台] 下拉式方塊中,選取 [新增]。 [新增方案平台] 對話方塊隨即出現。

    顯示 Configuration Manager 對話方塊的螢幕擷取畫面。

  3. [輸入或選取新平台] 下拉式方塊中:

    • 如果您執行 64 位元的 Windows,請選取 x64
    • 如果您執行 32 位元的 Windows,請選取 x86
  4. 選取 [確定],然後選取 [關閉]

參考文件 | 套件 (NuGet) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 C++ 的 語音 SDK

平台需求

適用於 C++ 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位元目標結構。 需要 Windows 10 或更新版本。

為您的平台安裝 適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft Visual C++ 可轉散發套件。 第一次安裝此套件時可能需要重新啟動。

安裝適用於 C++ 的語音 SDK

可以 NuGet 套件的形式取得適用於 C++ 的語音 SDK。 如需詳細資訊,請參閱 Microsoft.CognitiveServices.Speech

您可以使用下列 dotnet add 命令,從 .NET CLI 安裝適用於 C++ 的語音 SDK:

dotnet add package Microsoft.CognitiveServices.Speech

您可以遵循這些指南以取得更多選項。

本指南說明如何安裝適用於 Linux 的語音 SDK

使用下列程序下載並安裝 SDK。 這些步驟包括以 .zip 檔案形式 下載必要的連結庫和標頭檔

  1. 選擇語音 SDK 檔案的目錄。 設定 SPEECHSDK_ROOT 環境變數以指向該目錄。 此變數方便在未來命令中參考此目錄。

    若要在主目錄中使用目錄 speechsdk,請執行下列命令:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 如果目錄不存在,請建立目錄:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. 下載並解壓縮包含語音 SDK 二進位檔的 .tar.gz 封存:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 驗證已壓縮套件之最上層目錄的內容:

    ls -l "$SPEECHSDK_ROOT"
    

    目錄清單應包含合作夥伴通知和授權檔案。 此清單也應該包含其中保存標頭 (.h) 檔的 include 目錄,以及其中保存 arm32、arm64、x64 和 x86 程式庫的 lib 目錄。

    路徑 描述
    license.md 授權
    ThirdPartyNotices.md 合作夥伴通知
    REDIST.txt 轉散發注意事項
    include C++ 的必要標頭檔
    lib/arm32 要連結您應用程式所需的 ARM32 原生程式庫
    lib/arm64 要連結您應用程式所需的 ARM64 原生程式庫
    lib/x64 要連結您的應用程式所需的 x64 原生程式庫
    lib/x86 要連結您的應用程式所需的 x86 原生程式庫

參考文件 | 套件 (Go) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Go 的 語音 SDK

平台需求

適用於 Go 的語音 SDK 支援 x64 架構上的下列散發套件:

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

重要

使用 Linux 發行版本的最新 LTS 版本。 例如,如果您使用 Ubuntu 20.04 LTS,請使用最新版的 Ubuntu 20.04.X。

語音 SDK 取決於下列 Linux 系統程式庫:

  • GNU C 程式庫的共用程式庫,包含 POSIX 執行緒程式設計程式庫。libpthreads
  • OpenSSL 程式庫 1.x 版 (libssl1) 或 3.x 版 (libssl3),以及憑證 (ca-certificates)。
  • ALSA 應用程式的共用程式庫 (libasound2)。

執行以下命令:

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

安裝 Go 二進位版本 1.13 或更新版本

安裝適用於 Go 的語音 SDK

使用下列程序下載並安裝 SDK。 這些步驟包括以 .zip 檔案形式 下載必要的連結庫和標頭檔

  1. 選擇語音 SDK 檔案的目錄。 設定 SPEECHSDK_ROOT 環境變數以指向該目錄。 此變數方便在未來命令中參考此目錄。

    若要在主目錄中使用目錄 speechsdk,請執行下列命令:

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. 如果目錄不存在,請建立目錄:

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. 下載並解壓縮包含語音 SDK 二進位檔的 .tar.gz 封存:

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 驗證已壓縮套件之最上層目錄的內容:

    ls -l "$SPEECHSDK_ROOT"
    

    目錄清單應包含合作夥伴通知和授權檔案。 此清單也應該包含其中保存標頭 (.h) 檔的 include 目錄,以及其中保存 arm32、arm64、x64 和 x86 程式庫的 lib 目錄。

    路徑 描述
    license.md 授權
    ThirdPartyNotices.md 合作夥伴通知
    REDIST.txt 轉散發注意事項
    include C++ 的必要標頭檔
    lib/arm32 要連結您應用程式所需的 ARM32 原生程式庫
    lib/arm64 要連結您應用程式所需的 ARM64 原生程式庫
    lib/x64 要連結您的應用程式所需的 x64 原生程式庫
    lib/x86 要連結您的應用程式所需的 x86 原生程式庫

設定 Go 環境

下列步驟可讓 Go 環境尋找語音 SDK。

  1. 由於繫結仰賴 cgo,因此您必須設定環境變數,讓 Go 可以找到 SDK。

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    重要

    <architecture> 取代為您的 CPU 的處理器架構:x64arm32arm64

  2. 若要執行應用程式和 SDK,您必須告訴作業系統要在哪裡尋找程式庫。

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    重要

    <architecture> 取代為您的 CPU 的處理器架構:x64arm32arm64

參考文件 | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Java 的 語音 SDK

平台需求

選擇您的目標環境:

適用於 Java 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位元目標結構。 需要 Windows 10 或更新版本。

為您的平台安裝 適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft Visual C++ 可轉散發套件。 第一次安裝此套件時可能需要重新啟動。

適用於 Java 的語音 SDK 不支援 ARM64 上的 Windows。

安裝 Java 開發套件,例如 Azul Zulu OpenJDKMicrosoft Build of OpenJDK 或您慣用的 JDK 也應該可以運作。

安裝適用於 Java 的語音 SDK

某些指示會使用特定的 SDK 版本,例如 1.24.2。 若要檢查最新版本,請搜尋我們的 GitHub 存放庫

選擇您的目標環境:

本指南說明如何在 Java 執行階段上安裝適用於 Java 的語音 SDK

受支援的作業系統

適用於 Java 語音 SDK 套件適用於下列作業系統:

請遵循下列步驟,使用 Apache Maven 安裝適用於 Java 的語音 SDK:

  1. 安裝 Apache Maven

  2. 開啟您想要新專案的命令提示字元,並建立新的 pom.xml 檔案。

  3. 將下列 XML 內容複製到 pom.xml

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.40.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. 執行下列 Maven 命令來安裝語音 SDK 和相依性。

    mvn clean dependency:copy-dependencies
    

參考文件 | 套件 (npm) | GitHub 上的其他範例 | 程式庫原始程式碼

在本快速入門中,您會安裝適用於 JavaScript 的 語音 SDK

適用於 JavaScript 的語音 SDK 可做為 npm 套件使用。 請參閱 microsoft-cognitiveservices-speech-sdk 及其隨附的 GitHub 存放庫 cognitive-services-speech-sdk-js

平台需求

瞭解 Node.js與 用戶端網頁瀏覽器之間的架構影響。 例如,伺服器端應用程式無法使用 文件物件模型 (DOM)。 用戶端應用程式無法使用 Node.js 檔案系統

安裝適用於 JavaScript 的語音 SDK

根據目標環境而定,使用下列其中一個指南:

本指南說明如何安裝適用於 JavaScript 的語音 SDK,以與 Node.js 搭配使用。

  1. 安裝 Node.js

  2. 建立新目錄、執行 npm init,然後逐步完成其提示。

  3. 若要安裝適用於 JavaScript 的語音 SDK,請執行下列 npm install 命令:

    npm install microsoft-cognitiveservices-speech-sdk
    

如需詳細資訊,請參閱 Node.js 樣本

使用語音 SDK

  • 新增下列匯入陳述式,以在 JavaScript 專案中使用語音 SDK:

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

如需 import 的詳細資訊,請參閱在 JavaScript 網站上匯出和匯入

或者,您可以使用需要陳述式:

const sdk = require("microsoft-cognitiveservices-speech-sdk");

參考文件 | 套件 (下載) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Objective-C 的 語音 SDK

提示

如需如何使用適用於 Swift 的語音 SDK 詳細資訊,請參閱 將 Objective-C 匯入 Swift

安裝適用於 Objective-C 的語音 SDK

適用於 Objective-C 的語音 SDK 原生為 Mac x64 和 ARM 系統的 CocoaPod 套件。

Mac 的系統需求:

  • macOS 10.14 版或更新版本

macOS CocoaPod 套件可供下載,並可與 Xcode 9.4.1 (或更新版本) 整合式開發環境 (IDE) 搭配使用。

  1. 前往 .xcodeproj 專案檔所在的 Xcode 目錄。

  2. 執行 pod init 以建立名為 Podfile的 Pod 檔案。

  3. Podfile 的內容取代為以下內容。 將 target 名稱從 AppName 更新為應用程式的名稱。 視需要更新平台或 Pod 版本。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.40.0'
    end
    
  4. 執行 pod install 來安裝語音 SDK。

或者,下載 二進位 CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增對已擷取 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。

注意

.NET 開發人員可以使用 Xamarin.Mac 應用程式架構來建置原生 macOS 應用程式。 如需詳細資訊,請參閱 Xamarin.Mac

參考文件 | 套件 (下載) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Swift 的 語音 SDK

提示

如需如何使用適用於 Swift 的語音 SDK 詳細資訊,請參閱 將 Objective-C 匯入 Swift

安裝適用於 Swift 的語音 SDK

適用於 Swift 的語音 SDK 原生為 Mac x64 和 ARM 系統的 CocoaPod 套件。

Mac 的系統需求:

  • macOS 10.14 版或更新版本

macOS CocoaPod 套件可供下載,並可與 Xcode 9.4.1 (或更新版本) 整合式開發環境 (IDE) 搭配使用。

  1. 前往 .xcodeproj 專案檔所在的 Xcode 目錄。

  2. 執行 pod init 以建立名為 Podfile的 Pod 檔案。

  3. Podfile 的內容取代為以下內容。 將 target 名稱從 AppName 更新為應用程式的名稱。 視需要更新平台或 Pod 版本。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.40.0'
    end
    
  4. 執行 pod install 來安裝語音 SDK。

或者,下載 二進位 CocoaPod 並擷取其內容。 在您的 Xcode 專案中,新增對已擷取 MicrosoftCognitiveServicesSpeech.xcframework 資料夾及其內容的參考。

注意

.NET 開發人員可以使用 Xamarin.Mac 應用程式架構來建置原生 macOS 應用程式。 如需詳細資訊,請參閱 Xamarin.Mac

參考文件 | 套件 (PyPi) | GitHub 上的其他範例

在本快速入門中,您會安裝適用於 Python 的 語音 SDK

平台需求

適用於 Python 的語音 SDK 與 Windows、Linux 和 macOS 相容。

在 Windows 上,您必須使用 64 位元目標結構。 需要 Windows 10 或更新版本。

為您的平台安裝 適用於 Visual Studio 2015、2017、2019 和 2022 的 Microsoft Visual C++ 可轉散發套件。 第一次安裝此套件時可能需要重新啟動。

重要

確定已安裝相同目標架構的套件。 例如,如果您安裝 x64 可轉散發套件,則必須安裝 x64 Python 套件。

安裝 Python 從 3.8 或更新的版本。

  • 若要檢查您的安裝,請開啟終端機,然後執行命令 python --version。 如果 Python 已正確安裝,您會收到類似 Python 3.8.10 的回應。

  • 如果您使用 macOS 或 Linux,則可能需要改為執行 命令 python3 --version

    若要使用 python 而非 python3,請執行 alias python='python3' 以設定別名。 語音 SDK 快速入門範例會指定 python 使用方式。

安裝適用於 Python 的語音 SDK

在安裝適用於 Python 的語音 SDK 之前,請務必滿足平台需求

從 PyPI 安裝

若要安裝適用於 Python 的語音 SDK,請在主控台視窗中執行此命令:

pip install azure-cognitiveservices-speech

升級至最新的語音 SDK

若要升級至最新的語音 SDK,請在主控台視窗中執行此命令:

pip install --upgrade azure-cognitiveservices-speech

您可以檢查 azure.cognitiveservices.speech.__version__ 變數來確認目前所安裝的適用於 Python 語音 SDK 版本。 例如,在主控台視窗中執行此命令:

pip list

使用語音 SDK

新增下列匯入陳述式,以在 Python 專案中使用語音 SDK:

import azure.cognitiveservices.speech as speechsdk