次の方法で共有


クイック スタート: Speech SDK のインストール

リファレンス ドキュメント | パッケージ (NuGet) | GitHub 上のその他のサンプル

このクイックスタートでは、Speech SDK for C# をインストールします。

プラットフォームの要件

Speech SDK for C# は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビット ターゲット アーキテクチャを使う必要があります。 Windows 11 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK for C# をインストールする

Speech SDK for C# は NuGet パッケージとして提供されていて、.NET Standard 2.0 が実装されています。 詳細については、「Microsoft.CognitiveServices.Speech」を参照してください。

Speech SDK for C# は、次の dotnet add コマンドを使用して .NET CLI からインストールできます。

dotnet add package Microsoft.CognitiveServices.Speech

リファレンス ドキュメント | パッケージ (NuGet) | GitHub 上のその他のサンプル

このクイックスタートでは、Speech SDK for C++ をインストールします。

プラットフォームの要件

Speech SDK for C++ は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビット ターゲット アーキテクチャを使う必要があります。 Windows 11 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK for C++ をインストールする

Speech SDK for C++ は NuGet パッケージとして提供されています。 詳細については、「Microsoft.CognitiveServices.Speech」を参照してください。

Speech SDK for C++ は、次の dotnet add コマンドを使用して .NET CLI からインストールできます。

dotnet add package Microsoft.CognitiveServices.Speech

その他のオプションについては、これらのガイドに従ってください。

このガイドでは、Linux 用 Speech SDK をインストールする方法について説明します。

次の手順に従って、SDK をダウンロードしてインストールします。 これらのステップで、必須のライブラリとヘッダー ファイルを、.tar ファイルとしてダウンロードします。

  1. Speech SDK ファイルのディレクトリを選択します。 そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。 この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

    ホーム ディレクトリで speechsdk ディレクトリを使用する場合は、次のコマンドを実行します。

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. それが存在しない場合は、ディレクトリを作成します。

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして、それを抽出します。

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 展開されたパッケージの最上位ディレクトリの内容を検証します。

    ls -l "$SPEECHSDK_ROOT"
    

    ディレクトリの一覧にパートナー通知やライセンス ファイルが含まれているはずです。 リストには、ヘッダー (.h) ファイルを保持するインクルード ディレクトリと、arm32、arm64、x64 用のライブラリを保持する lib ディレクトリも含まれている必要があります。

    Path Description
    license.md License
    ThirdPartyNotices.md パートナーに関する通知
    REDIST.txt 再配布に関する通知
    include C++ に必要なヘッダー ファイル
    lib/arm32 アプリケーションをリンクするために必要な ARM32 のネイティブ ライブラリ
    lib/arm64 アプリケーションをリンクするために必要な ARM64 のネイティブ ライブラリ
    lib/x64 アプリケーションをリンクするために必要な x64 のネイティブ ライブラリ

リファレンス ドキュメント | パッケージ (Go) | GitHub 上のその他のサンプル

このクイックスタートでは、Speech SDK for Go をインストールします。

プラットフォームの要件

Speech SDK for Go では、x64 アーキテクチャの次のディストリビューションがサポートされています。

  • Ubuntu 20.04/22.04/24.04
  • Debian 11/12

Important

Linux ディストリビューションの最新の LTS リリースを使用してください。 たとえば、Ubuntu 20.04 LTS を使用している場合は、Ubuntu 20.04.X の最新リリースを使用してください。

Azure Cognitive Service for Speech SDK は、次の Linux システム ライブラリに依存します:

  • GNU C ライブラリの共有ライブラリ (POSIX Threads Programming ライブラリ、libpthreads など)。
  • OpenSSL ライブラリ バージョン 1.x (libssl1) または 3.x (libssl3) と証明書 (ca-certificates)。
  • ALSA アプリケーション向けの共有ライブラリ (libasound2)。

次の各コマンドを実行します。

sudo apt-get update
sudo apt-get install build-essential ca-certificates libasound2-dev libssl-dev wget

Go バイナリ バージョン 1.13 以降をインストールします。

Speech SDK for Go をインストールする

次の手順に従って、SDK をダウンロードしてインストールします。 これらのステップで、必須のライブラリとヘッダー ファイルを、.tar ファイルとしてダウンロードします。

  1. Speech SDK ファイルのディレクトリを選択します。 そのディレクトリを指すように SPEECHSDK_ROOT 環境変数を設定します。 この変数によって、後のコマンドでこのディレクトリを参照することが容易になります。

    ホーム ディレクトリで speechsdk ディレクトリを使用する場合は、次のコマンドを実行します。

    export SPEECHSDK_ROOT="$HOME/speechsdk"
    
  2. それが存在しない場合は、ディレクトリを作成します。

    mkdir -p "$SPEECHSDK_ROOT"
    
  3. Speech SDK バイナリを含む .tar.gz アーカイブをダウンロードして、それを抽出します。

    wget -O SpeechSDK-Linux.tar.gz https://aka.ms/csspeech/linuxbinary
    tar --strip 1 -xzf SpeechSDK-Linux.tar.gz -C "$SPEECHSDK_ROOT"
    
  4. 展開されたパッケージの最上位ディレクトリの内容を検証します。

    ls -l "$SPEECHSDK_ROOT"
    

    ディレクトリの一覧にパートナー通知やライセンス ファイルが含まれているはずです。 リストには、ヘッダー (.h) ファイルを保持するインクルード ディレクトリと、arm32、arm64、x64 用のライブラリを保持する lib ディレクトリも含まれている必要があります。

    Path Description
    license.md License
    ThirdPartyNotices.md パートナーに関する通知
    REDIST.txt 再配布に関する通知
    include C++ に必要なヘッダー ファイル
    lib/arm32 アプリケーションをリンクするために必要な ARM32 のネイティブ ライブラリ
    lib/arm64 アプリケーションをリンクするために必要な ARM64 のネイティブ ライブラリ
    lib/x64 アプリケーションをリンクするために必要な x64 のネイティブ ライブラリ

Go 環境を構成する

次の手順を実行して、Speech SDK を検索するための Go 環境を有効にします。

  1. バインドは cgo に依存するため、Go によって SDK が検出されるように環境変数を設定する必要があります。

    export CGO_CFLAGS="-I$SPEECHSDK_ROOT/include/c_api"
    export CGO_LDFLAGS="-L$SPEECHSDK_ROOT/lib/<architecture> -lMicrosoft.CognitiveServices.Speech.core"
    

    Important

    <architecture> を CPU のプロセッサ アーキテクチャ x64arm32、または arm64 に置き換えます。

  2. アプリケーションと SDK を実行するには、ライブラリがある場所をオペレーティング システムに示す必要があります。

    export LD_LIBRARY_PATH="$SPEECHSDK_ROOT/lib/<architecture>:$LD_LIBRARY_PATH"
    

    Important

    <architecture> を CPU のプロセッサ アーキテクチャ x64arm32、または arm64 に置き換えます。

リファレンス ドキュメント | GitHub 上のその他のサンプル

このクイックスタートでは、Speech SDK for Java をインストールします。

プラットフォームの要件

ターゲット環境を選択します。

Speech SDK for Java は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビット ターゲット アーキテクチャを使う必要があります。 Windows 11 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Speech SDK for Java は、ARM64 上の Windows をサポートしていません。

Azul Zulu OpenJDK などの Java Development Kit をインストールします。 Microsoft Build of OpenJDK またはお好みの JDK も機能する必要があります。

Speech SDK for Java をインストールする

一部の手順では、1.43.0 などの特定の SDK バージョンを使用します。 最新バージョンを確認するには、GitHub リポジトリを検索します。

ターゲット環境を選択します。

このガイドでは、Java Runtime で Java 用の Speech SDK をインストールする方法について説明します。

サポートされるオペレーティング システム

以下のオペレーティング システム用の Speech SDK for Java パッケージを入手できます。

Apache Maven を使用して Speech SDK for Java をインストールするには、次の手順に従います。

  1. Apache Maven をインストールします。

  2. 新しいプロジェクトの配置場所のコマンド プロンプトを開き、新しい pom.xml ファイルを作成します。

  3. 次の XML の内容を pom.xml にコピーします。

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
        <modelVersion>4.0.0</modelVersion>
        <groupId>com.microsoft.cognitiveservices.speech.samples</groupId>
        <artifactId>quickstart-eclipse</artifactId>
        <version>1.0.0-SNAPSHOT</version>
        <build>
            <sourceDirectory>src</sourceDirectory>
            <plugins>
            <plugin>
                <artifactId>maven-compiler-plugin</artifactId>
                <version>3.7.0</version>
                <configuration>
                <source>1.8</source>
                <target>1.8</target>
                </configuration>
            </plugin>
            </plugins>
        </build>
        <dependencies>
            <dependency>
            <groupId>com.microsoft.cognitiveservices.speech</groupId>
            <artifactId>client-sdk</artifactId>
            <version>1.43.0</version>
            </dependency>
        </dependencies>
    </project>
    
  4. 次の Maven コマンドを実行して、Speech SDK と依存関係をインストールします。

    mvn clean dependency:copy-dependencies
    

リファレンス ドキュメント | パッケージ (npm) | GitHub 上のその他のサンプル | ライブラリのソース コード

このクイックスタートでは、Speech SDK for JavaScript をインストールします。

JavaScript 用 Speech SDK は、npm パッケージとして使用できます。 microsoft-cognitiveservices-speech-sdk とそれに付随する GitHub リポジトリ cognitive-services-speech-sdk-js を参照してください。

プラットフォームの要件

Node.js とクライアント Web ブラウザー間での、アーキテクチャ的な意味合いについて説明します。 たとえば、ドキュメント オブジェクト モデル (DOM) はサーバー側アプリケーションでは使用できません。 Node.js ファイル システムはクライアント側アプリケーションでは使用できません。

Speech SDK for JavaScript をインストールする

ターゲット環境に応じて、次のガイドのいずれかを使用します。

このガイドでは、Node.js で使用する JavaScript 用の Speech SDK をインストールする方法について説明します。

  1. Node.js をインストールします。

  2. 新しいディレクトリを作成して npm init を実行し、そのプロンプトに従います。

  3. JavaScript 用 Speech SDK をインストールするには、次の npm install コマンドを実行します。

    npm install microsoft-cognitiveservices-speech-sdk
    

詳細については、Node.js サンプルを参照してください。

Speech SDK を使用する

  • JavaScript プロジェクトで Speech SDK を使用するための次の import ステートメントを追加します。

    import * as sdk from "microsoft-cognitiveservices-speech-sdk";
    

import の詳細については、JavaScript Web サイトの「エクスポートとインポート」を参照してください。

または、次のように require ステートメントを使用することもできます。

const sdk = require("microsoft-cognitiveservices-speech-sdk");

リファレンス ドキュメント | パッケージ (ダウンロード) | GitHub 上のその他のサンプル

このクイックスタートでは、Speech SDK for Objective-C をインストールします。

Tip

Speech SDK for Swift の使用の詳細については、「Objective-C を Swift にインポートする」をご覧ください。

Speech SDK for Objective-C をインストールする

Speech SDK for Objective-C は、Mac x64 および ARM ベース システム用の CocoaPod パッケージとしてネイティブに利用できます。

Mac のシステム要件:

  • macOS version 10.14以降

macOS CocoaPod パッケージは、ダウンロードして Xcode 9.4.1 以降の統合開発環境 (IDE) と共に使用することができます。

  1. .xcodeproj プロジェクト ファイルが置かれている Xcode ディレクトリに移動します。

  2. pod init を実行して、Podfile という名前のポッド ファイルを作成します。

  3. Podfile の内容を次の内容に置き換えます。 target の名前を AppName から実際のアプリの名前に更新します。 必要に応じて、プラットフォームまたはポッドのバージョンを更新します。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードして、その内容を抽出します。 Xcode プロジェクト内に、抽出した "MicrosoftCognitiveServicesSpeech.xcframework" フォルダーおよびその内容への参照を追加します。

リファレンス ドキュメント | パッケージ (ダウンロード) | GitHub 上のその他のサンプル

このクイックスタートでは、Speech SDK for Swift をインストールします。

Tip

Speech SDK for Swift の使用の詳細については、「Objective-C を Swift にインポートする」をご覧ください。

Speech SDK for Swift をインストールする

Speech SDK for Swift は、Mac x64 および ARM ベースのシステム用の CocoaPod パッケージとしてネイティブに利用できます。

Mac のシステム要件:

  • macOS version 10.14以降

macOS CocoaPod パッケージは、ダウンロードして Xcode 9.4.1 以降の統合開発環境 (IDE) と共に使用することができます。

  1. .xcodeproj プロジェクト ファイルが置かれている Xcode ディレクトリに移動します。

  2. pod init を実行して、Podfile という名前のポッド ファイルを作成します。

  3. Podfile の内容を次の内容に置き換えます。 target の名前を AppName から実際のアプリの名前に更新します。 必要に応じて、プラットフォームまたはポッドのバージョンを更新します。

    platform :osx, 10.14
    use_frameworks!
    
    target 'AppName' do
      pod 'MicrosoftCognitiveServicesSpeech-macOS', '~> 1.43.0'
    end
    
  4. pod install を実行して Speech SDK をインストールします。

または、バイナリ CocoaPod をダウンロードして、その内容を抽出します。 Xcode プロジェクト内に、抽出した "MicrosoftCognitiveServicesSpeech.xcframework" フォルダーおよびその内容への参照を追加します。

リファレンス ドキュメント | パッケージ (PyPi) | GitHub 上のその他のサンプル

このクイックスタートでは、Speech SDK for Python をインストールします。

プラットフォームの要件

Speech SDK for Python は、Windows、Linux、macOS との互換性があります。

Windows では、64 ビット ターゲット アーキテクチャを使う必要があります。 Windows 11 以降が必要です。

お使いのプラットフォームに対応した Visual Studio 2015、2017、2019、2022 の Microsoft Visual C++ 再頒布可能パッケージをインストールします。 このパッケージを初めてインストールする場合、再起動が必要になる可能性があります。

Important

ターゲットアーキテクチャ が同じパッケージをインストールするようにしてください。 たとえば、x64 の再頒布可能パッケージをインストールした場合には、x64 Python パッケージをインストールします。

Python の 3.8 以降のバージョンをインストールします。

  • インストールを確認するには、ターミナルを開いてコマンド python --version を実行します。 Python が正しくインストールされた場合、次のような応答が返されます: Python 3.8.10

  • macOS または Linux を使用している場合は、代わりにコマンド python3 --version を実行する必要があります。

    pythonの代わりにpython3を使用できるようにするには、実行alias python='python3'して別名を設定します。 Azure Cognitive Service for Speech SDK のクイックスタート サンプルでは、pythonの使用法を指定 します。

Speech SDK for Python をインストールする

Speech SDK for Python をインストールする前に、プラットフォーム要件を満たしていることを確認してください。

PyPI からインストールする

Speech SDK for Python をインストールするには、コンソール ウィンドウで次のコマンドを実行します。

pip install azure-cognitiveservices-speech

最新の Speech SDK にアップグレードする

最新の Speech SDK にアップグレードするには、コンソール ウィンドウで次のコマンドを実行します。

pip install --upgrade azure-cognitiveservices-speech

azure.cognitiveservices.speech.__version__ 変数を調べることで、現在インストールされている Speech SDK for Python のバージョンを確認できます。 たとえば、コンソール ウィンドウで次のコマンドを実行します。

pip list

Speech SDK を使用する

Python プロジェクトで Speech SDK を使用するための次の import ステートメントを追加します。

import azure.cognitiveservices.speech as speechsdk

コード サンプル

コード サンプルは、GitHub の Azure-Samples/cognitive-services-speech-sdk リポジトリで入手できます。 C# (ユニバーサル Windows プラットフォーム (UWP) を含む)、C++、Java、JavaScript (ブラウザーと Node.jsを含む)、Objective-C、Python、Swift のサンプルがあります。 Go のコード サンプルは、GitHub の Microsoft/cognitive-services-speech-sdk-go リポジトリにあります。