音声サービスでは、データのインポート、モデルの作成、モデルの精度のテスト、カスタム エンドポイントの作成、文字起こしのキューへのバッチ配置、およびサブスクリプションの管理に使用されるいくつかの REST API を操作するための Swagger 仕様を提供しています。 Speech Studio の Custom Speech 領域を介して使用することができる操作のほとんどは、これらの API を使用してプログラムにより実行することができます。
注意
音声サービスには、Speech to Text と Text to Speech の REST API がいくつか含まれています。
ただし、Swagger 仕様に記載されているのは、speech to text REST API と custom voice REST API だけです。 他のすべての Speech Service REST API の情報については、前の段落で参照されているドキュメントをご覧ください。
Swagger 仕様からコードを生成する
Swagger 仕様には、さまざまなパスをすばやくテストできるオプションが用意されています。 ただし、すべてのパスのコードを生成し、今後のソリューションの基盤にできる呼び出しの 1 つのライブラリを作成することが望ましい場合があります。 Speech to text REST API バージョン 3.1 用の Python ライブラリを生成するプロセスを見てみましょう。
Swagger は、お使いの Speech リソースのリージョンに設定する必要があります。 リージョンは、Azure portal の音声リソースの設定の [概要] 部分で確認できます。 サポートされているすべてのリージョンの一覧については、こちらで確認できます。
- ブラウザーで、https://editor.swagger.io に移動します
- [ファイル] を選択し、[URL のインポート] を選択します。
- URL
https://github.com/Azure/azure-rest-api-specs/blob/master/specification/cognitiveservices/data-plane/Speech/SpeechToText/stable/v3.1/speechtotext.json
を入力し、[OK] を選択します。 -
[クライアントの生成] をクリックし、[python] を選択します。 クライアント ライブラリがお使いのコンピューターに
.zip
ファイル形式でダウンロードされます。 - ダウンロード ファイルを解凍し、中身をすべて抽出します。 解凍には
tar -xf
を使用することもあります。 - 解凍したモジュールを Python 環境にインストールします。
pip install path/to/package/python-client
- インストールされるパッケージの名前は
swagger_client
です。 インストールが正常に終了したことを確認します。
python -c "import swagger_client"
生成した Python ライブラリは、GitHub 上の音声サービス サンプルで使用できます。