Custom Speech の CI/CD

[アーティクル]
01/19/2024

トレーニングおよびテストデータに更新を適用するときに、Custom Speech モデルの継続的な改善が可能になるように、自動トレーニング、テスト、リリース管理を実装します。 CI/CD ワークフローを効果的に実装することで、確実に最高のパフォーマンスの Custom Speech モデルのエンドポイントを常に使用できるようになります。

継続的インテグレーション (CI) は、共有リポジトリで更新を頻繁にコミットし、それに対して自動ビルドを実行するエンジニアリング手法です。 Custom Speech の CI ワークフローでは、データソースから新しいモデルがトレーニングされ、新しいモデルに対して自動テストが実行されて、確実に以前のモデルよりも優れたパフォーマンスを発揮するようにします。

継続的デリバリー (CD) では、CI プロセスからモデルが受け取られ、改善された Custom Speech モデルごとにエンドポイントが作成されます。 CD を使用すると、エンドポイントをソリューションに簡単に統合できます。

カスタム CI/CD ソリューションも使用できますが、堅牢で事前に構築されたソリューションの場合は、GitHub Actions を使用して CI/CD ワークフローを実行する Speech DevOps テンプレートリポジトリをお使いください。

Custom Speech の CI/CD ワークフロー

これらのワークフローの目的は、各 Custom Speech モデルの認識の正確性を確実に以前のビルドよりも向上させることです。テストデータやトレーニングデータの更新によって正確性が向上する場合、これらのワークフローによって新しい Custom Speech エンドポイントが作成されます。

GitHub や Azure DevOps などの Git サーバーを使用すると、マージや pull request などの特定の Git イベントが発生したときに、自動ワークフローを実行できます。たとえば、テストデータの更新が "メイン" ブランチにプッシュされたときに、CI ワークフローをトリガーできます。 Git サーバーによってツールも異なりますが、ビルドサーバー上で実行されるように、スクリプトコマンドラインインターフェイス (CLI) コマンドを作成することができます。

その過程で、ワークフローでは、元のコミットまたはバージョンまでさかのぼって追跡できるように、データ、テスト、テストファイル、モデル、エンドポイントに名前を付けて保存するようにします。また、このような資産に名前を付けると、テストデータとトレーニングデータを更新した後に作成された資産を簡単に確認できるようになります。

データの更新をテストするための CI ワークフロー

CI/CD ワークフローの主な目的は、トレーニングデータを使用して新しいモデルを構築することと、テストデータを使用してそのモデルをテストし、ワードエラー率 (WER) がそれまでの最高のパフォーマンスのモデル ("ベンチマークモデル") と比較して改善されたかどうかを確認することです。新しいモデルのパフォーマンスが向上すると、新しいモデルが以降のモデルと比較される新しいベンチマークモデルになります。

データの更新をテストするための CI ワークフローでは、更新されたテストデータを使用して現在のベンチマークモデルを再テストし、変更された WER を計算する必要があります。こうすることで、新しいモデルの WER とベンチマークの WER を比較するときに、両方のモデルが同じテストデータに対してテストされ、同じように比較されていることが保証されます。

このワークフローは、テストデータの更新時にトリガーされます。

更新されたテストデータに対してベンチマークモデルをテストします。
更新されたデータを使用して、ベンチマークモデルの WER を含むテスト出力を保存します。
これらのテストの WER は、今後のモデルが超える必要のある新しいベンチマーク WER になります。
テストデータの更新では、CD ワークフローは実行されません。

トレーニングデータの更新の CI ワークフロー

トレーニングデータの更新とは、カスタムモデルの更新を意味します。

このワークフローは、トレーニングデータの更新時にトリガーされます。

更新されたトレーニングデータを使用して新しいモデルをトレーニングします。
テストデータに対して新しいモデルをテストします。
WER を含むテスト出力を保存します。
新しいモデルの WER とベンチマークモデルの WER を比較します。
WER が改善されない場合は、ワークフローを停止します。
WER が改善された場合は、CD ワークフローを実行して Custom Speech エンドポイントを作成します。

CD ワークフロー

トレーニングデータを更新してモデルの認識が向上した後は、CD ワークフローが自動的に実行され、そのモデルの新しいエンドポイントが作成され、そのエンドポイントが使用可能になり、ソリューションで使用できるようになります。

リリース管理

ほとんどのチームでは、運用環境へのデプロイに手動のレビューと承認プロセスが必要です。運用環境へのデプロイの場合、必ず開発チームの主要担当者がサポートできるとき、またはトラフィックの少ない時間帯に実行することをお勧めします。

Custom Speech ワークフロー用のツール

Custom Speech の CI/CD 自動化ワークフローには、次のツールを使用します。

Azure CLI。Azure サービスプリンシパルの認証を作成し、Azure サブスクリプションのクエリを実行し、Azure BLOB にテスト結果を格納するために使用します。
Azure AI Speech CLI。コマンドラインまたは自動ワークフローから音声サービスを操作するために使用します。

GitHub Actions を使用する Custom Speech 用の DevOps ソリューション

Custom Speech 用に既に実装されている DevOps ソリューションについては、Speech DevOps テンプレートリポジトリを参照してください。テンプレートのコピーを作成し、GitHub Actions を使用したテスト、トレーニング、バージョン管理を含む堅牢な DevOps システムでカスタムモデルの開発を開始します。このリポジトリには、設定を支援し、ワークフローを説明するためのサンプルテストとトレーニングデータが用意されています。初期セットアップ後、サンプルデータをご自分のプロジェクトデータに置き換えます。

Speech DevOps テンプレートリポジトリには、以下のインフラストラクチャと詳細なガイダンスが用意されています。

テンプレートリポジトリを GitHub アカウントにコピーし、GitHub Actions CI/CD ワークフロー用の Azure リソースとサービスプリンシパルを作成します。
"開発者の内部ループ" の手順を確認します。機能ブランチのトレーニングおよびテストデータを更新し、一時的な開発モデルを使用して変更をテストし、pull request を発生させて変更を提案および確認します。
トレーニングデータが pull request で "メイン" に更新されたら、GitHub Actions CI ワークフローを使用してモデルをトレーニングします。
自動正確性テストを実行し、モデルのワードエラー率 (WER) を確立します。テスト結果を Azure BLOB に格納します。
WER が改善されたら、CD ワークフローを実行してエンドポイントを作成します。

次のステップ

Speech DevOps テンプレートリポジトリを使用し、GitHub Actions を使用して Custom Speech 用の DevOps を実装します。

次の方法で共有

Custom Speech の CI/CD

Custom Speech の CI/CD ワークフロー

データの更新をテストするための CI ワークフロー

トレーニングデータの更新の CI ワークフロー

CD ワークフロー

リリース管理

Custom Speech ワークフロー用のツール

GitHub Actions を使用する Custom Speech 用の DevOps ソリューション

次のステップ

フィードバック

フィードバック

その他のリソース

次の方法で共有

Custom Speech の CI/CD

Custom Speech の CI/CD ワークフロー

データの更新をテストするための CI ワークフロー

トレーニング データの更新の CI ワークフロー

CD ワークフロー

リリース管理

Custom Speech ワークフロー用のツール

GitHub Actions を使用する Custom Speech 用の DevOps ソリューション

次のステップ

フィードバック

フィードバック

その他のリソース

トレーニングデータの更新の CI ワークフロー