オーケストレーション ワークフロー モデルをトレーニングする

トレーニングは、モデルがラベル付きの発話から学習するプロセスです。 トレーニングが完了した後、モデルのパフォーマンスを表示できます。

モデルをトレーニングするには、トレーニング ジョブを開始します。 正常に完了したジョブでのみモデルが作成されます。 トレーニング ジョブは、7 日後に期限切れになります。この期間を過ぎると、ジョブの詳細を取得できなくなります。 トレーニング ジョブが正常に完了し、モデルが作成されていれば、ジョブの期限切れによってモデルが影響を受けることはありません。 一度に実行できるトレーニング ジョブは 1 つのみで、同じプロジェクトで他のジョブを開始することはできません。

トレーニング時間は、単純なプロジェクトの処理のときは数秒で済みますが、発話数の上限に達したときは数時間かかります。

モデルの評価は、トレーニングが正常に完了した後に自動的にトリガーされます。 評価プロセスは、最初にトレーニング済みモデルを使用してテスト セット内の発話に対して予測を実行し、予測した結果と指定されているラベル (真実のベースラインを確立するもの) を比較します。 その結果が返されるので、モデルのパフォーマンスを確認することができます。

前提条件

詳細については、「プロジェクト開発サイクル」を参照してください。

データの分割

トレーニング プロセスを開始する前に、プロジェクト内のラベル付き発話はトレーニング用セットとテスト用セットに分割されます。 これらはそれぞれ異なる機能を提供します。 トレーニング用セットは、モデルのトレーニングに使用されます。このセットから、モデルはラベル付き発話を学習します。 テスト用セットは、トレーニング時には導入されず、評価時にのみモデルに導入されるブラインド セットです。

モデルが正常にトレーニングされた後、そのモデルを使用して、テスト用セット内の発話から予測を行うことができます。 これらの予測は、評価メトリックの計算に使用されます。

トレーニング用とテスト用の両方のセットで、すべての意図が適切に表現されているか確認することをお勧めします。

オーケストレーション ワークフローでは、データの分割方法として次の 2 つがサポートされています。

  • トレーニング用データからテスト用セットを自動分割: システムにより、選択した割合に従って、タグ付けされたデータがトレーニング用セットとテスト用セットに分割されます。 推奨される分割の割合は、トレーニング用 80%、テスト用 20% です。

注意

[トレーニング用データからテスト用セットを自動分割] オプションを選択した場合、トレーニング用セットに割り当てられたデータのみが、指定された割合に従って分割されます。

  • トレーニング用データとテスト用データの手動分割を使用: この方法を使用すると、ユーザーは、どの発話をどのセットに所属させるか定義できます。 この手順は、ラベル付け中にテスト用セットに発話を追加した場合にのみ使用できます。

注意

接続されていない意図のトレーニング用データセットにのみ発話を追加できます。

モデルのトレーニング

トレーニング ジョブを開始する

Language Studio 内からモデルのトレーニングを開始するには、次の手順を行います。

  1. 左側のメニューから [トレーニング ジョブ] を選択します。

  2. 上部のメニューから [Start a training job] (トレーニング ジョブの開始) を選択します。

  3. [新しいモデルのトレーニング] を選択し、テキスト ボックスにモデル名を入力します。 また、[既存のモデルを上書きする] オプションを選択し、ドロップダウン メニューから上書きするモデルを選択することにより、既存のモデルを上書きすることもできます。 トレーニング済みモデルを上書きすると、元に戻すことはできません。ただし、新しいモデルをデプロイするまで、デプロイされているモデルには影響しません。

    発話にタグ付けする際に [your project to manually split your data] (プロジェクトでデータを手動で分割する) を有効にした場合、2 つのデータ分割オプションが表示されます。

    • トレーニング用データからテスト用セットを自動分割: タグ付けされた発話が、選択した割合に従ってランダムにトレーニング用セットとテスト用セットに分割されます。 既定の分割割合は、トレーニング用が 80%、テスト用が 20% です。 これらの値を変更するには、変更するセットを選択し、新しい値を入力します。

    注意

    [トレーニング用データからテスト用セットを自動分割] オプションを選択した場合、トレーニング用セット内の発話のみが指定された割合に従って分割されます。

    • トレーニング用データとテスト用データの手動分割を使用: プロジェクトのタグ付け手順中に、各発話をトレーニング用セットまたはテスト用セットに割り当てます。

    注意

    [トレーニング用データとテスト用データの手動分割を使用] オプションは、タグ データ ページでテスト用セットに発話を追加する場合にのみ有効になります。 それ以外の場合は無効になります。

    会話相互理解プロジェクトの [モデルのトレーニング] ページのスクリーンショット。

  4. [トレーニング] ボタンを選択します。

注意

  • 正常に完了したトレーニング ジョブでのみ、モデルが生成されます。
  • トレーニングは、タグ付けされたデータのサイズに応じて、数分から数時間かかる場合があります。
  • 一度に実行できるトレーニング ジョブは 1 つだけです。 実行中のジョブが完了するまで、同じプロジェクト内で他のトレーニング ジョブを開始することはできません。

トレーニング ジョブの状態を取得する

一覧からトレーニング ジョブ ID を選択します。サイド ペインが表示され、そのジョブの [トレーニングの進行状況][ジョブの状態]、その他の詳細を確認できます。

トレーニング ジョブのキャンセル

Language Studio内からトレーニング ジョブをキャンセルするには、[モデルのトレーニング] ページに移動します。 キャンセルするトレーニング ジョブを選択し、上部のメニューから [キャンセル] を選択します。

次のステップ