変換の適用コンポーネント

この記事では Azure Machine Learning デザイナーのコンポーネントについて説明します。

このコンポーネントを使用して、事前に計算された変換に基づいて入力データセットを変更します。 このコンポーネントは、推論パイプラインで変換を更新する必要がある場合に必要になります。

たとえば、データの正規化コンポーネントを使用してトレーニング データを正規化するために z スコアを使用した場合は、スコアリング フェーズ中も、トレーニング用に計算された z スコア値を使用することができます。 Azure Machine Learning では、正規化方法を変換として保存し、変換の適用を使用して、スコアリングの前の入力データに z スコアを適用することができます。

変換を保存する方法

デザイナーを使用すると、データ変換を データセット として保存し、他のパイプラインで使用できるようになります。

  1. 正常に実行されたデータ変換コンポーネントを選択します。

  2. [出力 + ログ] タブを選択します。

  3. 変換出力を検索し、 [データセットの登録] を選択して、コンポーネント パレットの [データセット] カテゴリにコンポーネントとして保存します。

変換の適用の使用方法

  1. [Apply Transformation](変換の適用) コンポーネントをパイプラインに追加します。 このコンポーネントは、コンポーネント パレットの[モデルのスコアリングと評価] セクションにあります。

  2. コンポーネント パレットの [データセット] で使用する保存済みの変換を検出します。

  3. 保存した変換の出力を Apply Transformation (変換の適用) コンポーネントの左側の入力ポートに接続します。

    そのデータセットには、この変換を最初に設計した対象データセットとまったく同じスキーマ (列数、列名、データ型) があるはずです。

  4. 目的のコンポーネントのデータセット出力を Apply Transformation (変換の適用) コンポーネントの右側の入力ポートに接続します。

  5. 新しいデータセットに変換を適用するには、パイプラインを送信します。

重要

トレーニング パイプラインで更新された変換が推論パイプラインでも適用可能であることを確認するには、トレーニング パイプラインで更新された変換が発生するたびに、次の手順に従う必要があります。

  1. トレーニング パイプラインで、[Select Columns Transform]\(列変換の選択) の出力をデータセットとして登録します。 Register dataset of component output
  2. 推論パイプラインで、TD- コンポーネントを削除し、前の手順で登録したデータセットで置き換えます。 Replace TD component

次のステップ

Azure Machine Learning で使用できる一連のコンポーネントを参照してください。