CSV コンポーネントへの変換

この記事では Azure Machine Learning デザイナーのコンポーネントについて説明します。

このコンポーネントは、R または Python スクリプトのモジュールでダウンロード、エクスポート、または共有できる CSV 形式にデータセットを変換するために使用します。

CSV 形式の詳細

"comma-separated values (コンマ区切り値)" の略である CSV 形式は、多くの外部機械学習ツールで使用されるファイル形式です。 CSV は、R や Python などのオープンソース言語を使用するときの一般的な交換形式です。

作業の大部分を Azure Machine Learning で行う場合でも、データセットを CSV に変換して外部ツールで使用すると便利なときがあります。 次に例を示します。

  • CSV ファイルをダウンロードして Excel で開いたり、リレーショナル データベースにインポートしたりします。
  • CSV ファイルをクラウド ストレージに保存し、Power BI からそれに接続して視覚エフェクトを作成します。
  • CSV 形式を使用して、R や Python で使用するためにデータを準備します。

データセットを CSV に変換すると、CSV は Azure Machine Learning ワークスペースに保存されます。 Azure ストレージ ユーティリティを使用して、ファイルを直接開いて使用することができます。 デザイナーで CSV にアクセスすることもできます。それには、 [CSV に変換] コンポーネントを選択し、右側のパネルの [出力] タブでヒストグラム アイコンを選択して出力を表示します。 CSV は、結果フォルダーからローカル ディレクトリにダウンロードできます。

CSV への変換を構成する方法

  1. CSV への変換コンポーネントをパイプラインに追加します。 このコンポーネントは、デザイナーの [データ変換] グループ内にあります。

  2. データセットを出力する任意のコンポーネントにそれを接続します。

  3. パイプラインを送信します。

結果

[CSV に変換] の右側のパネルにある [出力] タブを選択し、 [Port outputs](ポートの出力) の下にあるいずれかのアイコンを選択します。

  • データセットの登録: このアイコンを選択して、CSV ファイルを別のデータセットとして Azure Machine Learning ワークスペースに保存して戻します。 データセットは、コンポーネント ツリーの [My Datasets](マイ データセット) セクションにコンポーネントとして表示されます。

  • View output (出力の表示) :目のアイコンを選択し、指示に従って Results_dataset フォルダーを参照し、data.csv ファイルをダウンロードします。

次のステップ

Azure Machine Learning で使用できる一連のコンポーネントを参照してください。