Azure Machine Learning デザイナーのアルゴリズムとコンポーネントのリファレンス

[アーティクル]
04/04/2023

適用対象: Python SDK azure-ai-ml v2 (現行)

Note

デザイナーは、従来の事前構築済みコンポーネントとカスタムコンポーネントの 2 種類のコンポーネントをサポートします。これら 2 種類のコンポーネントには互換性がありません。

従来の事前構築済みコンポーネントは、主にデータ処理や従来の機械学習タスク (回帰や分類など) に事前構築済みのコンポーネントを提供します。この種類のコンポーネントは引き続きサポートされますが、新しいコンポーネントは追加されません。

カスタムコンポーネントを使用すると、独自のコードをコンポーネントとして提供できます。ワークスペース間での共有と、Studio、CLI、SDK インターフェイス間でのシームレスな作成ができるようになります。

この記事は、従来の事前構築済みコンポーネントに適用されます。

このリファレンスコンテンツでは、Azure Machine Learning デザイナーで使用可能な従来の各事前構築済みコンポーネントの技術的な背景について説明します。

各コンポーネントは、個別に実行可能なコードのセットを表し、必要な入力を取得して機械学習タスクを実行します。コンポーネントには、特定のアルゴリズムが含まれているものや、機械学習において重要なタスク (欠損値の置換、統計分析など) を実行するものがあります。

アルゴリズムの選択の詳細については、以下を参照してください。

ヒント

デザイナー内のパイプラインでは、特定のコンポーネントに関する情報を取得できます。コンポーネントの一覧またはコンポーネントの右側のウィンドウでコンポーネントをポイントするときに、コンポーネントカードの詳細情報リンクを選択します。

データ準備コンポーネント

機能	説明	コンポーネント
データの入力と出力	クラウドソースのデータをパイプラインに移動します。パイプラインの実行中に、結果や中間データを Azure Storage、SQL Database に書き込みます。また、クラウドストレージを使用して、パイプライン間でデータを交換します。	データの手動入力データのエクスポートデータのインポート
[データの変換]	機械学習に固有のデータに対する操作 (データの正規化やビン分割、次元削減、さまざまなファイル形式の間でのデータの変換など)。	列の追加行の追加算術演算の適用 SQL 変換の適用見つからないデータのクリーンアップクリップの値 CSV への変換データセットへの変換インジケーター値への変換メタデータの編集データをビンにグループ化するデータの結合データの正規化パーティションとサンプル重複する行の削除 SMOTE 列変換の選択データセット内の列の選択データの分割
特徴選択	分析モデルの構築で使用する、関連する有用な機能のサブセットを選択します。	フィルターに基づく特徴選択順列の特徴量の重要度
統計関数	データサイエンスに関連するさまざまな統計的方法を提供します。	データの集計

機械学習のアルゴリズム

機能	説明	コンポーネント
回帰	値を予測します。	ブーストデシジョンツリー回帰デシジョンフォレスト回帰高速フォレスト分位点回帰線形回帰ニューラルネットワーク回帰ポワソン回帰
クラスタリング	データをグループ化します。	K-Means クラスタリング
分類	クラスを予測します。バイナリ (2 クラス) または多クラスのアルゴリズムを選択します。	多クラスの増幅デシジョンツリー多クラスデシジョンフォレスト多クラスロジスティック回帰多クラスニューラルネットワーク 1 対全多クラス One vs.One Multiclass 2 クラス平均化パーセプトロン 2 クラスブーストデシジョンツリー 2 クラスデシジョンフォレスト 2 クラスロジスティック回帰 2 クラスニューラルネットワーク 2 クラスサポートベクターマシン

モデルを構築および評価するためのコンポーネント

機能	説明	コンポーネント
モデルトレーニング	アルゴリズムを介してデータを実行します。	クラスタリングモデルのトレーニングモデルのトレーニング PyTorch モデルのトレーニングモデルのハイパーパラメーターの調整
モデルのスコアリングと評価	トレーニング済みモデルの正確性を測定します。	変換の適用クラスターへのデータの割り当てモデルのクロス検証モデルの評価画像モデルのスコア付けモデルのスコア付け
Python 言語	コードを記述し、それをコンポーネント内に埋め込んで、Python をパイプラインと統合します。	Python モデルの作成 Python スクリプトの実行
R 言語	コードを記述し、それをコンポーネント内に埋め込んで、R をパイプラインと統合します。	R スクリプトの実行
Text Analytics	構造化テキストと非構造化テキストの両方を操作するための特別な計算ツールを提供します。	単語からベクトルへの変換テキストからの N Gram 特徴抽出特徴ハッシュテキストの前処理 Latent Dirichlet Allocation Score Vowpal Wabbit Model (Vowpal Wabbit モデルのスコアリング) Train Vowpal Wabbit Model (Vowpal Wabbit モデルのトレーニング)
Computer Vision	画像データの前処理と画像認識関連のコンポーネント。	イメージ変換の適用イメージディレクトリへの変換イメージ変換の初期化イメージディレクトリの分割 DenseNet ResNet
推奨	推奨モデルを構築します。	レコメンダーの評価 SVD レコメンダーのスコア付けワイドかつディープなレコメンダーのスコア付け SVD レコメンダーのトレーニングワイドかつディープなレコメンダーのトレーニング
異常検出	異常検出モデルを構築します。	PCA ベースの異常検出異常検出モデルのトレーニング

Web サービス

Azure Machine Learning デザイナーでリアルタイムの推論を行うために必要な Web サービスコンポーネントについて説明します。

エラーメッセージ

Azure Machine Learning デザイナーでコンポーネントを使用しているときに発生する可能性のあるエラーメッセージと例外コードについて説明します。

コンポーネントの環境

デザイナーの組み込みコンポーネントはすべて、Microsoft によって提供される固定環境で実行されます。

以前、この環境は Python 3.6 に基づいていましたが、現在は Python 3.8 にアップグレードされています。このアップグレードは、Python 3.8 環境で自動的にコンポーネントで実行されるため透過的に行われ、ユーザーによる操作は必要ありません。環境の更新は、コンポーネントの出力とリアルタイム推論からのリアルタイムエンドポイントのデプロイに影響する可能性があります。詳しくは以下のセクションを参照してください。

コンポーネントの出力が以前の結果と異なる

Python バージョンが 3.6 から 3.8 にアップグレードされると、それに応じて組み込みコンポーネントの依存関係もアップグレードされる場合があります。そのため、一部のコンポーネントの出力が以前の結果と異なる場合があります。

Execute Python Script コンポーネントを使用しているときに、Python 3.6 に関連付けられているパッケージを以前にインストールしている場合は、次のようなエラーが発生する可能性があります。

"Could not find a version that satisfies the requirement. (要件を満たすバージョンが見つかりません。)"
"No matching distribution found. (一致するディストリビューションが見つかりません。)" 次に、Python 3.8 に適合するパッケージバージョンを指定し、パイプラインをもう一度実行する必要があります。

リアルタイム推論パイプラインからリアルタイムエンドポイントをデプロイに関する問題

以前に完了したリアルタイム推論パイプラインからリアルタイムエンドポイントを直接デプロイすると、エラーが発生する可能性があります。

推奨事項: 推論パイプラインを複製し、もう一度送信してから、リアルタイムエンドポイントにデプロイします。

次のステップ

チュートリアル:デザイナーで自動車の価格を予測するモデルを構築する