AutoML とは?

Databricks AutoML は、機械学習をデータセットに自動的に適用するのに役立ちます。 データセットを指定し、予測ターゲットを特定します。一方で、AutoML はモデル トレーニング用にデータセットを準備します。 その後、AutoML は、複数のモデルを作成、調整、評価する一連の試用版を実行して記録します。 モデルの評価の後で、AutoML は、結果を表示し、各試用版の実行のソースコードが含まれた Python ノートブックを提供するため、ユーザーはコードを検討、再現、変更できます。 また、AutoML は、データセットの概要統計を計算し、ノートブックにその情報を保存するため、ユーザーは後で確認できます。

Databricks AutoML は、回帰、分類、予測の問題に使用できます。 詳細については、「Azure Databricks AutoML のしくみ」を参照してください。

必要条件

  • Databricks Runtime 9.1 ML 以降 一般提供 (GA) バージョンの場合、Databricks Runtime 10.4 LTS ML 以降。
    • 時系列予測の場合は、Databricks Runtime 10.0 ML 以降を使用します。
    • Databricks Runtime 9.1 LTS ML 以降では、AutoML は databricks-automl-runtime パッケージに依存します。このパッケージには、AutoML の外部で役立つコンポーネントが含まれています。また、AutoML トレーニングによって生成されたノートブックを簡略化するのにも役立ちます。 databricks-automl-runtime は、PyPI で使用できます。
  • Databricks Runtime for Machine Learning にプレインストールされているライブラリ以外の追加ライブラリはクラスターにインストールしないようにする必要があります。
    • 既存のライブラリ バージョンに変更 (削除、アップグレード、またはダウングレード) を加えると、互換性がないことが原因で実行が失敗します。
  • AutoML は、共有アクセス モード クラスターと互換性がありません。
  • AutoML で Unity Catalog を使用するには、クラスター アクセス モード単一ユーザーであり、クラスターの指定された単一ユーザーである必要があります。

次の手順