チュートリアル: Azure Databricks でのエンド ツー エンド ML モデル

現実の世界での機械学習は煩雑です。 データ ソースに不足値が含まれていたり、冗長な行が含まれていたり、メモリに収まらない可能性もあります。 特徴エンジニアリングには多くの場合、ドメインの専門知識が求められますが、単調な作業になる可能性があります。 モデリングではデータ サイエンスとシステム エンジニアリングが混在する場合が多々生じるため、アルゴリズムだけでなく、マシン アーキテクチャと分散システムに関する知識も必要になります。

Azure Databricks はこのプロセスを簡略化します。 次の 10 分間のチュートリアル ノートブックでは、表形式データに対する機械学習モデルのトレーニングのエンドツーエンドの例が示されています。

このノートブックをインポートして自分で実行することも、独自で使用するためにコード スニペットをコピーし、そのアイデアを活かすこともできます。

ノートブック

ワークスペースで Unity Catalog が有効になっている場合は、次のバージョンのノートブックを使用します。

Databricks で scikit-learn と MLflow の統合を使用する (Unity Catalog)

ノートブックを入手

ワークスペースで Unity Catalog が有効になっていない場合は、次のバージョンのノートブックを使用します。

Databricks で scikit-learn と MLflow の統合を使用する

ノートブックを入手