チュートリアル: Azure Databricks でのエンド ツー エンド ML モデル

現実の世界での機械学習は煩雑です。 データ ソースに不足値が含まれていたり、冗長な行が含まれていたり、メモリに収まらない可能性もあります。 特徴エンジニアリングには多くの場合、ドメインの専門知識が求められますが、単調な作業になる可能性があります。 モデリングではデータ サイエンスとシステム エンジニアリングが混在する場合が多々生じるため、アルゴリズムだけでなく、マシン アーキテクチャと分散システムに関する知識も必要になります。

Azure Databricks はこのプロセスを簡略化します。 次の 10 分間のチュートリアル ノートブックでは、表形式データに対する機械学習モデルのトレーニングのエンドツーエンドの例が示されています。 このノートブックをインポートして自分で実行することも、独自で使用するためにコード スニペットをコピーし、そのアイデアを活かすこともできます。

ノートブック

MLflow のエンドツーエンドのサンプル ノートブック

ノートブックを入手