機械学習とディープ ラーニング用のデータの前処理

Databricks Feature Store を使用して、新機能の作成、既存の機能の調査と再利用、機械学習モデルのトレーニングとスコア付けのための機能の選択、リアルタイムの推論のための低遅延のオンライン ストアへの機能の公開を行うことができます。

大規模なデータセットでは、Spark SQL と MLlib を特徴エンジニアリングに使用することができます。 Databricks Runtime ML に含まれる scikit-learn などのサードパーティのライブラリにも、役に立つヘルパー メソッドが用意されています。 例については、scikit-learn と MLlib に対する以下の機械学習ノートブックを参照してください。

より複雑なディープ ラーニングの特徴の処理を行うために、このノートブックの例では、特徴エンジニアリングのための転移学習の使用方法を示しています。