はじめに
機械学習はほとんどの人工知能ソリューションの基礎であり、大量のデータを使用して予測 モデルをトレーニングすることで機能します。
予測モデルをトレーニングするには、機械学習フレームワークを使用して、エンティティの 特徴 と、それらを予測する ラベル の間のリレーションシップを決定します。 たとえば、プロパティのサイズ、ベッドルームの数、郵便番号などの特徴に基づいて、住宅の予想価格を予測するモデルをトレーニングできます。
Azure Databricks は、複数の一般的な機械学習フレームワークをサポートする Apache Spark ベースのデータ処理プラットフォームを提供します。Scikit-Learn、PyTorch、TensorFlow などを含む。 このモジュールでは、Spark MLlib 機械学習フレームワークを使用して例を示しますが、説明する原則はすべての機械学習フレームワークに適用されます。