Pré-traiter des données pour le Machine Learning et le Deep Learning

Vous pouvez utiliser le magasin de fonctionnalités Databricks pour créer de nouvelles fonctionnalités, explorer et réutiliser des fonctionnalités existantes, sélectionner des fonctionnalités pour l’entraînement et l’évaluation de modèles Machine Learning, et publier des fonctionnalités dans des magasins en ligne à faible latence pour l’inférence en temps réel.

Sur les jeux de données volumineux, vous pouvez utiliser Spark SQL et MLlib pour l’ingénierie des caractéristiques. Les bibliothèques tierces incluses dans Databricks Runtime ML, par exemple scikit-Learn, fournissent également des méthodes d’assistance utiles. Pour obtenir des exemples, consultez les notebooks d’apprentissage automatique suivants pour scikit-Learn et MLlib :

Pour le traitement plus complexe des fonctionnalités de Deep Learning, cet exemple de notebook montre comment utiliser le mode de transfert d’apprentissage pour caractérisation :