Recherche automatique de caractéristiques avec des modèles MLflow sur Databricks

La Mise en service de modèles peut rechercher automatiquement les valeurs de fonctionnalités à partir de magasins en ligne ou de tables en ligne publiés. Cet article explique comment utiliser des magasins en ligne. Pour obtenir des informations sur l’utilisation des tables en ligne, consultez Utiliser des tables en ligne pour le service des fonctionnalités en temps réel.

Spécifications

  • Le modèle doit avoir été enregistré avec FeatureEngineeringClient.log_model (pour l’ingénierie des fonctionnalités dans le catalogue Unity) ou FeatureStoreClient.log_model (pour le Feature Store d’espace de travail, nécessite la version 0.3.5 et ultérieure).
  • Le magasin en ligne doit être publié avec des informations d’identification en lecture seule.

Notes

Vous pouvez publier la table de caractéristiques à tout moment avant le déploiement du modèle, y compris après l’entraînement de ce dernier.

Recherche automatique de caractéristiques

La mise en service de modèles Azure Databricks prend en charge la recherche automatique de caractéristiques à partir des magasins en ligne suivants :

  • Azure Cosmos DB (v0.5.0 et versions ultérieures)

La recherche automatique de caractéristiques est prise en charge pour les types de données suivants :

  • IntegerType
  • FloatType
  • BooleanType
  • StringType
  • DoubleType
  • LongType
  • TimestampType
  • DateType
  • ShortType
  • DecimalType
  • ArrayType
  • MapType

Remplacer les valeurs de caractéristiques lors du scoring du modèle en ligne

Toutes les caractéristiques requises par le modèle (journalisé avec FeatureEngineeringClient.log_model ou FeatureStoreClient.log_model) sont automatiquement recherchées dans les magasins en ligne en vue du scoring du modèle. Pour remplacer des valeurs de caractéristiques lors du scoring d’un modèle avec une API REST avec Mise en service de modèles, incluez les valeurs de caractéristiques dans le cadre de la charge utile de l’API.

Notes

Les nouvelles valeurs de caractéristiques doivent être conformes au type de données de la caractéristique comme prévu par le modèle sous-jacent.

Exemples de Notebook : catalogue Unity

Avec Databricks Runtime 13.3 LTS et versions ultérieures, toute table Delta dans Unity Catalog avec une clé primaire peut être utilisée comme table de caractéristiques. Lorsque vous utilisez une table enregistrée dans Unity Catalog en tant que table de fonctionnalités, toutes les fonctionnalités de Unity Catalog sont automatiquement disponibles pour la table de fonctionnalités.

Cet exemple de notebook montre comment publier des fonctionnalités dans un magasin en ligne, puis servir un modèle formé qui recherche automatiquement des fonctionnalités à partir du magasin en ligne.

Boutique en ligne avec bloc-notes d'exemple de catalogue Unity

Obtenir le notebook

Exemples de Notebook : Espace de travail Feature Store

Cet exemple de notebook montre comment publier des fonctionnalités dans un magasin en ligne, puis servir un modèle formé qui recherche automatiquement des fonctionnalités à partir du magasin en ligne.

Carnet d'exemple de boutique en ligne

Obtenir le notebook