Démarrage rapide : Créer une base de données de lac en tirant parti des modèles de base de données

Ce démarrage rapide vous donne un exemple complet de scénario sur la façon dont vous pouvez appliquer les modèles de base de données pour créer une base de données de lac, aligner les données sur votre nouveau modèle et utiliser l'expérience intégrée pour analyser les données.

Prérequis

  • Au minimum, des autorisations de rôle utilisateur Synapse sont requises pour explorer un modèle de base de données de lac à partir de la Galerie.
  • Les droits d'administrateur Synapse ou de contributeur Synapse sont requis dans l'espace de travail Azure Synapse pour créer une base de données lac.
  • Les autorisations de Storage Blob Data Contributor sont requises sur le lac de données lors de l'utilisation de l'option créer une table à partir du lac de données.

Créer une base de données de lac à partir de modèles de base de données

Utilisez la nouvelle fonctionnalité de modèles de base de données pour créer une base de données de lac que vous pouvez utiliser pour configurer votre modèle de données pour la base de données.

Pour notre scénario, nous allons utiliser le modèle de base de données Retail et sélectionner les entités suivantes :

  • RetailProduct (produit vendu au détail) : un produit est tout ce qui peut être proposé à un marché qui peut répondre aux besoins des clients potentiels. Ce produit est la somme de tous les attributs physiques, psychologiques, symboliques et de service qui lui sont associés.
  • Transaction : niveau le plus bas de l’activité du client ou de travail exécutable. Une transaction se compose d’un ou de plusieurs événements discrets.
  • TransactionLineItem (élément de ligne de transaction) : les composants d’une transaction sont répartis par produit et par quantité, à raison d’un par élément de ligne.
  • Party (partie) : une partie est une personne, une organisation, une entité juridique, une organisation sociale ou une unité commerciale présentant un intérêt pour l’entreprise.
  • Customer (client) : un client est une personne ou une entité légale qui a ou a acheté un produit ou service.
  • Channel (canal) : un canal est un moyen par lequel les produits ou services sont vendus et/ou distribués.

Le moyen le plus simple de trouver des entités est d'utiliser le champ de recherche situé au-dessus des différents domaines d'activité qui contiennent les tableaux.

Capture d'écran d'un exemple de modèle de base de données pour la vente au détail en cours d'utilisation.

Configurer la base de données de lac

Après avoir créé la base de données, assurez-vous que le compte de stockage et le chemin de fichier sont définis à l'endroit où vous souhaitez stocker les données. Le chemin d'accès sera par défaut le compte de stockage primaire dans Azure Synapse Analytics mais peut être modifié selon vos besoins.

Capture d'écran des propriétés d'une entité individuelle dans le modèle de base de données Retail.

Pour enregistrer votre mise en page et la rendre disponible dans Azure Synapse, publiez toutes les modifications. Cette étape termine la configuration de la base de données du lac et la rend disponible pour tous les composants dans Azure Synapse Analytics et en dehors.

Ingestion de données dans la base de données de lac

Pour ingérer des données dans la base de données de lac, vous pouvez exécuter des pipelines avec des mappages de flux de données sans code, qui disposent d’un connecteur de base de données d’espace de travail pour charger les données directement dans la table de base de données. Vous pouvez également utiliser les notebooks Spark interactifs pour ingérer des données dans les tables de base de données de lac :

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

Interroger les données

Une fois la base de données de lac créée, il existe différentes façons d’interroger les données. Actuellement, les bases de données SQL dans les pools SQL serverless sont prises en charge et comprennent automatiquement le format de base de données Lake nouvellement créé.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

L'autre façon d'accéder aux données dans Azure Synapse est d'ouvrir un nouveau notebook Spark et d'y utiliser l'expérience intégrée :

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

Effectuer l’apprentissage de modèles Machine Learning

Vous pouvez utiliser la base de données de lac pour entraîner vos modèles Machine Learning et évaluer les données. Pour plus d’informations, consulter Entraîner des modèles Machine Learning.

Étapes suivantes

Continuez à explorer les fonctionnalités du concepteur de base de données en suivant les liens ci-dessous.