Quickstart: Een nieuwe lake-database maken met behulp van databasesjablonen

Deze quickstart biedt u een volledig voorbeeldscenario over hoe u databasesjablonen kunt toepassen om een lake-database te maken, gegevens op uw nieuwe model kunt afstemmen en de geïntegreerde ervaring kunt gebruiken om de gegevens te analyseren.

Vereisten

  • Ten minste synapse-gebruikersrolmachtigingen zijn vereist voor het verkennen van een lake-databasesjabloon vanuit galerie.
  • Synapse-beheerdersmachtigingen of Synapse-inzenders zijn vereist voor de Azure Synapse werkruimte voor het maken van een lake-database.
  • Inzendermachtigingen voor Opslagblobgegevens zijn vereist voor data lake wanneer u de optie Tabel maken van data lake gebruikt.

Een lake-database maken van databasesjablonen

Gebruik de nieuwe functionaliteit voor databasesjablonen om een lake-database te maken die u kunt gebruiken om uw gegevensmodel voor de database te configureren.

Voor ons scenario gebruiken we de Retail databasesjabloon en selecteren we de volgende entiteiten:

  • RetailProduct : een product is alles wat aan een markt kan worden aangeboden en dat aan een behoefte van potentiële klanten kan voldoen. Dat product is de som van alle fysieke, psychologische, symbolische en servicekenmerken die eraan zijn gekoppeld.
  • Transactie : het laagste niveau van uitvoerbaar werk of klantactiviteit. Een transactie bestaat uit een of meer afzonderlijke gebeurtenissen.
  • TransactionLineItem : de onderdelen van een transactie, onderverdeeld naar product en hoeveelheid, één per regelitem.
  • Partij : een partij is een persoon, organisatie, rechtspersoon, sociale organisatie of bedrijfseenheid die van belang is voor het bedrijf.
  • Klant : een klant is een persoon of rechtspersoon die een product of dienst heeft of heeft gekocht.
  • Kanaal : een kanaal is een middel waarmee producten of services worden verkocht en/of gedistribueerd.

De eenvoudigste manier om entiteiten te vinden, is met behulp van het zoekvak boven de verschillende bedrijfsgebieden die de tabellen bevatten.

Schermopname van een voorbeeld van een sjabloon voor een retaildatabase in gebruik.

Lake-database configureren

Nadat u de database hebt gemaakt, controleert u of het opslagaccount en het bestandspad zijn ingesteld op de locatie waar u de gegevens wilt opslaan. Het pad wordt standaard ingesteld op het primaire opslagaccount in Azure Synapse Analytics, maar kan naar wens worden gewijzigd.

Schermopname van de eigenschappen van een afzonderlijke entiteit in de sjabloon Retaildatabase.

Als u de indeling wilt opslaan en beschikbaar wilt maken in Azure Synapse, publiceert u alle wijzigingen. Deze stap voltooit de installatie van de lake-database en maakt deze beschikbaar voor alle onderdelen binnen Azure Synapse Analytics en daarbuiten.

Gegevens opnemen in lake-database

Als u gegevens wilt opnemen in de lake-database, kunt u pijplijnen uitvoeren met gegevensstroomtoewijzingen zonder code, die een Workspace DB-connector hebben om gegevens rechtstreeks in de databasetabel te laden. U kunt ook de interactieve Spark-notebooks gebruiken om gegevens op te nemen in de lake-databasetabellen:

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

Query’s uitvoeren voor de gegevens

Nadat de lake-database is gemaakt, zijn er verschillende manieren om query's uit te voeren op de gegevens. Momenteel worden SQL-databases in serverloze SQL-pools ondersteund en begrijpen ze automatisch de zojuist gemaakte lake-databaseindeling.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

De andere manier om toegang te krijgen tot de gegevens in Azure Synapse is door een nieuw Spark-notebook te openen en daar de geïntegreerde ervaring te gebruiken:

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

Machine learning-modellen trainen

U kunt lake database gebruiken om uw machine learning-modellen te trainen en de gegevens te beoordelen. Voor meer informatie Machine Learning-modellen trainen

Volgende stappen

Ga verder met het verkennen van de mogelijkheden van de databaseontwerper met behulp van de onderstaande koppelingen.