Snabbstart: Skapa en ny lake-databas med databasmallar

Den här snabbstarten ger dig ett fullständigt exempelscenario om hur du kan använda databasmallar för att skapa en lake-databas, justera data till din nya modell och använda den integrerade upplevelsen för att analysera data.

Förutsättningar

  • Minst behörigheter för Synapse-användarroller krävs för att utforska en lake-databasmall från galleriet.
  • Synapse-administratörs- eller Synapse-deltagarbehörigheter krävs på Azure Synapse-arbetsytan för att skapa en lake-databas.
  • Behörigheter för Storage Blob Data-deltagare krävs för Data Lake när du använder alternativet Skapa tabell från datasjö .

Skapa en lake-databas från databasmallar

Använd funktionen för nya databasmallar för att skapa en lake-databas som du kan använda för att konfigurera din datamodell för databasen.

I vårt scenario använder vi databasmallen Retail och väljer följande entiteter:

  • RetailProduct – en produkt är allt som kan erbjudas till en marknad som kan tillgodose potentiella kunders behov. Den här produkten är summan av alla fysiska, psykologiska, symboliska attribut och tjänstattribut som är associerade med den.
  • Transaktion – den lägsta nivån av körbart arbete eller kundaktivitet. En transaktion består av en eller flera diskreta händelser.
  • TransactionLineItem – Komponenterna i en transaktion uppdelade efter produkt och kvantitet, en per radartikel.
  • Part – En part är en individ, organisation, juridisk enhet, social organisation eller affärsenhet av intresse för verksamheten.
  • Kund – En kund är en enskild eller juridisk person som har eller har köpt en produkt eller tjänst.
  • Kanal – En kanal är ett sätt att sälja och/eller distribuera produkter eller tjänster.

Det enklaste sättet att hitta entiteter är att använda sökrutan ovanför de olika affärsområden som innehåller tabellerna.

Skärmbild av ett exempel på en detaljhandelsdatabasmall som används.

Konfigurera lake-databas

När du har skapat databasen kontrollerar du att lagringskontot och filsökvägen är inställda på en plats där du vill lagra data. Sökvägen är som standard det primära lagringskontot i Azure Synapse Analytics, men kan ändras till dina behov.

Skärmbild av enskilda entitetsegenskaper i databasmallen Retail.

Om du vill spara layouten och göra den tillgänglig inom Azure Synapse publicerar du alla ändringar. Det här steget slutför installationen av lake-databasen och gör den tillgänglig för alla komponenter i Azure Synapse Analytics och utanför.

Mata in data till lake-databasen

Om du vill mata in data till lake-databasen kan du köra pipelines med kodfria dataflödesmappningar, som har en workspace DB-anslutning för att läsa in data direkt till databastabellen. Du kan också använda interaktiva Spark-notebook-filer för att mata in data till lake-databastabellerna:

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

Fråga efter data

När lake-databasen har skapats finns det olika sätt att fråga efter data. För närvarande stöds SQL-databaser i serverlösa SQL-pooler och förstår automatiskt det nyligen skapade Lake Database-formatet.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

Det andra sättet att komma åt data i Azure Synapse är att öppna en ny Spark-notebook-fil och använda den integrerade upplevelsen där:

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

Träna maskininlärningsmodeller

Du kan använda Lake Database för att träna dina maskininlärningsmodeller och poängsätta data. Mer information finns i Träna maskininlärningsmodeller

Nästa steg

Fortsätt att utforska funktionerna i databasdesignern med hjälp av länkarna nedan.