Avvio rapido: Creare un nuovo database lake sfruttando i modelli di database

Questa guida introduttiva offre uno scenario di esempio completo su come applicare modelli di database per creare un database lake, allineare i dati al nuovo modello e usare l'esperienza integrata per analizzare i dati.

Prerequisiti

  • Per esplorare un modello di database lake da Raccolta, sono necessarie almeno le autorizzazioni per il ruolo utente di Synapse .
  • Le autorizzazioni Di amministratore di Synapse o Collaboratore synapse sono necessarie nell'area di lavoro Azure Synapse per la creazione di un database lake.
  • Le autorizzazioni Collaboratore dati BLOB di archiviazione sono necessarie per data lake quando si usa l'opzione Crea tabella Da data lake .

Creare un database lake dai modelli di database

Usare la nuova funzionalità dei modelli di database per creare un database lake che è possibile usare per configurare il modello di dati per il database.

Per lo scenario verrà usato il modello di Retail database e selezionare le entità seguenti:

  • RetailProduct : un prodotto può essere offerto a un mercato che potrebbe soddisfare una necessità da parte di potenziali clienti. Questo prodotto è la somma di tutti gli attributi fisici, psicologici, simbolici e di servizio associati.
  • Transazione : il livello più basso di lavoro eseguibile o attività del cliente. Una transazione è costituita da uno o più eventi discreti.
  • TransactionLineItem : i componenti di una transazione suddivisi in base a Product e Quantity, uno per ogni elemento di riga.
  • Parti : una parte è un individuo, un'organizzazione, un'entità giuridica, un'organizzazione sociale o un'unità aziendale di interesse per l'azienda.
  • Cliente : un cliente è un individuo o un'entità giuridica che ha o ha acquistato un prodotto o un servizio.
  • Canale : un canale è un mezzo per cui i prodotti o i servizi vengono venduti e/o distribuiti.

Il modo più semplice per trovare le entità consiste nell'usare la casella di ricerca sopra le diverse aree aziendali che contengono le tabelle.

Screenshot di un esempio di modello di database retail in uso.

Configurare il database lake

Dopo aver creato il database, assicurarsi che l'account di archiviazione e il percorso file sia impostato su un percorso in cui si desidera archiviare i dati. Il percorso verrà predefinito per l'account di archiviazione primario all'interno di Azure Synapse Analytics, ma può essere modificato in base alle proprie esigenze.

Screenshot di una singola proprietà di entità nel modello di database Retail.

Per salvare il layout e renderlo disponibile all'interno di Azure Synapse, Pubblicare tutte le modifiche. Questo passaggio completa la configurazione del database lake e lo rende disponibile per tutti i componenti all'interno di Azure Synapse Analytics e all'esterno.

Inserire dati nel database lake

Per inserire i dati nel database lake, è possibile eseguire pipeline con mapping di flusso di dati liberi dal codice, che dispongono di un connettore del database dell'area di lavoro per caricare i dati direttamente nella tabella di database. È anche possibile usare i notebook Spark interattivi per inserire i dati nelle tabelle del database lake:

%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);

Eseguire una query sui dati

Dopo aver creato il database lake, esistono diversi modi per eseguire query sui dati. Attualmente, i database SQL nei pool SQL serverless sono supportati e comprendono automaticamente il formato del database lake appena creato.

SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]

L'altro modo per accedere ai dati all'interno di Azure Synapse consiste nell'aprire un nuovo notebook Spark e usare l'esperienza integrata:

df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)

Eseguire il training di modelli di Machine Learning

È possibile usare il database lake per eseguire il training dei modelli di Machine Learning e assegnare un punteggio ai dati. Per altre informazioni , eseguire il training dei modelli di Machine Learning

Passaggi successivi

Continuare a esplorare le funzionalità della finestra di progettazione database usando i collegamenti seguenti.