Individuare, connettere ed esplorare i dati in Synapse con Microsoft Purview

In questo documento si apprenderà il tipo di interazioni che è possibile eseguire durante la registrazione di un account Microsoft Purview in Synapse.

Prerequisiti

Uso di Microsoft Purview in Synapse

L'uso di Microsoft Purview in Synapse richiede l'accesso a tale account Microsoft Purview. Synapse passa l'autorizzazione Microsoft Purview. Ad esempio, se si dispone di un ruolo di autorizzazione curatore, sarà possibile modificare i metadati analizzati da Microsoft Purview.

Individuazione dati: set di dati di ricerca

Per individuare i dati registrati e analizzati da Microsoft Purview, è possibile usare la barra di ricerca nel centro superiore dell'area di lavoro di Synapse. Assicurarsi di selezionare Microsoft Purview per cercare tutti i dati dell'organizzazione.

Cercare gli asset di Microsoft Purview

Azioni di Microsoft Purview

Ecco un elenco delle funzionalità di Microsoft Purview disponibili in Synapse:

  • Panoramica dei metadati
  • Visualizzare e modificare lo schema dei metadati con classificazioni, termini di glossario, tipi di dati e descrizioni
  • Visualizzare la derivazione per comprendere le dipendenze ed eseguire l'analisi dell'impatto. Per altre informazioni, vedere derivazione
  • Visualizzare e modificare Contatti per sapere chi è un proprietario o un esperto su un set di dati
  • Correlato alla comprensione delle dipendenze gerarchiche di un set di dati specifico. Questa esperienza è utile per esplorare la gerarchia dei dati.
  • Fare clic su Richiedi accesso per richiedere l'accesso ai dati attivando il flusso di lavoro di accesso ai dati self-service configurato da Workflow Amministrazione in Microsoft Purview. Per altre informazioni, vedere Richiedere l'accesso e il flusso di lavoro di accesso ai dati self-service.

Azioni che è possibile eseguire sui set di dati con le risorse di Synapse

Connettere i dati a Synapse

  • È possibile creare un nuovo servizio collegato a Synapse. Questa azione sarà necessaria per copiare i dati in Synapse o usarli nell'hub dati (per origini dati supportate, ad esempio ADLSg2)
  • Per oggetti come file, cartelle o tabelle, è possibile creare direttamente un nuovo set di dati di integrazione e sfruttare un servizio collegato esistente, se già creato

Non è ancora possibile dedurre se è presente un servizio collegato o un set di dati di integrazione esistente.

 Sviluppare in Synapse

È possibile eseguire tre azioni: Nuovo script SQL, Nuovo notebook e Nuovo Flusso di dati.

Con il nuovo script SQL, a seconda del tipo di supporto, è possibile:

  • Visualizzare le prime 100 righe per comprendere la forma dei dati.
  • Creare una tabella esterna dal database SQL synapse
  • Caricare i dati in un database SQL synapse

Con Il nuovo notebook è possibile:

  • Caricare i dati in un dataframe Spark
  • Creare una tabella Spark (se si esegue questa operazione in formato Parquet, viene creata anche una tabella del pool SQL serverless).

Con Il nuovo flusso di dati è possibile creare un set di dati di integrazione che può essere usato un'origine in una pipeline del flusso di dati. Il flusso di dati è una funzionalità di sviluppo senza codice per eseguire la trasformazione dei dati. Per altre informazioni sull'uso del flusso di dati in Synapse.

 Passaggi successivi