Individuare, connettere ed esplorare i dati in Synapse con Microsoft Purview
In questo documento si apprenderà il tipo di interazioni che è possibile eseguire durante la registrazione di un account Microsoft Purview in Synapse.
Prerequisiti
Uso di Microsoft Purview in Synapse
L'uso di Microsoft Purview in Synapse richiede l'accesso a tale account Microsoft Purview. Synapse passa l'autorizzazione Microsoft Purview. Ad esempio, se si dispone di un ruolo di autorizzazione curatore, sarà possibile modificare i metadati analizzati da Microsoft Purview.
Individuazione dati: set di dati di ricerca
Per individuare i dati registrati e analizzati da Microsoft Purview, è possibile usare la barra di ricerca nel centro superiore dell'area di lavoro di Synapse. Assicurarsi di selezionare Microsoft Purview per cercare tutti i dati dell'organizzazione.
Azioni di Microsoft Purview
Ecco un elenco delle funzionalità di Microsoft Purview disponibili in Synapse:
- Panoramica dei metadati
- Visualizzare e modificare lo schema dei metadati con classificazioni, termini di glossario, tipi di dati e descrizioni
- Visualizzare la derivazione per comprendere le dipendenze ed eseguire l'analisi dell'impatto. Per altre informazioni, vedere derivazione
- Visualizzare e modificare Contatti per sapere chi è un proprietario o un esperto su un set di dati
- Correlato alla comprensione delle dipendenze gerarchiche di un set di dati specifico. Questa esperienza è utile per esplorare la gerarchia dei dati.
- Fare clic su Richiedi accesso per richiedere l'accesso ai dati attivando il flusso di lavoro di accesso ai dati self-service configurato da Workflow Amministrazione in Microsoft Purview. Per altre informazioni, vedere Richiedere l'accesso e il flusso di lavoro di accesso ai dati self-service.
Azioni che è possibile eseguire sui set di dati con le risorse di Synapse
Connettere i dati a Synapse
- È possibile creare un nuovo servizio collegato a Synapse. Questa azione sarà necessaria per copiare i dati in Synapse o usarli nell'hub dati (per origini dati supportate, ad esempio ADLSg2)
- Per oggetti come file, cartelle o tabelle, è possibile creare direttamente un nuovo set di dati di integrazione e sfruttare un servizio collegato esistente, se già creato
Non è ancora possibile dedurre se è presente un servizio collegato o un set di dati di integrazione esistente.
Sviluppare in Synapse
È possibile eseguire tre azioni: Nuovo script SQL, Nuovo notebook e Nuovo Flusso di dati.
Con il nuovo script SQL, a seconda del tipo di supporto, è possibile:
- Visualizzare le prime 100 righe per comprendere la forma dei dati.
- Creare una tabella esterna dal database SQL synapse
- Caricare i dati in un database SQL synapse
Con Il nuovo notebook è possibile:
- Caricare i dati in un dataframe Spark
- Creare una tabella Spark (se si esegue questa operazione in formato Parquet, viene creata anche una tabella del pool SQL serverless).
Con Il nuovo flusso di dati è possibile creare un set di dati di integrazione che può essere usato un'origine in una pipeline del flusso di dati. Il flusso di dati è una funzionalità di sviluppo senza codice per eseguire la trasformazione dei dati. Per altre informazioni sull'uso del flusso di dati in Synapse.