Share via


Procedure consigliate per la derivazione dei dati di Microsoft Purview

La derivazione dei dati è ampiamente intesa come il ciclo di vita che si estende all'origine dei dati e alla posizione in cui si sposta nel tempo nell'area dati. Microsoft Purview può acquisire la derivazione dei dati in diverse parti del patrimonio dati dell'organizzazione e a diversi livelli di preparazione, tra cui:

  • Dati non elaborati in fasi da varie piattaforme
  • Dati trasformati e preparati
  • Dati usati dalle piattaforme di visualizzazione

Perché hai bisogno di adottare Lineage?

La derivazione dei dati è il processo di descrizione dei dati esistenti, della posizione in cui vengono archiviati e del relativo flusso tra i sistemi. Esistono molti motivi per cui la derivazione dei dati è importante, ma a livello generale possono essere tutte suddivise in tre categorie che verranno esaminate qui:

  • Tenere traccia dei dati nei report
  • Analisi di impatto
  • Acquisire le modifiche e la posizione in cui i dati sono stati conservati durante il ciclo di vita dei dati

Azure Data Factory Le procedure consigliate e le considerazioni di Derivazione

istanza di Azure Data Factory

  • La derivazione dei dati non verrà segnalata automaticamente al catalogo finché lo stato della connessione di Data Factory non diventa Connesso. Il resto dello stato Disconnesso e CannotAccess non può acquisire derivazione.

    Screenshot che mostra un elenco di connessioni di data factory.

  • Ogni istanza di Data Factory può connettersi a un solo account Microsoft Purview. È possibile stabilire una nuova connessione in un altro account Microsoft Purview, ma in questo modo la connessione esistente verrà disconnessa.

    Screenshot che mostra l'avviso di disconnessione Azure Data Factory.

  • L'identità gestita della data factory viene usata per autenticare le operazioni push di derivazione nell'account Microsoft Purview. L'identità gestita della data factory richiede il ruolo Di curatore dati nella raccolta radice di Microsoft Purview.

  • Attualmente, solo 10 data factory possono essere connesse alla volta. Se si vogliono aggiungere più di 10 data factory, aggiungere 10 nuove connessioni data factory alla volta usando la procedura guidata o usare l'API per connettere più di 10 data factory in un'unica operazione.

attività Azure Data Factory

  • Microsoft Purview acquisisce la derivazione del runtime dalle attività di Azure Data Factory seguenti:

  • Microsoft Purview elimina la derivazione se l'origine o la destinazione usa un sistema di archiviazione dati non supportato.

  • Microsoft Purview non può acquisire la derivazione se Azure Data Factory'attività di copia usa le funzionalità dell'attività di copia elencate in Limitazioni sulla derivazione dell'attività di copia di Connetti a Azure Data Factory

  • Per la derivazione dell'attività flusso di dati, Microsoft Purview supporta solo l'origine e il sink. La derivazione per la trasformazione Flusso di dati non è ancora supportata.

  • La derivazione del flusso di dati non si integra con il set di risorse Microsoft Purview. Esempio di set di risorse:
    Nome completo: https://myblob.blob.core.windows.net/sample-data/data{N}.csv Nome visualizzato: "data"

  • Per la derivazione dell'attività Esegui pacchetto SSIS, supportiamo solo l'origine e la destinazione. La derivazione per la trasformazione non è ancora supportata.

    Screenshot della derivazione Execute SSIS in Microsoft Purview.

  • Per eseguire il push della derivazione Azure Data Factory in Microsoft Purview, vedere la guida dettagliata seguente.

Passaggi successivi