Connettersi ad Azure Data Lake Gen1 in Microsoft Purview

Questo articolo descrive il processo di registrazione di un'origine dati Azure Data Lake Storage Gen1 in Microsoft Purview, incluse le istruzioni per l'autenticazione e l'interazione con l'origine Azure Data Lake Storage Gen1.

Nota

Azure Data Lake Storage Gen2 è ora disponibile a livello generale. È consigliabile iniziare a usarlo oggi. Per altre informazioni, vedere la pagina del prodotto.

Funzionalità supportate

Estrazione dei metadati Analisi completa Analisi incrementale Analisi con ambito Classificazione Applicazione di etichette Criteri di accesso Lignaggio Condivisione dei dati Visualizzazione dinamica
No Limitato** No No

** La derivazione è supportata se il set di dati viene usato come origine/sink in Data Factory attività Copy

Prerequisiti

Registrazione

Questa sezione consente di registrare l'origine dati ADLS Gen1 e di configurare un meccanismo di autenticazione appropriato per garantire la corretta analisi dell'origine dati.

Passaggi per la registrazione

È importante registrare l'origine dati in Microsoft Purview prima di configurare un'analisi per l'origine dati.

  1. Aprire il portale di governance di Microsoft Purview:

  2. Passare alla mappa dati --> Origini

    Screenshot che mostra il collegamento per aprire il portale di governance di Microsoft Purview

    Screenshot che passa al collegamento Origini nella mappa dati

  3. Creare la gerarchia raccolta usando il menu Raccolte e assegnare le autorizzazioni alle singole sottoraccolte, in base alle esigenze

    Screenshot che mostra il menu di raccolta per creare la gerarchia della raccolta

  4. Passare alla raccolta appropriata nel menu Origini e selezionare l'icona Registra per registrare una nuova origine dati ADLS Gen1

    Screenshot che mostra la raccolta usata per registrare l'origine dati

  5. Selezionare l'origine dati Azure Data Lake Storage Gen1 e selezionare Continua

    Screenshot che consente la selezione dell'origine dati

  6. Specificare un nome appropriato per l'origine dati, selezionare la sottoscrizione di Azure pertinente, il nome dell'account Data Lake Store esistente e la raccolta e selezionare Applica

    Screenshot che mostra i dettagli da immettere per registrare l'origine dati

  7. L'account di archiviazione ADLS Gen1 verrà visualizzato nella raccolta selezionata

    Screenshot che mostra l'origine dati mappata alla raccolta per avviare l'analisi

Analisi

Prerequisiti per l'analisi

Per poter accedere all'analisi dell'origine dati, è necessario configurare un metodo di autenticazione nell'account di archiviazione ADLS Gen1. Sono supportate le opzioni seguenti:

Nota

Se il firewall è abilitato per l'account di archiviazione, è necessario usare il metodo di autenticazione dell'identità gestita durante la configurazione di un'analisi.

  • Identità gestita assegnata dal sistema (scelta consigliata): non appena viene creato l'account Microsoft Purview, viene creata automaticamente un'identità gestita di sistema nel tenant di Azure AD. A seconda del tipo di risorsa, sono necessarie assegnazioni di ruolo del controllo degli accessi in base al ruolo specifiche affinché microsoft Purview SAMI esegua le analisi.

  • Identità gestita assegnata dall'utente (anteprima): analogamente a un'identità gestita dal sistema, un'identità gestita assegnata dall'utente è una risorsa credenziale che può essere usata per consentire a Microsoft Purview di eseguire l'autenticazione in Azure Active Directory. Per altre informazioni, vedere la guida all'identità gestita assegnata dall'utente.

  • Entità servizio : in questo metodo è possibile creare un'entità servizio nuova o usare un'entità servizio esistente nel tenant di Azure Active Directory.

Autenticazione per un'analisi

Uso dell'identità gestita assegnata dall'utente o del sistema per l'analisi

È importante concedere all'account Microsoft Purview l'autorizzazione per analizzare l'origine dati ADLS Gen1. È possibile aggiungere l'identità gestita di sistema o l'identità gestita assegnata dall'utente a livello di sottoscrizione, gruppo di risorse o risorsa, a seconda di cosa si vuole che disponga delle autorizzazioni di analisi.

Nota

È necessario essere proprietari della sottoscrizione per poter aggiungere un'identità gestita in una risorsa di Azure.

  1. Dal portale di Azure individuare la sottoscrizione, il gruppo di risorse o la risorsa (ad esempio, un account di archiviazione Azure Data Lake Storage Gen1) che si vuole consentire al catalogo di analizzare.

  2. Selezionare Panoramica e quindi Esplora dati

    Screenshot che mostra l'account di archiviazione

  3. Selezionare Access (Accesso ) nel riquadro di spostamento superiore

    Screenshot che mostra Esplora dati per l'account di archiviazione

  4. Scegliere Seleziona e aggiungere il nome Microsoft Purview (ovvero l'identità gestita del sistema) o l'identità gestita assegnata dall'utente (anteprima), già registrata in Microsoft Purview, nel menu Seleziona utente o gruppo .

  5. Selezionare Autorizzazioni lettura ed esecuzione . Assicurarsi di scegliere Questa cartella e tutti gli elementi figlio e Una voce di autorizzazione di accesso e una voce di autorizzazione predefinita in Aggiungi opzioni come illustrato nello screenshot seguente. Selezionare OK

    Screenshot che mostra i dettagli per assegnare le autorizzazioni per l'account Microsoft Purview

Consiglio

Una voce di autorizzazione di accesso è una voce di autorizzazione per i file e le cartelle correnti . Una voce di autorizzazione predefinita è una voce di autorizzazione che verrà ereditata da nuovi file e cartelle. Per concedere l'autorizzazione solo ai file attualmente esistenti, scegliere una voce di autorizzazione di accesso. Per concedere l'autorizzazione per analizzare file e cartelle che verranno aggiunti in futuro, includere una voce di autorizzazione predefinita.

Uso dell'entità servizio per l'analisi

Creazione di una nuova entità servizio

Se è necessario creare una nuova entità servizio, è necessario registrare un'applicazione nel tenant di Azure AD e fornire l'accesso all'entità servizio nelle origini dati. L'amministratore globale di Azure AD o altri ruoli, ad esempio l'amministratore dell'applicazione, possono eseguire questa operazione.

Recupero dell'ID applicazione dell'entità servizio
  1. Copiare l'ID applicazione (client) presente nella panoramicadell'entità servizio già creata

    Screenshot che mostra l'ID applicazione (client) per l'entità servizio

Concessione dell'accesso dell'entità servizio all'account ADLS Gen1

È importante concedere all'entità servizio l'autorizzazione per analizzare l'origine dati ADLS Gen2. È possibile aggiungere l'accesso per l'entità servizio a livello di sottoscrizione, gruppo di risorse o risorsa, a seconda delle autorizzazioni necessarie.

Nota

È necessario essere proprietari della sottoscrizione per poter aggiungere un'entità servizio in una risorsa di Azure.

  1. Fornire all'entità servizio l'accesso all'account di archiviazione aprendo l'account di archiviazione e selezionando Panoramica -->Esplora dati

    Screenshot che mostra l'account di archiviazione

  2. Selezionare Access (Accesso ) nel riquadro di spostamento superiore

    Screenshot che mostra Esplora dati per l'account di archiviazione

  3. Selezionare Seleziona e aggiungere l'entità servizio nella selezione Seleziona utente o gruppo .

  4. Selezionare Autorizzazioni lettura ed esecuzione . Assicurarsi di scegliere Questa cartella e tutti gli elementi figlio e Una voce di autorizzazione di accesso e una voce di autorizzazione predefinita nelle opzioni Aggiungi. Selezionare OK

    Screenshot che mostra i dettagli per assegnare le autorizzazioni per l'entità servizio

Creazione dell'analisi

  1. Aprire l'account Microsoft Purview e selezionare il portale di governance Open Microsoft Purview

  2. Passare alla mappa dati -->Origini per visualizzare la gerarchia della raccolta

    Screenshot che mostra la gerarchia della raccolta

  3. Selezionare l'icona Nuova analisinell'origine dati ADLS Gen1 registrata in precedenza

    Screenshot che mostra l'origine dati con la nuova icona di analisi

Se si usa l'identità gestita assegnata dall'utente o dal sistema

Specificare un nome per l'analisi, selezionare l'identità gestita assegnata dall'utente o dal sistema in Credenziali, scegliere la raccolta appropriata per l'analisi e selezionare Test connessione. In una connessione riuscita selezionare Continua.

Screenshot che mostra l'opzione identità gestita per eseguire l'analisi

Se si usa l'entità servizio

  1. Specificare un nome per l'analisi, scegliere la raccolta appropriata per l'analisi e selezionare + Nuovo in Credenziali

    Screenshot che mostra l'opzione dell'entità servizio

  2. Selezionare la connessione dell'insieme di credenziali delle chiavi appropriata e il nome del segreto usato durante la creazione dell'entità servizio. L'ID entità servizio è l'ID applicazione (client) copiato come indicato in precedenza

    Screenshot che mostra l'opzione dell'insieme di credenziali delle chiavi dell'entità servizio

  3. Selezionare Test connessione. In una connessione riuscita selezionare Continua

    Screenshot che mostra la connessione di test per l'entità servizio

Definizione dell'ambito ed esecuzione dell'analisi

  1. È possibile definire l'ambito dell'analisi per cartelle e sottocartelle specifiche scegliendo gli elementi appropriati nell'elenco.

    Definire l'ambito dell'analisi

  2. Selezionare quindi un set di regole di analisi. È possibile scegliere tra i set di regole personalizzati predefiniti del sistema o esistenti oppure creare un nuovo set di regole inline.

    Set di regole di analisi

  3. Se si crea un nuovo set di regole di analisi, selezionare i tipi di file da includere nella regola di analisi.

    Analizzare i tipi di file del set di regole

  4. È possibile selezionare le regole di classificazione da includere nella regola di analisi

    Analizzare le regole di classificazione del set di regole

    Analisi della selezione del set di regole

  5. Scegliere il trigger di analisi. È possibile configurare una pianificazione o eseguire l'analisi una sola volta.

    trigger di analisi

    selezione del trigger di analisi

  6. Esaminare l'analisi e selezionare Salva ed esegui.

    analisi di revisione

Visualizzazione dell'analisi

  1. Passare all'origine dati nella raccolta e selezionare Visualizza dettagli per controllare lo stato dell'analisi

    visualizzare l'analisi

  2. I dettagli dell'analisi indicano lo stato dell'analisi nello stato Ultima esecuzione e il numero di asset analizzati e classificati

    visualizzare i dettagli dell'analisi

  3. Lo stato Ultima esecuzione verrà aggiornato a In corso e quindi completato dopo che l'intera analisi è stata eseguita correttamente

    visualizzazione dell'analisi in corso

    visualizzazione dell'analisi completata

Gestione dell'analisi

Le analisi possono essere gestite o eseguite di nuovo al termine.

  1. Selezionare il nome dell'analisi per gestire l'analisi

    gestire l'analisi

  2. È possibile eseguire di nuovo l'analisi , modificare l'analisi, eliminare l'analisi

    gestire le opzioni di analisi

    Nota

    • L'eliminazione dell'analisi non elimina gli asset del catalogo creati dalle analisi precedenti.
    • L'asset non verrà più aggiornato con modifiche dello schema se la tabella di origine è stata modificata e la tabella di origine viene analizzata di nuovo dopo aver modificato la descrizione nella scheda schema di Microsoft Purview.
  3. È possibile eseguire di nuovo un'analisi incrementale o un'analisi completa .

    gestire l'analisi completa o incrementale

    gestire i risultati dell'analisi

Passaggi successivi

Dopo aver registrato l'origine, seguire le guide seguenti per altre informazioni su Microsoft Purview e sui dati.