Configurare l'archiviazione del flusso di dati per l'uso di Azure Data Lake Gen 2

I dati usati con Power BI vengono archiviati nell'archiviazione interna fornita da Power BI per impostazione predefinita. Con l'integrazione di flussi di dati e Azure Data Lake Storage Gen 2 (ADLS Gen2), è possibile archiviare i flussi di dati nell'account di Azure Data Lake Storage Gen2 della propria organizzazione. Questa funzionalità consente essenzialmente di "portare la propria risorsa di archiviazione" ai flussi di dati di Power BI e di stabilire una connessione a livello di tenant o area di lavoro.

Motivi per usare l'area di lavoro o la connessione tenant di ADLS Gen 2

Dopo aver collegato il flusso di dati, Power BI configura e salva un riferimento in modo che sia ora possibile leggere e scrivere dati in ADLS Gen 2. Power BI archivia i dati nel formato CDM (Common Data Model), che acquisisce metadati sui dati oltre ai dati effettivi generati dal flusso di dati stesso. Questa funzionalità sblocca molte potenti funzionalità e consente ai dati e ai metadati associati in formato CDM di gestire ora l'estendibilità, l'automazione, il monitoraggio e gli scenari di backup. Quando si rendono questi dati disponibili e ampiamente accessibili nel proprio ambiente, consente di democratizzare le informazioni dettagliate e i dati creati all'interno dell'organizzazione. Consente inoltre di creare altre soluzioni con un'ampia gamma di complessità. Le soluzioni possono essere basate su applicazioni e soluzioni personalizzate basate su CDM in Power Platform, Azure e su quelle disponibili tramite ecosistemi di fornitori di software indipendenti e partner. In alternativa, è possibile creare un'applicazione per leggere un file CSV. I data engineer, i data scientist e gli analisti possono ora usare, usare e riutilizzare un set comune di dati curato in ADLS Gen 2.

Esistono due modi per configurare l'archivio di ADLS Gen 2 da usare: è possibile usare un account ADLS Gen 2 assegnato al tenant oppure è possibile usare un archivio ADLS Gen 2 a livello di area di lavoro.

Prerequisiti

  • Per usare un account ADLS Gen 2 personalizzato, è necessario disporre dell'autorizzazione Proprietario a livello di account di archiviazione. Le autorizzazioni a livello di gruppo di risorse o sottoscrizione non funzioneranno. Se si è un amministratore, è comunque necessario assegnare a se stessi l'autorizzazione Proprietario. Attualmente non supporta ADLS Gen2 Archiviazione Account dietro un firewall.

  • L'account di archiviazione deve essere creato con lo spazio dei nomi gerarchico (HNS) abilitato.

  • L'account di archiviazione deve essere creato nello stesso tenant di Microsoft Entra del tenant di Power BI.

  • L'utente deve avere Archiviazione ruolo Proprietario dati BLOB, Archiviazione ruolo Lettore dati BLOB e un ruolo Proprietario a livello di account di archiviazione (l'ambito deve essere questa risorsa e non ereditata). La sincronizzazione di eventuali modifiche al ruolo applicate potrebbe richiedere alcuni minuti e deve eseguire la sincronizzazione prima che i passaggi seguenti possano essere completati nella servizio Power BI.

  • L'area tenant dell'area di lavoro di Power BI deve corrispondere all'area dell'account di archiviazione.

  • TLS (Transport Layer Security) versione 1.2 (o successiva) è necessario per proteggere gli endpoint. I Web browser e altre applicazioni client che usano versioni TLS precedenti a TLS 1.2 non saranno in grado di connettersi.

  • Il collegamento di un flusso di dati con ADLS Gen 2 dietro l'autenticazione a più fattori (MFA) non è supportato.

  • Infine, è possibile connettersi a qualsiasi ADLS Gen 2 dal portale di Amministrazione, ma se ci si connette direttamente a un'area di lavoro, è necessario assicurarsi che non siano presenti flussi di dati nell'area di lavoro prima di connettersi.

Nota

L'archiviazione Bring Your Own Storage (Azure Data Lake Gen 2) non è disponibile nella servizio Power BI per i clienti GCC degli Stati Uniti per enti pubblici. Per altre informazioni sulle funzionalità disponibili e non disponibili, vedere Disponibilità delle funzionalità di Power BI per i clienti degli Stati Uniti per enti pubblici.

La tabella seguente descrive le autorizzazioni per ADLS e per Power BI necessarie per ADLS Gen 2 e Power BI:

Azione Autorizzazioni ADLS Autorizzazioni minime di Power BI
Connessione tenant da ADLS Gen 2 a Power BI Proprietario Amministratore di Power BI
Connessione da ADLS Gen 2 all'area di lavoro Proprietario Amministratore dell'area di lavoro
Creare flussi di dati di Power BI che riscrivano nell'account ADLS connesso Non applicabile Collaboratore area di lavoro
Usare il flusso di dati di Power BI Non applicabile Visualizzatore dell'area di lavoro

Connessione a un'istanza di Azure Data Lake Gen 2 a livello di area di lavoro

Passare a un'area di lavoro senza flussi di dati. Selezionare Impostazioni area di lavoro. Scegliere la scheda Azure Connessione ions e quindi selezionare la sezione Archiviazione.

Screenshot of the Workspace settings pane on the Azure connections tab.

L'opzione Usa connessione di Azure predefinita è visibile se l'amministratore ha già configurato un account ADLS Gen 2 assegnato al tenant. è possibile procedere in due modi:

  • Usare l'account ADLS Gen 2 configurato dal tenant selezionando la casella Usa la connessione di Azure predefinita oppure
  • Selezionare Connessione ad Azure per puntare a un nuovo account Archiviazione di Azure.

Quando si seleziona Connessione in Azure, Power BI recupera un elenco di sottoscrizioni di Azure a cui si ha accesso. Compilare gli elenchi a discesa. Scegliere quindi una sottoscrizione di Azure valida, un gruppo di risorse e un account di archiviazione con l'opzione dello spazio dei nomi gerarchico abilitata, ovvero il flag ADLS Gen2. L'account personale usato per connettersi ad Azure viene usato una sola volta, per impostare la connessione iniziale e concedere all'account servizio Power BI diritti di lettura e scrittura dei dati, dopo il quale l'account utente originale non è più necessario per mantenere attiva la connessione.

Screenshot of the Settings window after choosing Connecting to Azure.

Dopo aver scelto l'opzione selezionata, selezionare Salva e ora l'area di lavoro è stata connessa al proprio account ADLS Gen2. Power BI configura automaticamente l'account di archiviazione con le autorizzazioni necessarie e configura il file system di Power BI in cui verranno scritti i dati. A questo punto, i dati di ogni flusso di dati all'interno di questa area di lavoro scriveranno direttamente in questo file system, che può essere usato con altri servizi di Azure. È ora disponibile un'unica origine per tutti i dati dell'organizzazione o del reparto.

Configurazione delle connessioni di Azure

La configurazione delle connessioni di Azure è un'impostazione facoltativa con più proprietà che possono essere impostate facoltativamente:

  • Archiviazione a livello di tenant, che consente di impostare un valore predefinito e/o
  • Archiviazione a livello di area di lavoro, che consente di specificare la connessione per area di lavoro

Facoltativamente, è possibile configurare l'archiviazione a livello di tenant se si vuole usare un data lake centralizzato o se si vuole che questa risorsa di archiviazione sia l'opzione predefinita. Non si avvia automaticamente usando l'impostazione predefinita per consentire la flessibilità nella configurazione, quindi è possibile configurare le aree di lavoro che usano questa connessione come previsto. Se si configura un account ADLS Gen 2 assegnato al tenant, è comunque necessario configurare ogni area di lavoro per usare questa opzione predefinita.

Facoltativamente, è possibile configurare le autorizzazioni di archiviazione a livello di area di lavoro come opzione separata, che offre una flessibilità completa per impostare un account ADLS Gen 2 specifico in base all'area di lavoro.

Per riepilogare, se sono consentite autorizzazioni di archiviazione a livello di tenant e archiviazione a livello di area di lavoro, gli amministratori dell'area di lavoro possono facoltativamente usare la connessione ADLS predefinita o scegliere di configurare un altro account di archiviazione separato dall'impostazione predefinita. Se l'archiviazione tenant non è impostata, gli amministratori dell'area di lavoro possono facoltativamente configurare gli account ADLS in base a un'area di lavoro in base all'area di lavoro. Infine, se è selezionata l'archiviazione a livello di tenant e l'archiviazione a livello di area di lavoro non è consentita, gli amministratori dell'area di lavoro possono facoltativamente configurare i flussi di dati per usare questa connessione.

Struttura e formato per le connessioni all'area di lavoro di ADLS Gen 2

Nell'account di archiviazione DILS Gen 2 tutti i flussi di dati vengono archiviati nel contenitore powerbi del file system.

La struttura del contenitore powerbi è simile alla seguente: <workspace name>/<dataflow name>/model.json, <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots> e <workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Il percorso in cui i flussi di dati archiviano i dati nella gerarchia di cartelle per ADLS Gen 2 è lo stesso se l'area di lavoro si trova nella capacità condivisa o premium.

Nell'esempio seguente viene utilizzata la tabella Orders dell'esempio Northwind Odata.

Screenshot of the file explorer showing an example using the Orders table of the Northwind Odata sample.

Nell'immagine precedente:

  • Model.json è la versione più recente del flusso di dati.
  • Model.json.snapshots sono tutte versioni precedenti del flusso di dati. Questa cronologia è utile se è necessaria una versione precedente di mashup o impostazioni incrementali.
  • Tablename è la cartella contenente i dati risultanti dopo il completamento di un aggiornamento del flusso di dati.

Si scrive solo in questo account di archiviazione e non si eliminano attualmente i dati. Quindi, anche dopo lo scollegamento, non viene eliminato dall'account ADLS, quindi tutti i file menzionati nell'elenco precedente sono ancora archiviati.

Nota

I flussi di dati consentono il collegamento o il riferimento a presentati in altri flussi di dati. In questi flussi di dati, il file model.json può fare riferimento a un altro model.json di un altro flusso di dati nella stessa area di lavoro o in un'altra area di lavoro.

Spostamento di file tra gli account di archiviazione di ADLS Gen 2

Quando si sposta un flusso di dati da un account di archiviazione ADLS Gen2 a un altro, è necessario assicurarsi che i percorsi nel file model.json vengano aggiornati in modo da riflettere il nuovo percorso. Questo perché il file model.json contiene il percorso del flusso di dati e il percorso dei dati. Se non si aggiornano i percorsi, il flusso di dati non sarà in grado di trovare i dati e causerà errori di autorizzazione. Per aggiornare i percorsi, è possibile seguire questa procedura:

  • Aprire il file model.json in un editor di testo.
  • Trovare l'URL dell'account di archiviazione e sostituirlo con il nuovo URL dell'account di archiviazione.
  • Salvare il file.
  • Sovrascrivere il file model.json esistente nell'account di archiviazione ADLS Gen2.

Estendibilità per le connessioni all'area di lavoro di ADLS Gen 2

Se si connette ADLS Gen 2 a Power BI, è possibile eseguire questa azione a livello di area di lavoro o tenant. Assicurarsi di avere il livello di accesso corretto. Per altre informazioni, vedere Prerequisiti.

La struttura di archiviazione è conforme al formato Common Data Model. Per altre informazioni sulla struttura di archiviazione e su CDM, vedere Che cos'è la struttura di archiviazione per i flussi di dati analitici e Usare Common Data Model per ottimizzare Azure Data Lake Archiviazione Gen2.

Dopo la configurazione corretta, i dati e i metadati sono nel controllo. Molte applicazioni sono a conoscenza del cdm e i dati possono essere estesi usando Azure, PowerApps e PowerAutomate. È anche possibile usare ecosistemi di terze parti conformi al formato o leggendo i dati non elaborati.

Scollegare Azure Data Lake Gen 2 da un'area di lavoro o un tenant

Per rimuovere una connessione a livello di area di lavoro, è prima necessario assicurarsi che tutti i flussi di dati nell'area di lavoro vengano eliminati. Dopo aver rimosso tutti i flussi di dati, selezionare Disconnetti nelle impostazioni dell'area di lavoro. Lo stesso vale per un tenant, ma è prima necessario assicurarsi che tutte le aree di lavoro siano state disconnesse anche dall'account di archiviazione tenant prima di potersi disconnettere a livello di tenant.

Disabilitare Azure Data Lake Gen 2

Nel portale di Amministrazione, in flussi di dati, è possibile disabilitare l'accesso per consentire agli utenti di usare questa funzionalità e di impedire agli amministratori dell'area di lavoro di usare i propri Archiviazione di Azure.

Ripristinare da Azure Data Lake Gen 2

Dopo aver configurato l'archiviazione del flusso di dati per l'uso di Azure Data Lake Gen 2, non è possibile ripristinare automaticamente. Il processo per tornare all'archiviazione gestita da Power BI è manuale.

Per ripristinare la migrazione effettuata a Gen 2, è necessario eliminare i flussi di dati e ricrearli nella stessa area di lavoro. Quindi, poiché i dati non vengono eliminati da ADLS Gen 2, passare alla risorsa stessa e pulire i dati. Questa azione comporta i passaggi seguenti.

  1. Esportare una copia del flusso di dati da Power BI. In alternativa, copiare il file model.json. Il file model.json viene archiviato in ADLS.

  2. Eliminare i flussi di dati.

  3. Scollegare ADLS.

  4. Ricreare i flussi di dati usando l'importazione. I dati di aggiornamento incrementale (se applicabile) dovranno essere eliminati prima dell'importazione. Questa azione può essere eseguita eliminando le partizioni pertinenti nel file model.json.

  5. Configurare i criteri di aggiornamento/ricreazione incrementale.

Connessione ai dati usando il connettore ADLS Gen 2

L'ambito di questo documento descrive le connessioni ai flussi di dati di ADLS Gen 2 e non il connettore Power BI ADLS Gen 2. L'uso del connettore ADLS Gen 2 è uno scenario separato, possibilmente aggiuntivo, . Il connettore ADLS usa semplicemente ADLS come origine dati. Pertanto, l'uso di Power Query Online per eseguire query su tali dati non deve essere in formato CDM, può essere qualsiasi formato di dati che il cliente vuole. Per altre informazioni, vedere Azure Data Lake Archiviazione Gen2.

Gli articoli seguenti forniscono altre informazioni sui flussi di dati e Power BI: