Connettere Power BI ad Azure Databricks

Microsoft Power BI è un servizio di analisi aziendale che offre visualizzazioni interattive con funzionalità di business intelligence self-service, consentendo agli utenti finali di creare report e dashboard da soli senza dover dipendere dal personale o dagli amministratori di database it.

Quando si usa Azure Databricks come origine dati con Power BI, è possibile sfruttare i vantaggi delle prestazioni e della tecnologia di Azure Databricks oltre a data scientist e data engineer a tutti gli utenti aziendali.

Pubblicare in Power BI Online da Azure Databricks

Quando si usa Azure Databricks come origine dati con Power BI Online, è possibile creare set di dati di Power BI da tabelle o schemi direttamente dall'interfaccia utente di Databricks.

Requisiti

  • I dati devono trovarsi in Unity Catalog e il calcolo (cluster) deve essere abilitato per Unity Catalog. Il metastore Hive non è attualmente supportato.
  • È necessario avere una licenza Di Power BI Premium (capacità Premium o Premium per utente).
  • È necessario abilitare "Gli utenti possono modificare i modelli di dati in servizio Power BI (anteprima)" in Impostazioni area di lavoro e Impostazioni modello di dati per modificare il modello semantico dopo la pubblicazione. È anche possibile modificare il modello semantico usando l'editor tabulare effettuando una connessione usando l'endpoint XMLA.
  • Se è necessario abilitare la scrittura XML nell'area di lavoro di PowerBI, seguire questo collegamento per istruzioni.
  • Se l'area di lavoro si trova in un collegamento privato, sarà necessario aggiornare manualmente le credenziali dell'origine dati del set di dati in Power BI.

Come usarlo

Pubblicare tabelle di Azure Databricks in un set di dati di Power BI

  1. Accedere all'area di lavoro di Databricks e passare a Esplora cataloghi. Selezionare lo schema o le tabelle da pubblicare. Non selezionare un metastore hive o il catalogo degli esempi.
  2. Nell'elenco a discesa calcolo selezionare il data warehouse che si vuole usare in questa pubblicazione di Power BI.
  3. Con la tabella o lo schema desiderato da pubblicare in Esplora cataloghi, fare clic sul pulsante "Usa con strumenti BI" in alto a destra.
  4. Nell'elenco a discesa visualizzato fare clic sull'opzione "Pubblica nell'area di lavoro di Power BI".

A questo punto, un menu verrà aperto sul lato destro della finestra. Seguire le istruzioni fornite dal menu, descritte di seguito:

  1. Fare clic su "Connessione su Microsoft Entra ID" per eseguire l'autenticazione con l'account Microsoft.
  2. Nel menu seguente selezionare l'area di lavoro desiderata da pubblicare nell'elenco a discesa "Aree di lavoro di Power BI". Nell'elenco a discesa "Modalità set di dati" selezionare DirectQuery (selezionato per impostazione predefinita) o Modalità di importazione.
  3. Fare clic sul pulsante blu "Pubblica in Power BI" nella parte inferiore del menu.
  4. Attendere la pubblicazione del set di dati. Questa operazione richiede in genere da 10 a 20 secondi.
  5. Quando il set di dati viene pubblicato, il pulsante blu avrà un collegamento con l'etichetta "Apri Power BI". Fare clic su questa opzione per aprire il nuovo set di dati di Power BI in una nuova scheda.

Caratteristiche e note

  • Quando si pubblica uno schema contenente più tabelle, verranno pubblicate tutte le tabelle con colonne. Se non sono presenti colonne in alcuna tabella, la pubblicazione non verrà eseguita.
  • I commenti sulle colonne di una tabella in Databricks vengono copiati nelle descrizioni delle colonne corrispondenti in Power BI.
  • Le relazioni di chiave esterna vengono mantenute nel set di dati pubblicato. Power BI supporta tuttavia solo un percorso di relazione attivo tra due tabelle. Pertanto, quando nello schema in Databricks sono presenti più percorsi, alcune delle relazioni corrispondenti in Power BI verranno impostate su inattive. In seguito è possibile modificare le relazioni attive/inattive nella visualizzazione modello di dati in Power BI.
  • Viene creato un token di accesso personale per conto dell'utente per consentire a Power BI di accedere al modello semantico. Questo metodo di autenticazione può essere modificato più avanti nelle impostazioni dell'origine dati di Power BI.

Connessione Power BI Desktop ad Azure Databricks

È possibile connettere Power BI Desktop ai cluster di Azure Databricks e ai databricks SQL Warehouse. È anche possibile pubblicare report di Power BI nel servizio Power BI e consentire agli utenti di accedere ai dati di Azure Databricks sottostanti usando l'accesso Single Sign-On (SSO), passando le stesse credenziali di Microsoft Entra ID (in precedenza Azure Active Directory) usate per accedere al report.

Requisiti

  • Power BI Desktop 2.85.681.0 o versione successiva. Scaricare la versione più recente. Per usare i dati gestiti da Unity Catalog con Power BI, è necessario usare Power BI Desktop 2.98.683.0 o versione successiva (versione di ottobre 2021).

    Nota

    Power BI Desktop richiede Windows. Un'alternativa per altri sistemi operativi consiste nell'eseguire Power BI Desktop in un host fisico o in una macchina virtuale basata su Windows e quindi connettersi al sistema operativo.

    Se si usa una versione di Power BI Desktop inferiore alla 2.85.681.0, è anche necessario installare il driver ODBC di Databricks nello stesso ambiente di Power BI Desktop.

  • Un token di accesso personale di Azure Databricks o le credenziali dell'account Microsoft Entra ID.

    Nota

    Come procedura consigliata per la sicurezza quando si esegue l'autenticazione con token di accesso personali, Databricks consiglia di usare token di accesso personali appartenenti alle entità servizio anziché agli utenti dell'area di lavoro. Per creare token per le entità servizio, vedere Gestire i token per un'entità servizio.

  • Un cluster Azure Databricks o Databricks SQL Warehouse.

Connessione Power BI Desktop ad Azure Databricks usando Connessione partner

È possibile usare partner Connessione per connettersi a un cluster o a un data warehouse SQL da Power BI Desktop in pochi clic.

  1. Assicurarsi che l'account, l'area di lavoro di Azure Databricks e l'utente connesso soddisfino i requisiti per il partner Connessione.

  2. Nella barra laterale fare clic su Pulsante Connessione partnerPartner Connessione.

  3. Fare clic sul riquadro di Power BI .

  4. Nella finestra di dialogo Connessione per partner scegliere il nome della risorsa di calcolo di Azure Databricks da connettere.

  5. Scegliere Scarica file di connessione.

  6. Aprire il file di connessione scaricato, che avvia Power BI Desktop.

  7. In Power BI Desktop immettere le credenziali di autenticazione:

    • Token di accesso personale: immettere il token di accesso personale di Azure Databricks.
    • Microsoft Entra ID: fare clic su Accedi e quindi seguire le istruzioni visualizzate.
    • Nome utente/Password: non applicabile.
  8. Fare clic su Connetti.

  9. Selezionare i dati di Azure Databricks su cui eseguire query dallo strumento di navigazione di Power BI.

    Strumento di navigazione di Power BI

Connessione Power BI Desktop in Azure Databricks manualmente

Seguire queste istruzioni, a seconda del metodo di autenticazione scelto, per connettersi a un cluster o a sql warehouse con Power BI Desktop. I databricks SQL Warehouse sono consigliati quando si usa Power BI in modalità DirectQuery .

Nota

Per connettersi più velocemente con Power BI Desktop, usare Partner Connect.

  1. Ottenere il nome host del server e il percorso HTTP.

  2. Avviare Power BI Desktop.

  3. Fare clic su Recupera dati o > Su recupera dati.

  4. Fare clic su Recupera dati per iniziare.

  5. Cercare Databricks e quindi fare clic sul connettore:

    • Azure Databricks
  6. Fare clic su Connetti.

  7. Immettere il nome host del server e il percorso HTTP.

  8. Selezionare la modalità data Connessione ivity. Per informazioni sulla differenza tra Importazione e DirectQuery, vedere Usare DirectQuery in Power BI Desktop.

  9. Fare clic su OK.

  10. Fare clic sul metodo di autenticazione:

    • Token di accesso personale: immettere il token di accesso personale di Azure Databricks.
    • Microsoft Entra ID: fare clic su Accedi e quindi seguire le istruzioni visualizzate.
    • Nome utente/Password: non applicabile.
  11. Fare clic su Connetti.

  12. Selezionare i dati di Azure Databricks su cui eseguire query dallo strumento di navigazione di Power BI. Se Il catalogo unity è abilitato per l'area di lavoro, selezionare un catalogo prima di selezionare uno schema e una tabella.

    Strumento di navigazione di Power BI

Uso di una query SQL personalizzata

Il connettore Databricks fornisce l'origine Databricks.Query dati che consente a un utente di fornire una query SQL personalizzata.

  1. Seguire i passaggi descritti in Connessione con Power BI Desktop per creare una connessione usando Importa come modalità di connettività dati.

  2. Nello strumento di navigazione fare clic con il pulsante destro del mouse sull'elemento più in alto contenente il nome host e il percorso HTTP selezionati e scegliere Trasforma dati per aprire il editor di Power Query.

    Fare clic su Trasforma dati nello strumento di navigazione

  3. Nella barra delle funzioni sostituire il nome Databricks.Catalogs della funzione con Databricks.Query e applicare la modifica. Viene creata una funzione di Power Query che accetta una query SQL come parametro.

  4. Immettere la query SQL desiderata nel campo del parametro e fare clic su Richiama. Viene eseguita la query e viene creata una nuova tabella con i risultati della query come contenuto.

Accedere all'origine dati di Azure Databricks usando il servizio Power BI

Quando si pubblica un report nel servizio Power BI, ci si connette ad Azure Databricks usando un token di accesso personale. Nella servizio Power BI è anche possibile abilitare l'accesso Single Sign-On (SSO) in modo che gli utenti possano accedere ai report creati usando la modalità di archiviazione DirectQuery passando le credenziali dell'ID Di Accesso Microsoft ad Azure Databricks.

  1. Pubblicare il report di Power BI da Power BI Desktop nel servizio Power BI.

  2. Abilitare l'accesso Single Sign-On (SSO) al report e all'origine dati sottostante.

    1. Passare al set di dati di Azure Databricks sottostante per il report nel servizio Power BI, espandere Credenziali origine dati e fare clic su Modifica credenziali.
    2. Nella finestra di dialogo di configurazione selezionare Visualizzatori report può accedere solo a questa origine dati con le proprie identità di Power BI usando Direct Query e fare clic su Accedi.

    Abilitare l'accesso SSO per i dati di Databricks

    Con questa opzione selezionata, l'accesso all'origine dati viene gestito usando DirectQuery e gestito usando l'identità ID Entra Microsoft dell'utente che accede al report. Se non si seleziona questa opzione, solo l'utente che ha pubblicato il report ha accesso all'origine dati di Azure Databricks.

Rilevamento automatico del proxy HTTP

Power BI Desktop versione 2.104.941.0 e successive (versione di maggio 2022) include il supporto predefinito per il rilevamento della configurazione del proxy HTTP a livello di sistema Windows. Scaricare la versione più recente.

Power BI Desktop può rilevare e usare automaticamente la configurazione del proxy HTTP a livello di sistema di Windows.

Se il server proxy non fornisce un punto di distribuzione CRL (CDP), Power BI potrebbe visualizzare il messaggio di errore seguente:

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

Per correggere l'errore, completare la procedura seguente:

  1. Creare il file C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini se non esiste.

  2. Aggiungere la configurazione seguente al microsoft.sparkodbc.ini file:

    [Driver]
    CheckCertRevocation=0
    

Connettore di condivisione Delta di Power BI

Il connettore di condivisione Delta di Power BI consente agli utenti di individuare, analizzare e visualizzare i set di dati condivisi con loro tramite il protocollo aperto Di condivisione Delta. Il protocollo consente lo scambio sicuro di set di dati tra prodotti e piattaforme sfruttando REST e l'archiviazione cloud.

Per istruzioni di connessione, vedere Power BI: Leggere i dati condivisi.

Limiti

  • Il connettore Azure Databricks supporta il proxy Web. Tuttavia, le impostazioni proxy automatiche definite nei file PAC non sono supportate.
  • Nel connettore Azure Databricks l'origine Databricks.Query dati non è supportata in combinazione con la modalità DirectQuery.
  • I dati caricati dal connettore di condivisione Delta devono rientrare nella memoria del computer. Per garantire questo problema, il connettore limita il numero di righe importate al limite di righe impostato in precedenza.

Risorse aggiuntive

Supporto tecnico