Funzionalità Premium dei flussi di dati

I flussi di dati sono supportati per gli utenti di Power BI Pro, Premium per utente e Power BI Premium. Alcune funzionalità sono disponibili solo con una sottoscrizione di Power BI Premium (ovvero una capacità Premium o una licenza PPU). Questo articolo descrive e descrive in dettaglio le funzionalità PPU e solo Premium e i relativi usi.

Le funzionalità seguenti sono disponibili solo con Power BI Premium (PPU o una sottoscrizione di capacità Premium):

  • Motore di calcolo avanzato
  • DirectQuery
  • Entità calcolate
  • Entità collegate
  • Aggiornamento incrementale

Le sezioni seguenti descrivono in dettaglio ognuna di queste funzionalità.

Importante

Questo articolo si applica alla prima generazione di flussi di dati (Gen1) e non si applica alla seconda generazione (Gen2) dei flussi di dati, disponibili in Microsoft Fabric (anteprima). Per altre informazioni, vedere Recupero dai flussi di dati generazione 1 ai flussi di dati generazione 2.

Motore di calcolo avanzato

Il motore di calcolo avanzato in Power BI consente ai sottoscrittori di Power BI Premium di usare la capacità per ottimizzare l'uso dei flussi di dati. L'uso del motore di calcolo avanzato offre i vantaggi seguenti:

  • Riduce drasticamente il tempo di aggiornamento necessario per i passaggi ETL a esecuzione prolungata (estrazione, trasformazione, caricamento) su entità calcolate, ad esempio l'esecuzione di join, distinti, filtri e raggruppamento per.
  • Esegue query DirectQuery sulle entità.

Nota

  • I processi di convalida e aggiornamento informano i flussi di dati dello schema del modello. Per impostare manualmente lo schema delle tabelle, usare il editor di Power Query e impostare i tipi di dati.
  • Questa funzionalità è disponibile in tutti i cluster di Power BI ad eccezione di WABI-INDIA-CENTRAL-A-PRIMARY

Abilitare il motore di calcolo avanzato

Importante

Il motore di calcolo avanzato funziona solo per le capacità di Power BI A3 o superiori.

In Power BI Premium il motore di calcolo avanzato viene impostato singolarmente per ogni flusso di dati. Esistono tre configurazioni tra cui scegliere:

  • Disabilitato

  • Ottimizzato (impostazione predefinita): il motore di calcolo avanzato è disattivato. Viene attivato automaticamente quando viene fatto riferimento a una tabella nel flusso di dati da un'altra tabella o quando il flusso di dati è connesso a un altro flusso di dati nella stessa area di lavoro.

  • On

Per modificare l'impostazione predefinita e abilitare il motore di calcolo avanzato, seguire questa procedura:

  1. Nell'area di lavoro, accanto al flusso di dati per cui si desidera modificare le impostazioni, selezionare Altre opzioni.

  2. Nel menu Altre opzioni del flusso di dati selezionare Impostazioni.

    Screenshot of a dataflows more options menu with the settings setting highlighted.

  3. Espandere le impostazioni del motore di calcolo avanzato.

    Screenshot of a dataflow settings page with the enhanced compute engine settings setting highlighted.

  4. Nelle impostazioni del motore di calcolo avanzato selezionare e quindi scegliere Applica.

    Screenshot of the enhanced compute engine settings with the on selection turned on and the apply button highlighted.

Usare il motore di calcolo avanzato

Dopo che il motore di calcolo avanzato è attivo, tornare ai flussi di dati e si noterà un miglioramento delle prestazioni in qualsiasi tabella calcolata che esegue operazioni complesse, ad esempio join o raggruppamenti per operazioni per flussi di dati creati da entità collegate esistenti nella stessa capacità.

Per usare al meglio il motore di calcolo, suddividere la fase ETL in due flussi di dati separati, nel modo seguente:

  • Flusso di dati 1 : questo flusso di dati deve essere solo l'inserimento di tutti i dati necessari da un'origine dati.
  • Flusso di dati 2 : eseguire tutte le operazioni ETL in questo secondo flusso di dati, ma assicurarsi di fare riferimento al flusso di dati 1, che deve trovarsi nella stessa capacità. Assicurarsi anche di eseguire operazioni che possono essere piegate prima: filtro, raggruppamento per, distinct, join. Ed eseguire queste operazioni prima di qualsiasi altra operazione, per assicurarsi che il motore di calcolo venga utilizzato.

Domande e risposte comuni

Domanda: È stato abilitato il motore di calcolo avanzato, ma gli aggiornamenti sono più lenti. Perché?

Risposta: Se si abilita il motore di calcolo avanzato, esistono due possibili spiegazioni che potrebbero causare tempi di aggiornamento più lenti:

  • Quando il motore di calcolo avanzato è abilitato, è necessario che la memoria funzioni correttamente. Di conseguenza, la memoria disponibile per eseguire un aggiornamento viene ridotta e pertanto aumenta la probabilità che gli aggiornamenti vengano accodati. Questo aumento riduce quindi il numero di flussi di dati che possono essere aggiornati contemporaneamente. Per risolvere questo problema, quando si abilita il calcolo avanzato, aumentare la memoria assegnata per i flussi di dati per garantire che la memoria disponibile per gli aggiornamenti simultanei del flusso di dati rimanga invariata.

  • Un altro motivo per cui è possibile riscontrare aggiornamenti più lenti è che il motore di calcolo funziona solo sulle entità esistenti. Se il flusso di dati fa riferimento a un'origine dati che non è un flusso di dati, non verrà visualizzato alcun miglioramento. Non ci sarà alcun aumento delle prestazioni, perché in alcuni scenari di Big Data la lettura iniziale da un'origine dati sarebbe più lenta perché i dati devono essere passati al motore di calcolo avanzato.

Domanda: Non è possibile visualizzare l'interruttore del motore di calcolo avanzato. Perché?

Risposta: il motore di calcolo avanzato viene rilasciato in fasi nelle aree in tutto il mondo, ma non è ancora disponibile in ogni area.

Domanda: Quali sono i tipi di dati supportati per il motore di calcolo?

Risposta: Il motore di calcolo avanzato e i flussi di dati supportano attualmente i tipi di dati seguenti. Se il flusso di dati non usa uno dei tipi di dati seguenti, si verifica un errore durante l'aggiornamento:

  • Data/ora
  • Numero decimale
  • Testo
  • Numero intero
  • Data/ora/fuso orario
  • True/false
  • Data
  • Time

Usare DirectQuery con flussi di dati in Power BI

È possibile usare DirectQuery per connettersi direttamente ai flussi di dati e quindi connettersi direttamente al flusso di dati senza dover importare i dati.

L'uso di DirectQuery con flussi di dati consente i miglioramenti seguenti ai processi di Power BI e dei flussi di dati:

  • Evitare pianificazioni di aggiornamento separate: DirectQuery si connette direttamente a un flusso di dati, eliminando la necessità di creare un modello semantico importato. Di conseguenza, l'uso di DirectQuery con i flussi di dati significa che non sono più necessarie pianificazioni di aggiornamento separate per il flusso di dati e il modello semantico per assicurarsi che i dati siano sincronizzati.

  • Filtro dei dati : DirectQuery è utile per lavorare su una visualizzazione filtrata dei dati all'interno di un flusso di dati. È possibile usare DirectQuery con il motore di calcolo per filtrare i dati del flusso di dati e usare il subset filtrato necessario. Il filtro dei dati consente di usare un subset più piccolo e gestibile dei dati nel flusso di dati.

Usare DirectQuery per i flussi di dati

L'uso di DirectQuery con flussi di dati è disponibile in Power BI Desktop.

Esistono prerequisiti per l'uso di DirectQuery con flussi di dati:

  • Il flusso di dati deve trovarsi all'interno di un'area di lavoro abilitata per Power BI Premium.
  • Il motore di calcolo deve essere attivato.

Per altre informazioni su DirectQuery con flussi di dati, vedere Uso di DirectQuery con flussi di dati.

Abilitare DirectQuery per i flussi di dati

Per garantire che il flusso di dati sia disponibile per l'accesso DirectQuery, il motore di calcolo avanzato deve trovarsi nello stato ottimizzato. Per abilitare DirectQuery per i flussi di dati, impostare la nuova opzione Impostazioni del motore di calcolo avanzato su .

Screenshot of the enhanced compute engine settings with the on option selected.

Dopo aver applicato questa impostazione, aggiornare il flusso di dati per rendere effettiva l'ottimizzazione.

Considerazioni e limitazioni per DirectQuery

Esistono alcune limitazioni note con DirectQuery e flussi di dati:

  • I modelli compositi/misti con origini dati di importazione e DirectQuery non sono attualmente supportati.

  • I flussi di dati di grandi dimensioni potrebbero avere problemi con i problemi di timeout durante la visualizzazione delle visualizzazioni. I flussi di dati di grandi dimensioni che si verificano problemi con i problemi di timeout devono usare la modalità di importazione.

  • Nelle impostazioni dell'origine dati il connettore del flusso di dati mostrerà credenziali non valide se si usa DirectQuery. Questo avviso non influisce sul comportamento e il modello semantico funzionerà correttamente.

Entità calcolate

È possibile eseguire calcoli in-storage quando si usano flussi di dati con una sottoscrizione di Power BI Premium. Questa funzionalità consente di eseguire calcoli sui flussi di dati esistenti e di restituire risultati che consentono di concentrarsi sulla creazione e l'analisi dei report.

Screenshot of a Power Query Editor, highlighting a table that is being edited.

Per eseguire calcoli in-storage, è prima necessario creare il flusso di dati e inserire i dati nell'archiviazione del flusso di dati di Power BI. Dopo aver creato un flusso di dati che contiene dati, è possibile creare entità calcolate, ovvero entità che eseguono calcoli in-storage.

Considerazioni e limitazioni delle entità calcolate

  • Quando si lavora con i flussi di dati creati nell'account Azure Data Lake di un'organizzazione Archiviazione Gen2, le entità collegate e le entità calcolate funzionano correttamente solo quando le entità si trovano nello stesso account di archiviazione.

Come procedura consigliata, quando si eseguono calcoli sui dati aggiunti da dati locali e cloud, creare un nuovo flusso di dati per ogni origine (una per l'ambiente locale e una per il cloud) e quindi creare un terzo flusso di dati per unire/calcolare su queste due origini dati.

Entità collegate

È possibile fare riferimento ai flussi di dati esistenti usando entità collegate con una sottoscrizione di Power BI Premium, che consente di eseguire calcoli su queste entità usando entità calcolate o di creare una tabella "singola origine della verità" che è possibile riutilizzare all'interno di più flussi di dati.

Aggiornamento incrementale

I flussi di dati possono essere impostati per l'aggiornamento incrementale per evitare di dover eseguire il pull di tutti i dati in ogni aggiornamento. A tale scopo, selezionare il flusso di dati e quindi scegliere l'icona Aggiornamento incrementale.

Screenshot of the table in a Power BI dataflow with the Incremental Refresh icon highlighted.

L'impostazione dell'aggiornamento incrementale aggiunge parametri al flusso di dati per specificare l'intervallo di date. Per informazioni dettagliate su come configurare l'aggiornamento incrementale, vedereUso dell'aggiornamento incrementale con flussi di dati.

Considerazioni relative a quando non impostare l'aggiornamento incrementale

Non impostare un flusso di dati per l'aggiornamento incrementale nelle situazioni seguenti:

  • Le entità collegate non devono usare l'aggiornamento incrementale se fanno riferimento a un flusso di dati.

Gli articoli seguenti forniscono altre informazioni sui flussi di dati e Power BI: