Leggi in inglese

Condividi tramite


Mirroring Snowflake in Microsoft Fabric

Il mirroring in Fabric offre un'esperienza semplice per evitare complessi ETL (Extract Transform Load) e integrare i dati esistenti del warehouse Snowflake con il resto dei dati in Microsoft Fabric. È possibile replicare continuamente i dati Snowflake esistenti direttamente in OneLake di Fabric. All'interno di Fabric è possibile sbloccare potenti scenari di business intelligence, intelligenza artificiale, Ingegneria dei dati, data science e condivisione dei dati.

Per un'esercitazione sulla configurazione del database Snowflake per il mirroring in Fabric, vedere Esercitazione: Configurare i database con mirroring di Microsoft Fabric da Snowflake.

Perché usare il mirroring in Fabric?

Con il mirroring in Fabric, non è necessario unire servizi diversi da più fornitori. Invece, è possibile usufruire di un prodotto end-to-end altamente integrato e facile da usare, progettato per semplificare le esigenze di analisi e creato per l'apertura e la collaborazione tra Microsoft, Snowflake e le migliaia di soluzioni tecnologiche in grado di leggere il formato di tabella Delta Lake open source.

Quali esperienze di analisi sono integrate?

I database con mirroring sono un elemento in Fabric Archiviazione dati distinto dal Warehouse e dall'endpoint di analisi SQL.

Diagramma del mirroraggio del database di Fabric per Snowflake.

Il mirroring crea tre elementi nell'area di lavoro di Fabric:

  • Elemento del database rispecchiato. Il mirroring gestisce la replica dei dati in OneLake e la conversione in Parquet, in un formato pronto per l'analisi. Questo consente scenari downstream quali ingegneria dei dati, data science e altri.
  • Un endpoint di analisi SQL
  • Un modello semantico predefinito

Ogni database con mirroring dispone di un endpoint di analisi SQL generato automaticamente, che offre un'esperienza analitica avanzata sulle tabelle Delta create dal processo di mirroring. Gli utenti hanno accesso a comandi T-SQL familiari che possono definire ed eseguire query su oggetti dati, ma non modificare i dati dall'endpoint di analisi SQL, in quanto si tratta di una copia di sola lettura. Nell'endpoint di analisi SQL è possibile effettuare le seguenti azioni:

  • Esplora le tabelle che fanno riferimento ai dati delle tue tabelle Delta Lake da Snowflake.
  • Creare query e visualizzazioni senza codice ed esplorare i dati visivamente senza scrivere una riga di codice.
  • Sviluppare viste SQL, funzioni con valore di tabella (TVF) inline e procedure memorizzate per incapsulare la semantica e la logica aziendale in T-SQL.
  • Gestire le autorizzazioni per gli oggetti.
  • Eseguire query sui dati in altre Warehouse e Lakehouse nella stessa area di lavoro.

Oltre all'editor di query SQL, è disponibile un ampio ecosistema di strumenti in grado di eseguire query sull'endpoint di analisi SQL, tra cui SQL Server Management Studio (SSMS), l'estensione mssql con Visual Studio Code e anche GitHubCopilot.

Considerazioni relative alla sicurezza

Per abilitare il mirroring di Fabric, è necessaria l’autorizzazione dell’utente per il database Snowflake che contiene le seguenti autorizzazioni:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Per altre informazioni, vedere la documentazione di Snowflake sui Privilegi di Controllo di accesso per le tabelle di Streaming e sulle Autorizzazioni necessarie per i flussi.

Importante

Qualsiasi sicurezza granulare stabilita nella warehouse Snowflake di origine deve essere riconfigurata nel database mirror di Microsoft Fabric. Per altre informazioni, vedere Autorizzazioni granulari SQL in Microsoft Fabric.

Considerazioni sui costi dello Snowflake con mirroring

Il calcolo del sistema utilizzato per replicare i tuoi dati in Fabric OneLake è gratuito. Il costo di archiviazione del mirroring è gratuito fino a un limite in base alla capacità. Per ulteriori informazioni, consultare Costo del mirroring e Prezzi di Microsoft Fabric. Il calcolo per l'esecuzione di query sui dati tramite SQL, Power BI o Spark viene addebitato a tariffe regolari.

Fabric non addebita costi per l'ingresso dei dati di rete in OneLake per il mirroring.

Sono previsti costi di calcolo e query su Snowflake nel cloud quando i dati vengono sottoposti a mirroring: calcolo del data warehouse virtuale e calcolo dei servizi cloud.

  • Costi di calcolo della warehouse virtuale Snowflake:
    • I costi di calcolo verranno addebitati sul lato di Snowflake se ci sono modifiche ai dati che vengono letti in Snowflake e, a loro volta, duplicati in Fabric.
    • Tutte le query di metadati eseguite in background per verificare la presenza di modifiche ai dati non comportano costi per l'utilizzo delle risorse di calcolo di Snowflake; tuttavia, le query che producono dati, come ad esempio SELECT *, attivano la warehouse Snowflake e il calcolo verrà addebitato.
  • Costi di calcolo dei servizi Snowflake:
    • Anche se non sono previsti costi di calcolo per le attività in background, ad esempio la creazione, la query di metadati, il controllo di accesso, la visualizzazione delle modifiche dei dati e anche la query DDL, sono previsti costi cloud associati a queste query.
    • A seconda del tipo di edizione di Snowflake di cui si dispone, verranno addebitati i crediti corrispondenti per i costi dei servizi cloud.

Nello screenshot seguente è possibile visualizzare i costi di calcolo della warehouse virtuale e dei servizi cloud per il database Snowflake associato di cui viene eseguito il mirroring in Fabric. In questo scenario, la maggior parte dei costi di calcolo dei servizi cloud (in giallo) proviene da query di modifica dei dati in base ai punti indicati in precedenza. I costi di calcolo della warehouse virtuale (in blu) derivano esclusivamente dai cambiamenti nei dati letti da Snowflake e rispecchiati in Fabric.

Screenshot del grafico dei costi di Snowflake.

Per altre informazioni sui costi di query cloud specifici di Snowflake, vedere la Documentazione Snowflake: Informazioni sui costi complessivi.

Passaggio successivo