Condividi tramite


Mirroring Snowflake in Microsoft Fabric

Il mirroring in Fabric offre un'esperienza semplice per evitare complesse ETL (Extract Transform Load) e integrare i dati esistenti del data warehouse Snowflake con il resto dei dati in Microsoft Fabric. È possibile replicare continuamente i dati Snowflake esistenti direttamente in OneLake di Fabric. All'interno di Fabric è possibile sbloccare potenti scenari di business intelligence, intelligenza artificiale, ingegneria dei dati, data science e condivisione dei dati.

Per un'esercitazione sulla configurazione del database Snowflake per il mirroring in Fabric, vedere Esercitazione: Configurare i database con mirroring di Microsoft Fabric da Snowflake.

Perché usare il mirroring in Fabric?

Con il mirroring in infrastruttura, non è necessario unire servizi diversi da più fornitori. Al contrario, è possibile usufruire di un prodotto end-to-end altamente integrato e facile da usare progettato per semplificare le esigenze di analisi e creato per l'apertura e la collaborazione tra Microsoft, Snowflake e gli anni '000 di soluzioni tecnologiche in grado di leggere il formato di tabella Delta Lake open source.

Quali esperienze di analisi sono integrate?

I database con mirroring sono un elemento in Fabric Data Warehousing distinto dall'endpoint di analisiwarehouse e SQL.

Diagramma del mirroring del database di Fabric per Snowflake.

Il mirroring crea questi elementi nell'area di lavoro Infrastruttura:

  • Elemento del database con mirroring. Ciò consente scenari downstream come ingegneria dei dati, data science e altro ancora. Il mirroring gestisce:
    • La replicazione dei metadati della tabella Iceberg in OneLake attraverso collegamenti rapidi alla risorsa di archiviazione che contiene le tabelle Iceberg. OneLake converte automaticamente queste tabelle Iceberg in tabelle formattate Delta Lake per l'uso tra carichi di lavoro di Fabric.
    • Replica dei dati della tabella gestita in OneLake e conversione in Parquet, in un formato pronto per l'analisi.
  • Un endpoint di analisi SQL

Ogni database con mirroring ha un endpoint di analisi SQL generato automaticamente che offre un'esperienza analitica avanzata sulle tabelle Delta create dal processo di mirroring. Gli utenti hanno accesso a comandi T-SQL familiari che possono definire ed eseguire query su oggetti dati, ma non modificare i dati dall'endpoint di analisi SQL, perché si tratta di una copia di sola lettura. È possibile eseguire le azioni seguenti nell'endpoint di analisi SQL:

  • Esplorare le tabelle che fanno riferimento ai dati nelle tabelle Delta Lake da Snowflake.
  • Non creare query e viste di codice ed esplorare visivamente i dati senza scrivere una riga di codice.
  • Sviluppare viste SQL, FUNZIONI inline (Funzioni con valori di tabella) e stored procedure per incapsulare la semantica e la logica di business in T-SQL.
  • Gestire le autorizzazioni per gli oggetti.
  • Eseguire query sui dati in altri warehouse e lakehouse nella stessa area di lavoro.

Oltre all'editor di query SQL, è disponibile un ampio ecosistema di strumenti in grado di eseguire query sull'endpoint di analisi SQL, tra cui SQL Server Management Studio (SSMS),l'estensione mssql con Visual Studio Code e anche GitHub Copilot.

Considerazioni sulla sicurezza

Per abilitare il mirroring dell'infrastruttura, sono necessarie autorizzazioni utente per il database Snowflake che contiene le autorizzazioni seguenti:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Per altre informazioni, vedere la documentazione di Snowflake sui privilegi di controllo di accesso per le tabelle di streaming e sulle autorizzazioni necessarie per i flussi.

Importante

Qualsiasi sicurezza granulare stabilita nel warehouse Snowflake di origine deve essere riconfigurata nel database con mirroring in Microsoft Fabric. Per altre informazioni, vedere Autorizzazioni granulari di SQL in Microsoft Fabric.

Mirroring Snowflake dietro al firewall

Controllare i requisiti di rete per accedere all'origine dati Snowflake. Se l'origine dati Snowflake non è accessibile pubblicamente e si trova all'interno di una rete privata, creare un gateway dati di rete virtuale o installare un gateway dati locale per eseguire il mirroring dei dati. La rete virtuale di Azure o la rete del computer gateway deve connettersi all'istanza snowflake tramite un endpoint privato o essere consentita dalla regola del firewall. Per iniziare, vedere Esercitazione: Configurare i database con mirroring di Microsoft Fabric da Snowflake.

Considerazioni sul costo di Snowflake con mirroring

Il calcolo dell'infrastruttura usato per replicare i dati in Fabric OneLake è gratuito. Il costo di archiviazione del mirroring è gratuito fino a un limite in base alla capacità. Per altre informazioni, vedere Costo del mirroring e Prezzi di Microsoft Fabric. Il calcolo per l'esecuzione di query sui dati tramite SQL, Power BI o Spark viene addebitato a tariffe regolari.

Fabric non addebita costi per l'ingresso dei dati di rete in OneLake per il mirroring.

Sono previsti costi di calcolo e query cloud snowflake quando i dati vengono sottoposti a mirroring: calcolo del warehouse virtuale e calcolo dei servizi cloud.

  • Costi di calcolo del warehouse virtuale Snowflake:
    • I costi di calcolo verranno addebitati sul lato Snowflake se sono presenti modifiche ai dati che vengono lette in Snowflake e a loro volta vengono sottoposti a mirroring in Fabric.
    • Tutte le query di metadati eseguite in background per verificare la presenza di modifiche ai dati non vengono addebitate per qualsiasi calcolo Snowflake; Tuttavia, le query che producono dati, ad esempio , SELECT * riattivano il warehouse Snowflake e verranno addebitate le risorse di calcolo.
  • Costi di calcolo dei servizi Snowflake:
    • Anche se non sono previsti costi di calcolo per le attività in background, ad esempio creazione, query di metadati, controllo di accesso, visualizzazione delle modifiche dei dati e anche query DDL, sono previsti costi cloud associati a queste query.
    • A seconda del tipo di edizione Snowflake, verranno addebitati i crediti corrispondenti per i costi dei servizi cloud.

Nello screenshot seguente è possibile visualizzare i costi di calcolo del warehouse virtuale e dei servizi cloud per il database Snowflake associato di cui viene eseguito il mirroring in Fabric. In questo scenario, la maggior parte dei costi di calcolo dei servizi cloud (in giallo) proviene da query di modifica dei dati in base ai punti indicati in precedenza. I costi di calcolo del warehouse virtuale (in blu) provengono rigorosamente dalle modifiche ai dati vengono letti da Snowflake e sottoposti a mirroring in Fabric.

Screenshot del grafico dei costi di Snowflake.

Per altre informazioni sui costi di query cloud specifici di Snowflake, vedere la documentazione snowflake: Informazioni sui costi complessivi.

Passo successivo