Specchio di Snowflake in Microsoft Fabric

Mirroring in Fabric offre un'esperienza semplice per evitare complessi ETL (Extract Transform Load) e integrare i dati esistenti del data warehouse Snowflake con il resto dei dati in Microsoft Fabric. È possibile replicare continuamente i dati Snowflake esistenti direttamente in OneLake di Fabric. All'interno di Fabric è possibile sbloccare potenti scenari di business intelligence, intelligenza artificiale, ingegneria dei dati, data science e condivisione dei dati.

Per una guida sulla configurazione del database Snowflake per il mirroring in Fabric, consulta Tutorial: Configurare i database con mirroring Microsoft Fabric da Snowflake.

Perché usare il mirroring in Fabric?

Con il Mirroring in Fabric, non è necessario unire servizi diversi da più fornitori. Al contrario, è possibile usufruire di un prodotto end-to-end altamente integrato e facile da usare, progettato per semplificare le tue esigenze di analisi e sviluppato per garantire apertura e collaborazione tra Microsoft, Snowflake e le migliaia di soluzioni tecnologiche in grado di leggere il formato di tabella open-source Delta Lake.

Quali esperienze di analisi sono integrate?

I database con mirroring sono un elemento nel Fabric Data Warehousing distinto dal Warehouse e dall'endpoint di analisi SQL.

Diagramma del mirroring del database di Fabric per Snowflake.

Il mirroring crea questi elementi nell'area di lavoro Fabric.

Elemento del database mirato. Ciò consente scenari downstream come ingegneria dei dati, data science e altro ancora. Il mirroring gestisce:
- La replicazione dei dati delle tabelle gestite e delle viste in OneLake e la conversione in Parquet, in un formato pronto per l'analisi.
- La replicazione dei metadati delle tabelle Iceberg in OneLake tramite collegamenti e conversione dell'archiviazione che ospita le tabelle Iceberg. OneLake converte automaticamente queste tabelle Iceberg in tabelle formattate Delta Lake per l'uso tra carichi di lavoro di Fabric.
Un endpoint di analisi SQL

Importante

Supporto della tabella Iceberg: se si sceglie di eseguire il mirroring delle tabelle Iceberg, è necessario fornire una connessione di archiviazione alla risorsa di archiviazione sottostante che contiene i dati della tabella Iceberg. Solo le tabelle Iceberg raggiungibili tramite la stessa connessione di archiviazione possono essere sottoposte a mirroring insieme. Per trovare la posizione di archiviazione per una tabella Iceberg, eseguire la funzione di sistema SYSTEM$GET_ICEBERG_TABLE_INFORMATION in Snowflake. Per ulteriori informazioni, vedere Esercitazione: Configurare i database con mirroring di Microsoft Fabric da Snowflake.

Ogni database con mirroring ha un endpoint di analisi SQL generato automaticamente che offre un'esperienza analitica avanzata sulle tabelle Delta create dal processo di mirroring. Gli utenti hanno accesso a comandi T-SQL familiari che possono definire ed eseguire query su oggetti dati, ma non modificare i dati dall'endpoint di analisi SQL, perché si tratta di una copia di sola lettura. È possibile eseguire le azioni seguenti nell'endpoint di analisi SQL:

Esplora le tabelle che fanno riferimento ai dati nelle tue tabelle Delta Lake da Snowflake.
Crea query e viste senza codice ed esplora i dati visivamente senza scrivere una riga di codice.
Sviluppare viste SQL, funzioni in linea con valori di tabella (FVF) e stored procedure per incapsulare la semantica e la logica di business in T-SQL.
Gestire le autorizzazioni per gli oggetti.
Eseguire query sui dati in altri warehouse e lakehouse nella stessa area di lavoro.

Oltre all'editor di query SQL, esiste un ampio ecosistema di strumenti in grado di eseguire query sull'endpoint di analisi SQL, tra cui SQL Server Management Studio (SSMS), l'estensione MSSQL per Visual Studio Code e anche GitHub Copilot.

Tipi di oggetto Snowflake supportati

Nella tabella seguente sono elencati i tipi di oggetto Snowflake supportati per il mirroring:

Tipo di oggetto	Supportato	Notes
Tabelle gestite	Yes	Completamente supportato per la replica
Tabelle Iceberg	Yes	Richiede una connessione allo spazio di archiviazione della tabella Iceberg sottostante. È possibile eseguire il mirroring solo delle tabelle Iceberg raggiungibili tramite la stessa connessione di archiviazione.
Views	Yes	Supporta sincronizzazioni ogni 12 ore
Viste materializzate	Yes	Supportato con sincronizzazioni ogni 12 ore
Tabelle esterne	No	Non supportato
Tabelle temporanee	No	Non supportato
Tabelle temporanee	No	Non supportato
Tabelle dinamiche	No	Non supportato

Considerazioni sulla sicurezza

Per abilitare il mirroring di Fabric, sono necessarie autorizzazioni utente per il database Snowflake che concede le seguenti autorizzazioni:

CREATE STREAM
SELECT table
SHOW tables
DESCRIBE tables

Per altre informazioni, vedere la documentazione di Snowflake su Controllo di accesso Privilegi per le tabelle di streaming e Required Permissions for Streams.

Importante

Qualsiasi sicurezza granulare stabilita nel warehouse Snowflake di origine deve essere riconfigurata nel database con mirroring in Microsoft Fabric. Per ulteriori informazioni, vedere autorizzazioni granulari SQL in Microsoft Fabric.

Metodi di autenticazione supportati

La tabella seguente elenca i metodi di autenticazione supportati per il mirroring per Snowflake:

Metodo di autenticazione	Supportato	Notes
Nome utente e password	Yes	Autenticazione nativa di Snowflake
Microsoft Entra ID (SSO)	Yes	Single Sign-On tramite Entra ID
Autenticazione della coppia di chiavi	Yes	Coppia di chiavi RSA per scenari con account di servizio
Identità dell'area di lavoro	No	Non attualmente supportato per Snowflake

Mirroring Snowflake dietro al firewall

Controllare i requisiti di rete per accedere all'origine dati Snowflake. Se l'origine dati Snowflake non è accessibile pubblicamente e si trova all'interno di una rete privata, creare un gateway dati di rete virtuale o installare un gateway dati locale per eseguire il mirroring dei dati. La Rete virtuale di Azure o la rete del computer gateway deve connettersi all'istanza Snowflake tramite un endpoint privato o essere consentite dalla regola del firewall. Per iniziare, vedere Tutorial: Configurare i database con mirroring abilitato in Microsoft Fabric da Snowflake.

collegamento privato e identità dell'area di lavoro:

collegamento privato: la connettività collegamento privato diretta tra un'area di lavoro Fabric e Snowflake non è ancora supportata. Nel frattempo, usare un gateway dati di rete virtuale o un gateway dati locale per la connettività privata.
Identità dell'area di lavoro: l'autenticazione dell'identità dell'area di lavoro non è attualmente supportata per il mirroring Snowflake.

Considerazioni sul costo di Snowflake con mirroring

Il calcolo di Fabric usato per replicare i dati in Fabric OneLake è gratuito. Il costo di archiviazione del mirroring è gratuito fino a un limite in base alla capacità. Per altre informazioni, vedere Costo del mirroring e Microsoft Fabric Prezzi. Il calcolo per l'esecuzione di query sui dati tramite SQL, Power BI o Spark viene addebitato a tariffe regolari.

Fabric non addebita costi per l'ingresso dei dati di rete in OneLake per il mirroring.

Sono previsti costi di calcolo e query cloud di Snowflake quando i dati vengono sottoposti a mirroring: calcolo del magazzino virtuale e calcolo dei servizi cloud.

Costi di calcolo del warehouse virtuale Snowflake:
- I costi di calcolo verranno addebitati sul lato Snowflake se sono presenti modifiche ai dati che vengono lette in Snowflake e a loro volta vengono sottoposti a mirroring in Fabric.
- Tutte le query di metadati eseguite in background per controllare eventuali modifiche ai dati non comportano costi di calcolo Snowflake; tuttavia, le query che generano dati, come ad esempio SELECT *, risvegliano il warehouse Snowflake e comportano spese per le risorse di calcolo.
Costi di calcolo dei servizi Snowflake:
- Anche se non sono previsti costi di calcolo per le attività in background, ad esempio creazione, query di metadati, controllo di accesso, visualizzazione delle modifiche dei dati e anche query DDL, sono previsti costi cloud associati a queste query.
- A seconda del tipo di edizione Snowflake di cui si dispone, verranno addebitati i crediti corrispondenti per i costi dei servizi cloud.

Nello screenshot seguente è possibile visualizzare i costi di calcolo del warehouse virtuale e dei servizi cloud per il database Snowflake associato di cui viene eseguito il mirroring in Fabric. In questo scenario, la maggior parte dei costi di calcolo dei servizi cloud (in giallo) proviene da query di modifica dei dati in base ai punti indicati in precedenza. I costi di calcolo del warehouse virtuale (in blu) derivano esclusivamente dalle modifiche ai dati, che vengono letti da Snowflake e sottoposti a mirroring in Fabric.

Consigli sull'ottimizzazione dei costi

Per ridurre al minimo i costi di elaborazione di Snowflake dovuti al mirroring, considera le seguenti best practice:

Riutilizzare un magazzino esistente. Anziché creare un warehouse dedicato per il mirroring, configurare il mirroring per usare lo stesso warehouse già usato dalle applicazioni per aggiornare le tabelle di origine. Questo approccio evita i cicli di riattivazione e sospensione automatica del magazzino non necessari. Quando l'applicazione aggiorna una tabella, il replicatore del mirroring rileva le modifiche quasi immediatamente mentre il warehouse è ancora attivo, quindi non è necessario attivare un warehouse separato. Alcune organizzazioni potrebbero preferire un warehouse dedicato per isolare il budget. Questa preferenza è un compromesso tra risparmio sui costi e granularità del budget.
Esegui il mirroring solo delle tabelle necessarie. Il mirroring di un intero database può causare un consumo di Snowflake inaspettatamente elevato e picchi della capacità di Fabric. Per iniziare, selezionare solo le tabelle necessarie per gli scenari di analisi. È possibile aggiungere tabelle in un secondo momento in base alle esigenze.
Monitorare la presenza di risemine impreviste. Un reload completo dei dati elabora l'intera tabella e comporta costi di calcolo proporzionali alle dimensioni della tabella. Le modifiche dello schema, incluse quelle attivate da strumenti come DBT, possono causare la reinizialità continua. Nella pagina Stato mirroring, controlla le tabelle che mostrano una ripetizione della copia iniziale ed esamina la sezione Reinizializzazione riportata di seguito per i fattori di attivazione e le indicazioni per la risoluzione dei problemi.
Tenere presente che il mirroring viene eseguito in modo continuo. Il mirroring non supporta attualmente la pianificazione o le finestre di replica. Il replicatore interroga continuamente le modifiche, generando un consumo continuo delle risorse di calcolo di Snowflake. Pianificate di conseguenza i budget di Snowflake.

Per altre informazioni sui costi di query cloud specifici di Snowflake, vedere la documentazione Snowflake: Comprendere i costi complessivi.

Passo successivo

Tutorial: Configurare i database mirror di Microsoft Fabric con Snowflake

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-07-03