Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Il mirroring in Fabric è una soluzione a basso costo e a bassa latenza che riunisce i dati di vari sistemi in una singola piattaforma di analisi. È possibile replicare continuamente il patrimonio di dati esistente direttamente in OneLake di Fabric da diversi database di Azure e origini dati esterne.
Con i dati più aggiornati in un formato interrogabile in OneLake, è possibile usare tutti i servizi in Fabric, ad esempio eseguendo analisi con Spark, eseguendo notebook, l'ingegneria dei dati, la visualizzazione tramite report di Power BI e altro ancora.
Usando il mirroring in Fabric, si ottiene un prodotto end-to-end altamente integrato e facile da usare che semplifica le esigenze di analisi. Il mirroring è progettato per favorire l'apertura e la collaborazione tra Microsoft e le soluzioni tecnologiche che possono leggere il formato di tabella Delta Lake open source. Si tratta di una soluzione chiavi in mano a basso costo e a bassa latenza che crea una replica dei dati in OneLake per tutte le esigenze analitiche.
È possibile usare le tabelle Delta ovunque in Fabric, il che consente di accelerare il tuo percorso in Fabric.
È possibile abilitare il mirroring creando una connessione sicura all'origine dati operativa. Si sceglie se replicare un intero database o singole tabelle e il mirroring mantiene automaticamente sincronizzati i dati. Dopo la configurazione, i dati vengono replicati in modo continuo in OneLake per l'utilizzo di analisi.
Perché usare il mirroring in Fabric?
Oggi molte organizzazioni hanno dati operativi o analitici cruciali seduti in silo.
Accedere e lavorare con questi dati richiede pipeline ETL complesse (estrazione, trasformazione e caricamento), processi aziendali e silos decisionali, che creano:
- Accesso limitato e limitato a dati importanti, in continua evoluzione
- Attrito tra persone, processi e tecnologia
- Tempi di attesa lunghi per creare pipeline e processi per dati di importanza critica
- Nessuna libertà di usare gli strumenti necessari per analizzare e condividere informazioni dettagliate comodamente
- Mancanza di una base adeguata per le persone che condividono e collaborano sui dati
- Nessun formato di dati comune e aperto per tutti gli scenari analitici- BI, intelligenza artificiale, integrazione, progettazione e persino app
Il mirroring in Fabric offre un'esperienza semplice per velocizzare il tempo per ottenere valore da intuizioni e decisioni, ed eliminare i silo di dati tra le soluzioni tecnologiche.
- Replica quasi in tempo reale di dati e metadati in un data lake SaaS, con analisi predefinite per BI e intelligenza artificiale
La piattaforma Microsoft Fabric si basa su una base di Software as a Service (SaaS), che porta semplicità e integrazione a un livello completamente nuovo. Per altre informazioni sulle Microsoft Fabric, vedere Che è Microsoft Fabric?
Di seguito sono riportati i principi fondamentali del mirroring:
L'abilitazione del mirroring in Fabric è semplice e intuitiva, senza dover creare pipeline ETL complesse, allocare altre risorse di calcolo o gestire lo spostamento dei dati.
Il mirroring in Fabric è un servizio completamente gestito, pertanto non è necessario preoccuparsi di ospitare, gestire o gestire la replica della connessione con mirroring.
Riflettere gli oggetti
Il mirroring crea questi elementi nell'area di lavoro Fabric:
- Processo che gestisce la replica di dati e metadati in OneLake e la conversione in Parquet, in un formato pronto per l'analisi. Questo processo consente scenari downstream come ingegneria dei dati, data science e altro ancora.
- Un endpoint di analisi SQL
Oltre all'editor di query SQL, è disponibile un ampio ecosistema di strumenti, tra cui SQL Server Management Studio (SSMS),l'estensione MSSQL per Visual Studio Code e anche GitHub Copilot.
La condivisione semplifica il controllo dell'accesso e la gestione delle autorizzazioni, in modo da poter proteggere le informazioni riservate. La condivisione consente anche di prendere decisioni sicure e democratizzate nell'organizzazione.
Tipi di duplicazione
Microsoft Fabric offre tre diversi approcci per l'inserimento dei dati in OneLake tramite mirroring.
- Mirroring del database: il mirroring del database in Fabric replica interi database e tabelle per riunire i dati di vari sistemi in una singola piattaforma di analisi.
- Mirroring dei metadati - Il mirroring dei metadati in Fabric sincronizza i metadati, come i nomi di catalogo, schemi e tabelle, invece di spostare fisicamente i dati. Questo approccio usa i tasti di scelta rapida, assicurando che i dati rimangano nell'origine pur essendo facilmente accessibili all'interno di Fabric.
- Mirroring aperto: il mirroring aperto in Fabric è progettato per estendere il mirroring in base al formato di tabella Delta Lake aperto. Questa funzionalità consente a qualsiasi sviluppatore di scrivere i dati delle modifiche dell'applicazione direttamente in un elemento di database con mirroring in Fabric, in base all'approccio di mirroring aperto e alle API pubbliche.
Attualmente sono disponibili i database esterni seguenti:
Replica quasi in tempo reale
La replica quasi in tempo reale può dipendere da vari fattori, tra cui:
- Località o area dell'origine
- Località o area di destinazione
- Volume di modifiche
- Frequenza delle modifiche
- Larghezza di banda e latenza di rete dall'origine
- Risorse di calcolo allocate al gateway dati locale
Come funziona il mirroring del database?
I file delta arrivano in modo incrementale in Fabric dall'origine dati. Il metodo di identificazione dei dati modificati in modo incrementale varia in ogni origine dati. In SQL Server 2025, ad esempio, sql Database Engine analizza il log delle transazioni del database di origine a una frequenza elevata. SQL Server pubblica le modifiche per ogni tabella nei file corrispondenti nella 'Fabric landing zone'.
All'interno di Fabric, un motore del replicatore funziona costantemente e analizza i file appena rilasciati ad alta frequenza. Fabric unisce immediatamente le modifiche in ingresso nella tabella delta di destinazione. Le modifiche possono essere pubblicate rapidamente ogni 15 secondi.
La logica di backoff che rileva un'attività bassa evita un sovraccarico eccessivo nei motori di origine dati all'esterno di Fabric e riduce la latenza rispondendo alla frequenza delle modifiche ai dati in ingresso.
Come funziona il mirroring dei metadati?
Il mirroring non solo abilita la replica dei dati, ma può essere ottenuto anche tramite collegamenti o mirroring dei metadati anziché la replica completa dei dati, consentendo la disponibilità dei dati senza spostarli fisicamente o duplicarli. Il mirroring in questo contesto si riferisce alla replica solo di metadati, ad esempio nomi di catalogo, schemi e tabelle, anziché i dati effettivi stessi. Questo approccio consente a Fabric di rendere accessibili i dati da origini diverse senza duplicarli, semplificando la gestione dei dati e riducendo al minimo le esigenze di archiviazione.
Ad esempio, quando si accede a dati registrati in Unity Catalog, Fabric rispecchia solo la struttura del catalogo di Azure Databricks, consentendo l'accesso ai dati sottostanti tramite scorciatoie. Questo metodo garantisce che le modifiche apportate ai dati di origine vengano riflesse immediatamente in Fabric senza richiedere lo spostamento dei dati, mantenendo la sincronizzazione in tempo reale e migliorando l'efficienza nell'accesso alle informazioni up-to-date.
Come funziona il mirroring aperto?
Oltre ad abilitare la replica dei dati creando una connessione sicura all'origine dati, il mirroring consente di selezionare un provider di dati esistente o scrivere un'applicazione personalizzata per trasferire i dati in un database con mirroring. Quando si crea un database con mirroring aperto tramite l'API pubblica o il portale di Fabric, si ottiene un URL della zona di destinazione in OneLake in cui è possibile impostare i dati delle modifiche in base alla specifica del mirroring aperto.
Quando i dati si trovano nella zona di atterraggio con il formato corretto, la replica inizia automaticamente e gestisce la complessità dell'integrazione delle modifiche con gli aggiornamenti, l'inserimento e l'eliminazione che si riflettono nelle tabelle delta. Questo metodo garantisce che tutti i dati scritti nella zona di destinazione vengano immediatamente riflessi, mantenendo i dati in Fabric up-to-date.
Condivisione
La condivisione semplifica il controllo di accesso e la gestione. Controlli di sicurezza quali sicurezza a livello di riga (RLS), sicurezza a livello di oggetto (OLS) e altro ancora assicurano di poter controllare l'accesso alle informazioni riservate. La condivisione consente anche di prendere decisioni sicure e democratizzate nell'organizzazione.
Condividendo, gli utenti concedono ad altri utenti o a un gruppo di utenti l'accesso a un database con mirroring senza concedere l'accesso all'area di lavoro e al resto degli elementi. Quando un utente condivide un database con mirroring, concede anche l'accesso all'endpoint di analisi SQL.
Per altre informazioni, vedere Condividere il database con mirroring e gestire le autorizzazioni.
Query interdatabase
Con i dati del database con mirroring archiviati in OneLake, è possibile scrivere query tra database, unire dati da database con mirroring, warehouse e endpoint di analisi SQL di Lakehouse in una singola query T-SQL. Per altre informazioni, vedere Scrivere una query tra più database.
Ad esempio, è possibile fare riferimento alla tabella da database e magazzini con mirroring utilizzando la denominazione in tre parti. Nell'esempio seguente usare il nome in tre parti per fare riferimento a ContosoSalesTable nel magazzino ContosoWarehouse. Da altri database o magazzini dati, la prima parte della convenzione di denominazione standard di SQL in tre parti è il nome del database specchiato.
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
Costo del mirroring
Per il mirroring del database e il mirroring aperto, il calcolo della piattaforma Fabric e l'archiviazione OneLake sono gratuiti fino a un limite basato sulla capacità.
- L'archiviazione per le repliche è gratuita fino a un limite in base alla dimensione della capacità. Il mirroring offre un terabyte gratuito di archiviazione del mirroring per ogni unità di capacità (CU) acquistata. Ad esempio, se si acquista una capacità F64, si ottengono 64 terabyte gratuiti di spazio di archiviazione, usato esclusivamente per il mirroring. Si paga per l'archiviazione OneLake se si supera il limite di archiviazione di mirroring gratuito o quando la capacità viene sospesa. Per altre informazioni, vedere Microsoft Fabric Pricing.
- Il calcolo di back-end utilizzato per replicare i dati in Fabric OneLake è gratuito e non consuma capacità. Le richieste direttamente a OneLake per i dati specchiati consumano capacità come il normale utilizzo computazionale di OneLake. Il calcolo per l'esecuzione di query sui dati tramite SQL, Power BI o Spark viene addebitato a tariffe regolari.
- Per la configurazione iniziale del mirroring è necessaria una capacità del Fabric attiva.
Ingegneria dei dati con il database duplicato
Microsoft Fabric offre varie funzionalità di progettazione dei dati per garantire che i dati siano facilmente accessibili, organizzati e di alta qualità. Da Fabric Data Engineering è possibile:
- La creazione e la gestione dei dati con Spark usando un lakehouse
- Progettare pipeline per copiare dati in un lakehouse
- Usare le definizioni dei processi Spark per inviare un processo batch o di streaming al cluster Spark
- Usare i notebook per scrivere codice per l'inserimento, la preparazione e la trasformazione dei dati
Data science con i dati replicati del database
Microsoft Fabric offre l'analisi scientifica dei dati di Fabric per consentire agli utenti di completare flussi di lavoro di data science end-to-end ai fini dell'arricchimento dei dati e delle informazioni aziendali. È possibile completare un'ampia gamma di attività nell'intero processo di analisi scientifica dei dati, a partire dall'esplorazione dei dati, dalla preparazione e dalla pulizia alla sperimentazione, alla modellazione, al punteggio del modello e alla gestione di informazioni dettagliate predittive nei report bi.
Microsoft Fabric gli utenti possono accedere ai carichi di lavoro di Data Science. Da qui possono individuare e accedere a varie risorse pertinenti. Ad esempio, possono creare esperimenti, modelli e notebook di Machine Learning. Possono anche importare i notebook esistenti sulla pagina principale di Data Science.
Direct Lake con i dati del database duplicato
È possibile usare la modalità Direct Lake con database con mirroring in Microsoft Fabric per consentire l'esecuzione di query ad alte prestazioni sui dati con mirroring senza la necessità di spostamento o duplicazione dei dati. Quando si crea un database con mirroring, i relativi dati vengono archiviati in formato Delta Lake all'interno di OneLake. Questo formato nativo consente Power BI e altri strumenti di analisi di connettersi tramite la modalità Direct Lake, offrendo informazioni dettagliate quasi in tempo reale accedendo direttamente ai file sottostanti. Questa integrazione combina la semplicità del mirroring con la velocità e scalabilità di Direct Lake, consentendo una reportistica rapida e aggiornata sui dati operativi.
Conservazione dei dati speculari
Il mirroring in Fabric replica costantemente l'ambiente di dati esistente in OneLake in formato di tabella Delta Lake. Per mantenere i dati con mirroring archiviati in modo efficiente e sempre pronti per l'analisi, il processo di mirroring esegue automaticamente vacuum per rimuovere i file vecchi a cui non fa più riferimento un log Delta.
È possibile personalizzare l'impostazione di conservazione in base ai requisiti. Ad esempio, è possibile scegliere un periodo di conservazione più breve per ridurre il consumo di archiviazione del mirroring o estendere il periodo di conservazione per usare le funzionalità di viaggio nel tempo di Delta per l'analisi.
Per i database con mirroring creati dal portale di Fabric dopo la metà di giugno 2025, la conservazione predefinita è un giorno. Per i database con mirroring precedenti, il valore predefinito è sette giorni. Per controllare o aggiornare l'impostazione di conservazione, nel portale Fabric, passare al database con mirroring ->Impostazioni ->Gestione tabelle Delta e specificare la soglia di conservazione. È anche possibile configurarla tramite l'API pubblica specificando la retentionInDays proprietà .
Database SQL su Fabric
È anche possibile creare e gestire direttamente un database SQL in Microsoft Fabric all'interno del portale di Fabric. In base al database SQL di Azure, il database SQL in Fabric esegue automaticamente il mirroring dei dati a scopo di analisi ed è possibile creare facilmente il database operativo in Fabric. Il database SQL è la home page di Fabric per i carichi di lavoro OLTP e può essere integrato con l'integrazione del controllo del codice sorgente di Fabric.