Feed di modifiche per il collegamento ad Azure Synapse per SQL
Si applica a: SQL Server 2022 (16.x) database SQL di Azure Azure Synapse Analytics
Questo articolo include dettagli su come funziona il feed di modifica Collegamento ad Azure Synapse per SQL, una nuova funzionalità per SQL Server 2022 (16.x) e database SQL di Azure.
SQL Server 2022 (16.x) introduce una nuova funzionalità che consente la connettività tra tabelle di SQL Server e la piattaforma Microsoft Azure Synapse, denominata collegamento ad Azure Synapse per SQL. Il collegamento ad Azure Synapse per SQL fornisce feed di modifiche automatici che acquisiscono le modifiche all'interno di SQL Server e le caricano in Azure Synapse Analytics.
- Che cos'è Collegamento ad Azure Synapse per SQL?
- Per altre informazioni, vedere:
- Per iniziare velocemente, vedere:
Questa funzionalità non è attualmente disponibile per Istanza gestita di SQL di Azure.
Nota
L'abilitazione di Collegamento ad Azure Synapse per SQL creerà un utente del database changefeed
, uno schema changefeed
e diverse tabelle all'interno dello schema changefeed
nel database di origine. Non modificare nessuno di questi oggetti: sono gestiti dal sistema.
Zona di destinazione
Per altre informazioni sulla zona di destinazione per il collegamento ad Azure Synapse per SQL Server, vedere Zona di destinazione per il collegamento ad Azure Synapse per SQL Server.
Anche se Collegamento ad Azure Synapse per SQL Server include risorse di Azure con provisioning da parte dell'utente, tra cui un account di archiviazione Azure Data Lake Storage (ADLS) Gen2, Collegamento ad Azure Synapse per il database SQL di Azure è completamente gestito, incluso il provisioning della zona di destinazione e usa processi di rilevamento delle modifiche simili, come descritto in questo articolo. Per altre informazioni, vedere Collegamento a Synapse di Azure per il database SQL di Azure.
Per SQL Server, la località di archiviazione di Azure della zona di destinazione è gestita dal cliente e visibile, ma non è consigliabile o supportato l'uso o la modifica dei file nella zona di destinazione.
Funzionalità feed di modifiche
Un amministratore di SQL Server può abilitare Collegamento ad Azure Synapse in una tabella vuota o in una che contiene già dati. La tabella di origine deve includere una chiave primaria.
In una tabella che contiene già dati, Collegamento ad Azure Synapse eseguirà il seeding della zona di destinazione con uno snapshot completo iniziale della tabella di origine. Quando una tabella di SQL Server esistente contenente dati viene aggiunta a Collegamento ad Azure Synapse, viene generato uno snapshot completo del set di dati iniziale. Il file snapshot iniziale è un file di formato parquet trasmesso alla zona di destinazione in ADLS Gen2.
Collegamento ad Azure Synapse supporta il push a bassa latenza delle modifiche delle tabelle di origine nella zona di destinazione in Archiviazione di Azure. Il feed di modifiche usa un file CSV per pubblicare queste modifiche in Azure Synapse. Questo formato tabulare è naturalmente allineato alla scrittura delle modifiche di dati granulari delle righe a una frequenza elevata (nell'ordine di secondi). La maggior parte dei file CSV deve essere relativamente piccola.
Acquisizione delle modifiche
L'acquisizione delle modifiche per Collegamento ad Azure Synapse è simile alla tecnologia CDC (Change Data Capture) esistente. L'origine dei dati delle modifiche è il log delle transazioni di SQL Server. Il feed di modifiche legge il log e aggiunge informazioni sulle modifiche apportate alla zona di destinazione.
CDC esegue la raccolta del log delle transazioni per acquisire tutte le modifiche eseguite in una o più tabelle di origine.
- In CDC i dati delle modifiche vengono popolati internamente in una tabella di pari livello nel database.
- In Collegamento ad Azure Synapse i dati vengono letti direttamente dal log delle transazioni del database, memorizzati nella cache e infine scritti nella zona di destinazione in Archiviazione di Azure.
Un'interruzione del servizio di archiviazione può causare la mancata disponibilità della zona di destinazione, bloccando le pubblicazioni in tale zona di destinazione. In modo analogo al comportamento di SQL Server quando l'agente di lettura log di CDC ha esito negativo o non è in esecuzione, il log delle transazioni del database di origine non può essere troncato. Nel caso di un'interruzione prolungata del servizio di archiviazione o di una modifica della configurazione dell'archiviazione che ne causa l'inaccessibilità, arrestare il Collegamento a Synapse di Azure tramite Synapse Studio.
Supporto per la disponibilità elevata
Collegamento ad Azure Synapse per SQL Server è compatibile con i gruppi di disponibilità Always On e le istanze del cluster di failover.
Se uno snapshot iniziale è in corso e viene interrotto per qualsiasi motivo, il processo di esportazione dello snapshot iniziale viene riavviato. Questo è il caso in cui un server SQL esegue il failover nell'istanza del cluster di failover o nel gruppo di disponibilità sincrono.
Database con mirroring dell'infrastruttura
La funzionalità Database con mirroring dell'infrastruttura usa una tecnologia di feed di modifiche simile a quella di Azure Collegamento a Synapse e condivide alcuni oggetti di sistema. Per altre informazioni, vedi:
- Database mirror di Microsoft Fabric (anteprima)
- Monitoraggio dei database mirror di Microsoft Fabric
- Esplorare i dati nel database mirror con Microsoft Fabric
Contenuto correlato
- Che cos'è Collegamento ad Azure Synapse per SQL?
- Novità di SQL Server 2022
- Collegamento ad Azure Synapse per SQL Server
- Collegamento ad Azure Synapse per il database SQL di Azure
- Collegamento ad Azure Synapse per Azure Cosmos DB
- Azure Synapse Link for Dataverse
- Introduzione a Collegamento ad Azure Synapse per SQL Server