Estrarre dati delle modifiche tramite l'origine CDC
Si applica a: SQL Server SSIS Integration Runtime in Azure Data Factory
Importante
I componenti del flusso CDC, tra cui l'attività di controllo CDC, l'origine CDC e CDC Splitter, sono deprecati. Per altri dettagli, si veda l'annuncio.
Per aggiungere e configurare un'origine CDC, è necessario che il pacchetto includa già almeno un'attività Flusso di dati e un'attività di controllo CDC.
Per altre informazioni sull'attività di controllo CDC, vedere Attività di controllo CDC.
Per altre informazioni sull'origine CDC, vedere Origine CDC.
Per estrarre dati delle modifiche tramite un'origine CDC
In SQL Server Data Tools aprire il progetto di SQL Server 2019 Integration Services (SSIS) che contiene il pacchetto desiderato.
In Esplora soluzioni fare doppio clic sul pacchetto per aprirlo.
Fare clic sulla scheda Flusso di dati e quindi, dalla casella degli strumenti, trascinare l'origine CDC sull'area di progettazione.
Fare doppio clic sull'origine CDC.
Nella pagina Gestione connessione della finestra di dialogo Editor origine CDC selezionare nell'elenco una gestione connessione ADO.NET esistente oppure fare clic su Nuova per creare una nuova connessione. La connessione deve essere stabilita a un database di SQL Server contenente le tabelle delle modifiche da leggere.
Selezionare la tabella CDC in cui si vuole elaborare le modifiche.
Selezionare o digitare il nome dell' istanza di acquisizione CDC con la tabella CDC da leggere.
Una tabella di origine acquisita può contenere una o due istanze acquisite per gestire la transizione senza problemi della definizione di tabella mediante modifiche dello schema. Se per la tabella di origine in corso di acquisizione sono definite più istanze di acquisizione, selezionare l'istanza di acquisizione che si desidera utilizzare a questo punto. Il nome dell'istanza di acquisizione predefinito per una tabella [schema].[tabella] è <schema>_<tabella>, ma i nomi delle istanze di acquisizione effettivi in uso possono essere diversi. La tabella effettiva da cui viene eseguita la lettura è la tabella CDC cdc .<istanza-acquisizione>_CT.
Selezionare la modalità di elaborazione più adatta per le esigenze di elaborazione correnti. Di seguito sono elencate le opzioni possibili:
All: restituisce le modifiche nell'intervallo CDC corrente senza i valori Before Update .
All with old values: restituisce le modifiche nell'intervallo di elaborazione CDC corrente inclusi i valori precedenti (Before Update). Ogni operazione di aggiornamento prevede due righe: una con i valori prima dell'aggiornamento e una con i valori dopo l'aggiornamento.
Net: restituisce una sola riga delle modifiche per ogni riga di origine modificata nell'intervallo di elaborazione CDC corrente. Se una riga di origine è stata aggiornata più volte, viene restituita la modifica combinata (ad esempio, inserimento+aggiornamento viene prodotto come un singolo aggiornamento e aggiornamento+eliminazione viene prodotto come una singola eliminazione). Quando si utilizza la modalità di elaborazione delle modifiche Net, è possibile suddividere le modifiche negli output Delete, Insert e Update e gestirli in parallelo, perché la singola riga di origine viene visualizzata in più output.
Net with update mask: questa modalità è simile alla modalità Net standard, ma aggiunge anche colonne booleane con il modello di nome __$<nome-colonna>__Changed, che indica la presenza di colonne modificate nella riga delle modifiche corrente.
Net with merge: questa modalità è simile alla modalità Net standard, ma con le operazioni Insert e Update unite in una singola operazione Merge (UPSERT).
Selezionare la variabile del pacchetto di stringhe SSIS che gestisce lo stato CDC per il contesto CDC corrente. Per altre informazioni sulla variabile di stato CDC, vedere Definire una variabile di stato.
Selezionare la casella di controllo Include reprocessing indicator column per creare una speciale colonna di output denominata __$reprocessing. Questa colonna contiene un valore true quando l'intervallo di elaborazione CDC si sovrappone all'intervallo di elaborazione iniziale (l'intervallo di LSN che corrisponde al periodo di caricamento iniziale) o quando un intervallo di elaborazione CDC viene rielaborato a causa di un errore in un'esecuzione precedente. Questa colonna indicatore consente agli sviluppatori di SSIS di gestire gli errori in modo diverso durante la rielaborazione delle modifiche. Azioni quali l'eliminazione di una riga non esistente e l'inserimento non riuscito su una chiave duplicata, ad esempio, possono essere ignorate.
Per altre informazioni, vedere Proprietà personalizzate dell'origine CDC.
Per aggiornare il mapping tra colonne esterne e colonne di output, fare clic su Colonne e selezionare colonne diverse nell'elenco Colonna esterna .
Facoltativamente, aggiornare i valori delle colonne di output eliminando i valori nell'elenco Colonna di output .
Per configurare l'output degli errori, fare clic su Output errori.
Facendo clic su Anteprima è possibile visualizzare fino a 200 righe di dati estratti dall'origine CDC.
Fare clic su OK.
Vedi anche
Editor origine CDC (pagina Gestione connessione)
Editor origine CDC (pagina Colonne)
Editor origine CDC (pagina Output degli errori)