Sdílet prostřednictvím


Přírůstkové kopírování dat z Azure SQL Database do služby Blob Storage pomocí sledování změn v Azure Portal

VZTAHUJE SE NA: Azure Data Factory Azure Synapse Analytics

Návod

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje vše od přesunu dat až po datovou vědu, analýzy v reálném čase, podnikovou inteligenci a reportování. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

V řešení integrace dat je přírůstkové načítání dat po počátečním načtení dat široce používaným scénářem. Změněná data v určitém období ve zdrojovém úložišti dat lze snadno rozdělit na řezy (například LastModifyTime). CreationTime V některých případech však neexistuje žádný explicitní způsob, jak identifikovat rozdílová data z posledního zpracování dat. K identifikaci rozdílových dat můžete použít technologii sledování změn podporovanou úložišti dat, jako je Azure SQL Database a SQL Server.

Tento kurz popisuje, jak pomocí Azure Data Factory se sledováním změn přírůstkově načítat rozdílová data z Azure SQL Database do Azure Blob Storage. Další informace o sledování změn naleznete v tématu Sledování změn na serveru SQL Server.

V tomto kurzu provedete následující kroky:

  • Připravte zdrojové úložiště dat.
  • Vytvořte datovou továrnu.
  • Vytvoření propojených služeb
  • Vytvářejte zdrojové datové sady, datové sady jímky a sledovací datové sady.
  • Vytvářejte, spouštějte a monitorujte celý kanál kopírování.
  • Přidejte nebo aktualizujte data ve zdrojové tabulce.
  • Vytvářejte, spouštějte a monitorujte kanál přírůstkového kopírování.

Řešení na vysoké úrovni

V tomto kurzu vytvoříte dva kanály, které provádějí následující operace.

Poznámka:

V tomto kurzu se jako zdrojové úložiště dat používá Azure SQL Database. Můžete také použít SQL Server.

  1. Počáteční načtení historických dat: Vytvoříte kanál s aktivitou kopírování, která zkopíruje celá data ze zdrojového úložiště dat (Azure SQL Database) do cílového úložiště dat (Azure Blob Storage):

    1. Povolte technologii sledování změn ve zdrojové databázi v Azure SQL Database.
    2. Získejte počáteční hodnotu v SYS_CHANGE_VERSION databázi jako směrný plán pro zachycení změněných dat.
    3. Načtěte úplná data ze zdrojové databáze do služby Azure Blob Storage.

    Diagram, který ukazuje plné načtení dat.

  2. Přírůstkové načítání rozdílových dat podle plánu: Vytvoříte kanál s následujícími aktivitami a pravidelně ho spouštíte:

    1. Vytvořte dvě vyhledávací aktivity , které získají staré a nové SYS_CHANGE_VERSION hodnoty z Azure SQL Database.

    2. Vytvořte jednu aktivitu kopírování , která zkopíruje vložená, aktualizovaná nebo odstraněná data (rozdílová data) mezi těmito dvěma SYS_CHANGE_VERSION hodnotami z Azure SQL Database do Azure Blob Storage.

      Rozdílová data načtete spojením primárních klíčů změněných řádků (mezi dvěma SYS_CHANGE_VERSION hodnotami) z sys.change_tracking_tables dat ve zdrojové tabulce a pak je přesunete do cíle.

    3. Vytvořte jednu aktivitu uložené procedury , která SYS_CHANGE_VERSION aktualizuje hodnotu pro další spuštění kanálu.

    Diagram znázorňující přírůstkové načítání dat.

Požadavky

  • Předplatné Azure. Pokud ho nemáte, vytvořte si bezplatný účet před tím, než začnete.
  • Azure SQL Database. Jako zdrojové úložiště dat používáte databázi v Azure SQL Database. Pokud ho nemáte, přečtěte si článek Vytvoření databáze v Azure SQL Database , kde najdete postup jejího vytvoření.
  • Účet úložiště Azure. Jako úložiště dat jímky používáte službu Blob Storage. Pokud účet úložiště Azure nemáte, přečtěte si článek Vytvoření účtu úložiště , kde najdete postup jeho vytvoření. Vytvořte kontejner s názvem adftutorial.

Poznámka:

K interakci s Azure doporučujeme použít modul Azure Az PowerShell. Pokud chcete začít, přečtěte si téma Instalace Azure PowerShellu. Informace o tom, jak migrovat na modul Az PowerShell, najdete v tématu Migrace Azure PowerShellu z AzureRM na Az.

Vytvoření tabulky zdroje dat v Azure SQL Database

  1. Otevřete SQL Server Management Studio a připojte se k SQL Database.

  2. V Průzkumník serveru klikněte pravým tlačítkem myši na databázi a pak vyberte Nový dotaz.

  3. Spuštěním následujícího příkazu SQL pro vaši databázi vytvořte tabulku s názvem data_source_table zdrojové úložiště dat:

    create table data_source_table
    (
        PersonID int NOT NULL,
        Name varchar(255),
        Age int
        PRIMARY KEY (PersonID)
    );
    INSERT INTO data_source_table
        (PersonID, Name, Age)
    VALUES
        (1, 'aaaa', 21),
        (2, 'bbbb', 24),
        (3, 'cccc', 20),
        (4, 'dddd', 26),
        (5, 'eeee', 22);
    
  4. Povolte sledování změn v databázi a zdrojové tabulce (data_source_table) spuštěním následujícího dotazu SQL.

    Poznámka:

    • Nahraďte <your database name> názvem databáze v Azure SQL Database, která má data_source_table.
    • Změněná data jsou v tomto příkladu uchovávána po dobu dvou dnů. Pokud načtete změněná data každé tři dny nebo častěji, některá změněná data nebudou zahrnuta. Musíte buď změnit hodnotu na CHANGE_RETENTION větší číslo, nebo zajistit, aby vaše lhůta pro načtení změněných dat byla do dvou dnů. Další informace naleznete v tématu Povolení sledování změn pro databázi.
    ALTER DATABASE <your database name>
    SET CHANGE_TRACKING = ON  
    (CHANGE_RETENTION = 2 DAYS, AUTO_CLEANUP = ON)  
    ALTER TABLE data_source_table
    ENABLE CHANGE_TRACKING  
    WITH (TRACK_COLUMNS_UPDATED = ON)
    
  5. Vytvořte novou tabulku a uložte ji s ChangeTracking_version výchozí hodnotou spuštěním následujícího dotazu:

    create table table_store_ChangeTracking_version
    (
        TableName varchar(255),
        SYS_CHANGE_VERSION BIGINT,
    );
    DECLARE @ChangeTracking_version BIGINT
    SET @ChangeTracking_version = CHANGE_TRACKING_CURRENT_VERSION();  
    INSERT INTO table_store_ChangeTracking_version
    VALUES ('data_source_table', @ChangeTracking_version)
    

    Poznámka:

    Pokud se data po povolení sledování změn pro SQL Database nezmění, hodnota verze sledování změn je 0.

  6. Spuštěním následujícího dotazu vytvořte uloženou proceduru ve své databázi. Kanál vyvolá tuto uloženou proceduru, aby aktualizoval verzi sledování změn v tabulce, kterou jste vytvořili v předchozím kroku.

    CREATE PROCEDURE Update_ChangeTracking_Version @CurrentTrackingVersion BIGINT, @TableName varchar(50)
    AS
    BEGIN
    UPDATE table_store_ChangeTracking_version
    SET [SYS_CHANGE_VERSION] = @CurrentTrackingVersion
    WHERE [TableName] = @TableName
    END    
    

Vytvoření datové továrny

  1. Otevřete webový prohlížeč Microsoft Edge nebo Google Chrome. V současné době podporují uživatelské rozhraní služby Data Factory pouze tyto prohlížeče.

  2. V Azure Portal v nabídce vlevo vyberte Vytvořit prostředek.

  3. Vyberte možnost Analytics>Data Factory :

    Snímek obrazovky, který ukazuje výběr datové továrny při vytváření prostředku.

  4. Na stránce Nová datová továrna zadejte jako název ADFTutorialDataFactory .

    Název datové továrny musí být globálně jedinečný. Pokud se zobrazí chybová zpráva, že název, který jste vybrali, není k dispozici, změňte název (například na yournameADFTutorialDataFactory) a zkuste datovou továrnu vytvořit znovu. Další informace najdete v tématu Pravidla pojmenování Azure Data Factory.

  5. Vyberte předplatné Azure, ve kterém chcete datovou továrnu vytvořit.

  6. U položky Skupina prostředků proveďte jeden z následujících kroků:

    • Vyberte možnost Použít existující a poté z rozevíracího seznamu vyberte existující skupinu prostředků.
    • Vyberte Vytvořit novou a poté zadejte název skupiny prostředků.

    Informace o skupinách prostředků najdete v článku Použití skupin prostředků ke správě prostředků Azure.

  7. Jako Verzi vyberte V2.

  8. V části Oblast vyberte oblast pro datovou továrnu.

    V rozevíracím seznamu se zobrazují pouze podporovaná umístění. Úložiště dat (například Azure Storage a Azure SQL Database) a výpočetní prostředky (například Azure HDInsight), které datová továrna používá, mohou být v jiných oblastech.

  9. Vyberte Další: Konfigurace Gitu. Nastavte úložiště podle pokynů v části Metoda konfigurace 4: Během vytváření továrny nebo zaškrtněte políčko Konfigurovat Git později . Snímek obrazovky, který ukazuje možnosti konfigurace Gitu při vytváření datové továrny.

  10. Vyberte možnost Zkontrolovat a vytvořit.

  11. Vyberte Vytvořit.

    Na řídicím panelu je na dlaždici Nasazení služby Data Factory zobrazen stav.

    Snímek obrazovky dlaždice, která ukazuje stav nasazení datové továrny.

  12. Po dokončení vytváření se zobrazí stránka Data Factory . Výběrem dlaždice Spustit studio otevřete uživatelské rozhraní Azure Data Factory na samostatné kartě.

Vytvoření propojených služeb

V datové továrně vytvoříte propojené služby, abyste svá úložiště dat a výpočetní služby spojili s datovou továrnou. V této části vytvoříte propojené služby k vašemu účtu úložiště Azure a databázi ve službě Azure SQL Database.

Vytvoření propojené služby Azure Storage

Propojení účtu úložiště s datovou továrnou:

  1. V uživatelském rozhraní služby Data Factory na kartě Spravovat v části Připojení vyberte Propojené služby. Poté vyberte + Nový nebo tlačítko Vytvořit propojenou službu . Snímek obrazovky, který ukazuje výběry pro vytvoření propojené služby.
  2. V okně Nová propojená služba vyberte Azure Blob Storage a pak vyberte Pokračovat.
  3. Zadejte následující informace:
    1. Jako Název zadejte AzureStorageLinkedService.
    2. V části Připojení prostřednictvím prostředí Integration Runtime vyberte prostředí Integration Runtime.
    3. V poli Typ ověření vyberte metodu ověřování.
    4. Jako Název účtu úložiště vyberte svůj účet úložiště Azure.
  4. Vyberte Vytvořit.

Vytvoření propojené služby Azure SQL Database

Propojení databáze s datovou továrnou:

  1. V uživatelském rozhraní služby Data Factory na kartě Spravovat v části Připojení vyberte Propojené služby. Poté vyberte + Nový.

  2. V okně Nová propojená služba vyberte Azure SQL Database a pak vyberte Pokračovat.

  3. Zadejte následující informace:

    1. Do pole Název zadejte AzureSqlDatabaseLinkedService.
    2. V poli Název serveru vyberte svůj server.
    3. V poli Název databáze vyberte svou databázi.
    4. V poli Typ ověření vyberte metodu ověřování. V tomto kurzu se k demonstraci používá ověřování SQL.
    5. Do pole Uživatelské jméno zadejte jméno uživatele.
    6. Do pole Heslo zadejte heslo pro uživatele. Nebo zadejte informace o propojené službě Azure Key Vault – AKV, názvu tajného klíče a verzi tajného klíče.
  4. Výběrem možnosti Test připojení otestujte připojení.

  5. Vyberte Vytvořit a vytvořte propojenou službu.

    Snímek obrazovky, který ukazuje nastavení propojené služby Azure SQL Database.

Vytvoření datových sad

V této části vytvoříte datové sady, které budou představovat zdroj dat a cíl dat spolu s místem pro uložení SYS_CHANGE_VERSION hodnot.

Vytvoření datové sady pro reprezentaci zdrojových dat

  1. V uživatelském rozhraní služby Data Factory na kartě Autor vyberte znaménko plus (+). Pak vyberte Datová sada nebo vyberte tři tečky pro akce datové sady.

    Snímek obrazovky, který ukazuje výběry pro zahájení vytváření datové sady.

  2. Vyberte Azure SQL Database a pak vyberte Pokračovat.

  3. V okně Nastavit vlastnosti proveďte následující kroky:

    1. Do pole Název zadejte SourceDataset.
    2. V části Propojená služba vyberte AzureSqlDatabaseLinkedService.
    3. Jako Název tabulky vyberte dbo.data_source_table.
    4. V části Importovat schéma vyberte možnost Z připojení/úložiště .
    5. Vyberte OK.

    Snímek obrazovky, který ukazuje nastavení vlastností pro zdrojovou datovou sadu.

Vytvoření datové sady pro reprezentaci dat zkopírovaných do úložiště dat jímky

V následujícím postupu vytvoříte datovou sadu, která bude představovat data zkopírovaná ze zdrojového úložiště dat. Kontejner adftutorial jste vytvořili v Azure Blob Storage jako součást předpokladů. Vytvořte kontejner, pokud neexistuje, nebo jej nastavte na název existujícího kontejneru. V tomto kurzu je název výstupního souboru dynamicky generován z výrazu @CONCAT('Incremental-', pipeline().RunId, '.txt').

  1. V uživatelském rozhraní služby Data Factory na kartě Vytvořit vyberte +možnost . Pak vyberte Datová sada nebo vyberte tři tečky pro akce datové sady.

    Snímek obrazovky, který ukazuje výběry pro zahájení vytváření datové sady.

  2. Vyberte Azure Blob Storage a pak vyberte Pokračovat.

  3. Vyberte formát datového typu jako DelimitedText a poté vyberte Pokračovat.

  4. V okně Nastavit vlastnosti proveďte následující kroky:

    1. Jako Název zadejte SinkDataset.
    2. V části Propojená služba vyberte AzureBlobStorageLinkedService.
    3. Jako Cesta k souboru zadejte adftutorial/incchgtracking.
    4. Vyberte OK.
  5. Jakmile se datová sada zobrazí ve stromovém zobrazení, přejděte na kartu Připojení a vyberte textové pole Název souboru . Když se zobrazí možnost Přidat dynamický obsah , vyberte ji.

    Snímek obrazovky, který ukazuje možnost nastavení cesty k dynamickému souboru pro datovou sadu jímky.

  6. Zobrazí se okno Tvůrce výrazů kanálu . Vložte @concat('Incremental-',pipeline().RunId,'.csv') do textového pole.

  7. Vyberte OK.

Vytvoření datové sady pro reprezentaci dat sledování změn

V následujícím postupu vytvoříte datovou sadu pro uložení verze sledování změn. Tabulku table_store_ChangeTracking_version jste vytvořili jako součást předpokladů.

  1. V uživatelském rozhraní služby Data Factory na kartě Autor vyberte +a pak vyberte Datová sada.
  2. Vyberte Azure SQL Database a pak vyberte Pokračovat.
  3. V okně Nastavit vlastnosti proveďte následující kroky:
    1. Do pole Název zadejte ChangeTrackingDataset.
    2. V části Propojená služba vyberte AzureSqlDatabaseLinkedService.
    3. V poli Název tabulky vyberte možnost dbo.table_store_ChangeTracking_version.
    4. V části Importovat schéma vyberte možnost Z připojení/úložiště .
    5. Vyberte OK.

Vytvoření kanálu pro úplnou kopii

V následujícím postupu vytvoříte kanál s aktivitou kopírování, která zkopíruje celá data ze zdrojového úložiště dat (Azure SQL Database) do cílového úložiště dat (Azure Blob Storage):

  1. V uživatelském rozhraní služby Data Factory na kartě Vytvořit vyberte +možnost a poté vyberte možnost Kanál kanálu>.

    Snímek obrazovky, který ukazuje výběry pro zahájení vytváření kanálu pro datovou továrnu.

  2. Zobrazí se nová karta pro konfiguraci kanálu. Kanál se zobrazí také ve stromovém zobrazení. V okně Vlastnosti změňte název kanálu na FullCopyPipeline.

  3. Na panelu nástrojů Činnosti rozbalte položku Přesunout a transformovat. Proveďte jeden z následujících kroků:

    • Přetáhněte aktivitu kopírování na plochu návrháře kanálu.
    • Na panelu hledání v části Aktivity vyhledejte aktivitu kopírování dat a poté nastavte název na FullCopyActivity.
  4. Přepněte na kartu Zdroj . V části Zdrojová datová sada vyberte SourceDataset.

  5. Přepněte na kartu Jímka . V části Datová sada jímky vyberte SinkDataset.

  6. Chcete-li ověřit definici kanálu, vyberte na panelu nástrojů možnost Ověřit . Ověřte, že nedošlo k chybě ověření. Zavřete výstup ověření kanálu.

  7. Chcete-li publikovat entity (propojené služby, datové sady a kanály), vyberte možnost Publikovat vše. Počkejte, dokud se nezobrazí zpráva Publikování proběhlo úspěšně.

    Snímek obrazovky se zprávou, že publikování bylo úspěšné.

  8. Chcete-li zobrazit oznámení, vyberte tlačítko Zobrazit oznámení .

Spuštění úplného kanálu kopií

  1. V uživatelském rozhraní služby Data Factory na panelu nástrojů kanálu vyberte Přidat spouštěč a pak vyberte Spustit nyní.

    Snímek obrazovky, který ukazuje možnost spuštění úplné kopie nyní.

  2. V okně Spuštění kanálu vyberte OK.

    Snímek obrazovky, který ukazuje potvrzení spuštění kanálu s kontrolou parametrů.

Monitorování úplného kanálu kopírování

  1. V uživatelském rozhraní služby Data Factory vyberte kartu Monitorování . Spuštění kanálu a jeho stav se zobrazí v seznamu. Chcete-li seznam aktualizovat, vyberte možnost Obnovit. Najeďte myší na spuštění kanálu a získejte možnost Znovu spustit nebo Consumption .

    Snímek obrazovky, který ukazuje spuštění a stav kanálu.

  2. Pokud chcete zobrazit spuštění aktivit přidružená ke spuštění kanálu, vyberte název kanálu ve sloupci Název kanálu . V kanálu je pouze jedna aktivita, takže v seznamu je pouze jedna položka. Pokud chcete přepnout zpět na zobrazení spuštění kanálu, vyberte odkaz Všechna spuštění kanálu v horní části.

Kontrola výsledků

Složka incchgtracking kontejneru adftutorial obsahuje soubor s názvem incremental-<GUID>.csv.

Snímek výstupního souboru z úplné kopie.

Soubor by měl obsahovat data z vaší databáze:


PersonID,Name,Age
1,"aaaa",21
2,"bbbb",24
3,"cccc",20
4,"dddd",26
5,"eeee",22

5,eeee,PersonID,Name,Age
1,"aaaa",21
2,"bbbb",24
3,"cccc",20
4,"dddd",26
5,"eeee",22

Přidání dalších dat do zdrojové tabulky

Spuštěním následujícího dotazu na databázi přidejte řádek a aktualizujte řádek:

INSERT INTO data_source_table
(PersonID, Name, Age)
VALUES
(6, 'new','50');


UPDATE data_source_table
SET [Age] = '10', [name]='update' where [PersonID] = 1

Vytvoření kanálu pro rozdílovou kopii

V následujícím postupu vytvoříte kanál s aktivitami a pravidelně ho spouštíte. Když spustíte kanál:

  • Aktivity vyhledávání získávají staré a nové SYS_CHANGE_VERSION hodnoty z Azure SQL Database a předávají je aktivitě kopírování.
  • Aktivita kopírování zkopíruje vložená, aktualizovaná nebo odstraněná data mezi těmito dvěma SYS_CHANGE_VERSION hodnotami z Azure SQL Database do Azure Blob Storage.
  • Aktivita uložené procedury aktualizuje hodnotu pro SYS_CHANGE_VERSION další spuštění kanálu.
  1. V uživatelském rozhraní služby Data Factory přepněte na kartu Autor. Vyberte možnost +a poté vyberte možnost Kanál kanálu>.

    Snímek obrazovky, který ukazuje, jak vytvořit kanál v datové továrně.

  2. Zobrazí se nová karta pro konfiguraci kanálu. Kanál se zobrazí také ve stromovém zobrazení. V okně Vlastnosti změňte název kanálu na IncrementalCopyPipeline.

  3. Rozbalte položku Obecné v panelu nástrojů Činnosti . Přetáhněte aktivitu vyhledávání na plochu návrháře kanálu nebo vyhledejte v poli Aktivity vyhledávání . Nastavte název aktivity na LookupLastChangeTrackingVersionActivity. Tato aktivita získá verzi sledování změn použitou v poslední operaci kopírování, která je uložená table_store_ChangeTracking_version v tabulce.

  4. Přepněte na kartu Nastavení v okně Vlastnosti . V části Zdrojová datová sada vyberte ChangeTrackingDataset.

  5. Přetáhněte vyhledávací aktivitu z panelu nástrojů Aktivity na plochu návrháře kanálu. Nastavte název aktivity na LookupCurrentChangeTrackingVersionActivity. Tato aktivita získá aktuální verzi sledování změn.

  6. Přepněte na kartu Nastavení v okně Vlastnosti a proveďte následující kroky:

    1. V části Zdrojová datová sada vyberte SourceDataset.

    2. V části Použít dotaz vyberte možnost Dotaz.

    3. Do pole Dotaz zadejte následující dotaz SQL:

      SELECT CHANGE_TRACKING_CURRENT_VERSION() as CurrentChangeTrackingVersion
      

    Snímek obrazovky s dotazem přidaným na kartu Nastavení v okně Vlastnosti.

  7. Na panelu nástrojů Činnosti rozbalte položku Přesunout a transformovat. Přetáhněte aktivitu kopírování dat na plochu návrháře kanálu. Nastavte název aktivity na IncrementalCopyActivity. Tato aktivita zkopíruje data mezi poslední verzí sledování změn a aktuální verzí sledování změn do cílového úložiště dat.

  8. Přepněte na kartu Zdroj v okně Vlastnosti a proveďte následující kroky:

    1. V části Zdrojová datová sada vyberte SourceDataset.

    2. V části Použít dotaz vyberte možnost Dotaz.

    3. Do pole Dotaz zadejte následující dotaz SQL:

      SELECT data_source_table.PersonID,data_source_table.Name,data_source_table.Age, CT.SYS_CHANGE_VERSION, SYS_CHANGE_OPERATION from data_source_table RIGHT OUTER JOIN CHANGETABLE(CHANGES data_source_table, @{activity('LookupLastChangeTrackingVersionActivity').output.firstRow.SYS_CHANGE_VERSION}) AS CT ON data_source_table.PersonID = CT.PersonID where CT.SYS_CHANGE_VERSION <= @{activity('LookupCurrentChangeTrackingVersionActivity').output.firstRow.CurrentChangeTrackingVersion}
      

    Snímek obrazovky s dotazem přidaným na kartu Zdroj v okně Vlastnosti.

  9. Přepněte na kartu Jímka . V části Datová sada jímky vyberte SinkDataset.

  10. Připojte obě vyhledávací aktivity k aktivitě kopírování jednu po druhé. Přetáhněte zelené tlačítko, které je připojeno k aktivitě vyhledávání, do aktivity kopírování.

  11. Přetáhněte uloženou aktivitu procedury z panelu nástrojů Aktivity na plochu návrháře kanálů. Nastavte název aktivity na StoredProceduretoUpdateChangeTrackingActivity. Tato aktivita aktualizuje verzi sledování změn v table_store_ChangeTracking_version tabulce.

  12. Přepněte na kartu Nastavení a proveďte následující kroky:

    1. V části Propojená služba vyberte AzureSqlDatabaseLinkedService.
    2. V části Název uložené procedury vyberte možnost Update_ChangeTracking_Version.
    3. Vyberte Importovat.
    4. V části Parametry uložené procedury zadejte následující hodnoty parametrů:
    Název Typ Hodnota
    CurrentTrackingVersion Int64 @{activity('LookupCurrentChangeTrackingVersionActivity').output.firstRow.CurrentChangeTrackingVersion}
    TableName Řetězec @{activity('LookupLastChangeTrackingVersionActivity').output.firstRow.TableName}

    Snímek obrazovky, který ukazuje parametry nastavení pro aktivitu uložené procedury.

  13. Připojte aktivitu kopírování k aktivitě uložené procedury. Přetáhněte zelené tlačítko, které je připojeno k aktivitě kopírování, do aktivity uložené procedury.

  14. Na panelu nástrojů vyberte možnost Ověřit . Ověřte, že nejsou žádné chyby při validaci. Zavřete okno Sestava ověření kanálu .

  15. Publikujte entity (propojené služby, datové sady a kanály) do služby Data Factory výběrem tlačítka Publikovat vše . Počkejte, dokud se nezobrazí zpráva Publikování proběhlo úspěšně .

    Snímek obrazovky, který ukazuje tlačítko pro publikování všech entit pro datovou továrnu.

Spuštění kanálu přírůstkového kopírování

  1. Na panelu nástrojů pro kanál vyberte Přidat trigger a poté vyberte Aktivovat nyní.

    Snímek obrazovky, který nyní ukazuje možnost spuštění přírůstkové kopie.

  2. V okně Spuštění kanálu vyberte OK.

Monitorování kanálu přírůstkového kopírování

  1. Vyberte kartu Monitor . Spuštění kanálu a jeho stav se zobrazí v seznamu. Chcete-li seznam aktualizovat, vyberte možnost Obnovit.

    Snímek obrazovky, který ukazuje spuštění kanálu pro datovou továrnu.

  2. Pokud chcete zobrazit spuštění aktivit přidružená ke spuštění kanálu, vyberte odkaz IncrementalCopyPipeline ve sloupci Název kanálu . Spuštění aktivit se zobrazí v seznamu.

    Snímek obrazovky, který ukazuje spuštění aktivit pro datovou továrnu.

Kontrola výsledků

Druhý soubor se zobrazí ve složce incchgtracking kontejneru adftutorial .

Snímek obrazovky, který ukazuje výstupní soubor z přírůstkové kopie.

Soubor by měl obsahovat pouze rozdílová data z vaší databáze. Záznam s U je aktualizovaný řádek v databázi a I je to jeden přidaný řádek.

PersonID,Name,Age,SYS_CHANGE_VERSION,SYS_CHANGE_OPERATION
1,update,10,2,U
6,new,50,1,I

První tři sloupce jsou změněná data z data_source_table. Poslední dva sloupce jsou metadata z tabulky pro systém sledování změn. Čtvrtý sloupec je SYS_CHANGE_VERSION hodnota pro každý změněný řádek. V pátém sloupci je operace: U = update, I = insert. Podrobnosti o informacích o sledování změn naleznete v části CHANGETABLE.

==================================================================
PersonID Name    Age    SYS_CHANGE_VERSION    SYS_CHANGE_OPERATION
==================================================================
1        update  10            2                                 U
6        new     50	       1                            	 I

V následujícím výukovém programu se dozvíte, jak kopírovat pouze nové a změněné soubory na základě LastModifiedDate: