Sdílet prostřednictvím


Předběžné zpracování dat pomocí uložené procedury před načtením do Lakehouse

V tomto kurzu vám ukážeme, jak pomocí aktivity skriptu kanálu spustit uloženou proceduru k vytvoření tabulky a předběžnému zpracování dat v datovém skladu Azure Synapse. Potom načteme předem zpracovanou tabulku do Lakehouse.

Požadavky

  • Pracovní prostor s povolenou službou Microsoft Fabric. Pokud ho ještě nemáte, přečtěte si článek Vytvoření pracovního prostoru.

  • Připravte uloženou proceduru ve službě Azure Synapse Data Warehouse. Předem vytvořte následující uloženou proceduru:

    CREATE PROCEDURE spM_add_names
    AS
    --Create initial table
    IF EXISTS (SELECT * FROM sys.objects
    WHERE object_id = OBJECT_ID(N'[dbo].[names]') AND TYPE IN (N'U'))
    BEGIN
    DROP TABLE names
    END;
    
    CREATE TABLE names
    (id INT,fullname VARCHAR(50));
    
    --Populate data
    INSERT INTO names VALUES (1,'John Smith');
    INSERT INTO names VALUES (2,'James Dean');
    
    --Alter table for new columns
    ALTER TABLE names
    ADD first_name VARCHAR(50) NULL;
    
    ALTER TABLE names
    ADD last_name VARCHAR(50) NULL;
    
    --Update table
    UPDATE names
    SET first_name = SUBSTRING(fullname, 1, CHARINDEX(' ', fullname)-1);
    
    UPDATE names
    SET last_name = SUBSTRING(fullname, CHARINDEX(' ', fullname)+1, LEN(fullname)-CHARINDEX(' ', fullname));
    
    --View Result
    SELECT * FROM names;
    

    Snímek obrazovky znázorňující výsledky spuštění uložené procedury pro vygenerování ukázkové tabulky

Vytvoření aktivity skriptu kanálu pro spuštění uložené procedury

V této části používáme aktivitu Skript ke spuštění uložené procedury vytvořené v požadavcích.

  1. Na panelu nástrojů Aktivity zvolte aktivitu skriptů a pak v podokně vlastností vyberte kartu Nastavení, abyste zvolili podrobnosti o připojení. Vyberte rozevírací seznam Připojení a zvolte Další. Pak se můžete připojit ke svému datovému skladu Azure Synapse.

    Snímek obrazovky znázorňující rozhraní kanálu pro vytvoření nové aktivity skriptu a připojení k datovému skladu Azure Synapse

  2. V části Nové zdroje vyberte Azure Synapse Analytics (SQL DW).

    Snímek obrazovky s dialogovým oknem Získat data s vybranou možností Azure Synapse Analytics (SQL DW).

  3. Zadejte pole Server, Databáze a Uživatelské jméno a Heslo pro základní ověřování a jako název připojení zadejte SynapseConnection. Potom výběrem možnosti Vytvořit vytvořte nové připojení.

    Snímek obrazovky s dialogovým oknem vytvořit nové připojení

  4. Vstup EXEC spM_add_names ke spuštění uložené procedury. Vytvoří novou tabulku dbo.name a předzpracuje data pomocí jednoduché transformace, která změní pole fullname na dvě pole, first_name a last_name.

    Snímek obrazovky znázorňující kartu nastavení aktivity Skript nakonfigurované pro spuštění spM_add_names uložené procedury

Načtení dat předem zpracovaných tabulek do Lakehouse pomocí aktivity kanálu

  1. Na panelu nástrojů Aktivity vyberte Kopírovat data a pak vyberte Použít pomocníka pro kopírování nebo kartu Pomocníka pro kopírování dat na cílové stránce kanálu a spusťte Pomocníka pro kopírování dat.

    Snímek obrazovky s tlačítkem Použít pomocníka pro kopírování v části Kopírovat data

  2. Do vyhledávacího filtru zadejte Synapse a jako zdroj dat vyberte Azure Synapse Analytics (SQL DW) a pak vyberte Další.

    Snímek obrazovky zobrazující stránku pro výběr zdroje dat Nástroje pro kopírování a vybranou službu Azure Synapse Analytics

  3. Zvolte existující připojení SynapseConnection , které jste vytvořili dříve.

    Snímek obrazovky znázorňující výběr dříve vytvořené funkce SynapseConnection na stránce Zvolit zdroj dat v Pomocníkovi pro kopírování

  4. Zvolte tabulku dbo.names , která byla vytvořena a předem zpracována uloženou procedurou. Pak vyberte Další.

    Snímek obrazovky znázorňující výběr tabulky dbo.names vytvořené a předzpracované uloženou procedurou v předchozích krocích

  5. Vyberte Lakehouse.

    Snímek obrazovky znázorňující výběr lakehouse pro cíl kopírování v pomocníkovi pro kopírování

  6. Zadejte název a pak vyberte Vytvořit a připojit.

    Snímek obrazovky s dialogovým oknem New Lakehouse

  7. Zadejte název cílové tabulky pro data, která se mají zkopírovat do cíle Lakehouse, a vyberte Další.

    Snímek obrazovky znázorňující název cílové tabulky, který se má použít v cíli Lakehouse

  8. Projděte si souhrn na poslední stránce pomocníka pro kopírování. Zrušte zaškrtnutí políčka Spustit přenos dat okamžitě a pak vyberte OK.

    Snímek obrazovky zobrazující souhrnnou stránku Pomocníka pro kopírování s podrobnostmi o nakonfigurovaných připojeních

  9. Po výběru možnosti OK se nová aktivita Copy přidá na plátno kanálu.

    Snímek obrazovky znázorňující plátno kanálu s přidaným aktivita Copy

Spuštěním dvou aktivit kanálu načtěte data.

  1. Propojte aktivity skriptů a kopírování dat podle úspěchu z aktivity Skript.

    Snímek obrazovky znázorňující připojení dvou aktivit k úspěchu aktivity skriptu

  2. Vyberte Spustit a pak uložte a spusťte spuštění a spusťte dvě aktivity v kanálu.

    Snímek obrazovky s tlačítkem Spustit kanál

    Snímek obrazovky znázorňující tlačítko Uložit a spustit pro kanál

  3. Po úspěšném spuštění kanálu můžete zobrazit podrobnosti o dalších informacích. Výběrem odkazu s názvem aktivita Copy zobrazíte podrobnosti o spuštění.

    Snímek obrazovky znázorňující tlačítko pro zobrazení podrobností o spuštění kanálu

    Snímek obrazovky s podrobnostmi o spuštění kanálu

  4. Přepněte do pracovního prostoru a najděte lakehouse, který jste vytvořili. Výběrem koncového bodu analýzy SQL pod ním zkontrolujte výsledky.

    Snímek obrazovky znázorňující pracovní prostor se zvýrazněným cílem Lakehouse

  5. Výběrem tabulky SynapseNamesTable zobrazíte data načtená do Lakehouse.

    Snímek obrazovky zobrazující výsledky tabulky SynapseNamesTable v Lakehouse

V této ukázce se dozvíte, jak před načtením výsledků do Lakehouse předzpracovat data pomocí uložené procedury. Naučili jste se:

  • Vytvořte datový kanál s aktivitou skriptu pro spuštění uložené procedury.
  • Pomocí aktivity kanálu načtěte data předem zpracované tabulky do Lakehouse.
  • Spuštěním aktivit kanálu načtěte data.

V dalším kroku se dozvíte další informace o monitorování spuštění kanálu.