Před načtením do Lakehouse předzpracuje data pomocí uložené procedury.

V tomto kurzu vám ukážeme, jak pomocí aktivity skriptů kanálu spustit uloženou proceduru k vytvoření tabulky a předzpracovat data v Data Warehouse Synapse. Potom načteme předzpracovanou tabulku do Lakehouse.

Důležité

Microsoft Fabric je v současné době ve verzi PREVIEW. Tyto informace se týkají předběžné verze produktu, který může být před vydáním podstatně změněn. Společnost Microsoft neposkytuje na zde uvedené informace žádné záruky, vyjádřené ani předpokládané. Projděte si dokumentaci Azure Data Factory pro službu v Azure.

Požadavky

  • Pracovní prostor s povolenou službou Microsoft Fabric. Pokud ho ještě nemáte, přečtěte si článek Vytvoření pracovního prostoru.

  • Připravte si uloženou proceduru v Azure Synapse Data Warehouse. Vytvořte předem následující uloženou proceduru:

    CREATE PROCEDURE spM_add_names
    AS
    --Create initial table
    IF EXISTS (SELECT * FROM sys.objects
    WHERE object_id = OBJECT_ID(N'[dbo].[names]') AND TYPE IN (N'U'))
    BEGIN
    DROP TABLE names
    END;
    
    CREATE TABLE names
    (id INT,fullname VARCHAR(50));
    
    --Populate data
    INSERT INTO names VALUES (1,'John Smith');
    INSERT INTO names VALUES (2,'James Dean');
    
    --Alter table for new columns
    ALTER TABLE names
    ADD first_name VARCHAR(50) NULL;
    
    ALTER TABLE names
    ADD last_name VARCHAR(50) NULL;
    
    --Update table
    UPDATE names
    SET first_name = SUBSTRING(fullname, 1, CHARINDEX(' ', fullname)-1);
    
    UPDATE names
    SET last_name = SUBSTRING(fullname, CHARINDEX(' ', fullname)+1, LEN(fullname)-CHARINDEX(' ', fullname));
    
    --View Result
    SELECT * FROM names;
    

    Snímek obrazovky s výsledky spuštění uložené procedury pro vygenerování ukázkové tabulky

Vytvoření kanálu Aktivita skriptu pro spuštění uložené procedury

V této části použijeme aktivitu Script ke spuštění uložené procedury vytvořené v rámci požadavků.

  1. Zvolte Aktivita skriptů a pak vyberte Nový a připojte se ke svému Azure Synapse Data Warehouse.

    Snímek obrazovky s rozhraním kanálu pro vytvoření nové aktivity skriptu a připojení k Azure Synapse Data Warehouse

  2. Vyberte Azure Synapse Analytics a pak Pokračovat.

    Snímek obrazovky s dialogovým oknem Nové připojení s vybranou možností Azure Synapse Analytics

  3. Zadejte pole Server, Databáze a Uživatelské jméno a Heslo pro základní ověřování a jako Název připojení zadejte SynapseConnection. Pak vyberte Vytvořit a vytvořte nové připojení.

    Snímek obrazovky s dialogovým oknem vytvořit nové připojení

  4. Zadejte EXEC spM_add_names ke spuštění uložené procedury. Vytvoří novou tabulku dbo.name a předzpracuje data jednoduchou transformací, která změní pole fullname na dvě pole, first_name a last_name.

    Snímek obrazovky s kartou Nastavení aktivity skriptů nakonfigurovanou pro spuštění spM_add_names uložené procedury

Použití aktivity kanálu k načtení předzpracovaných dat tabulky do Lakehouse

  1. Vyberte Kopírovat data a pak vyberte Použít pomocníka pro kopírování.

    Snímek obrazovky s tlačítkem Použít pomocníka pro kopírování v části Kopírovat data

  2. Jako zdroj dat vyberte Azure Synapse Analytics a pak vyberte Další.

    Snímek obrazovky zobrazující stránku pro výběr zdroje dat Pomocníka pro kopírování s vybranou možností Azure Synapse Analytics

  3. Zvolte existující připojení SynapseConnection , které jste vytvořili dříve.

    Snímek obrazovky znázorňující výběr dříve vytvořeného synapseConnection na stránce Zvolit zdroj dat v Pomocníkovi pro kopírování

  4. Zvolte tabulku dbo.names , která byla vytvořena a předzpracována uloženou procedurou. Pak vyberte Další.

    Snímek obrazovky znázorňující výběr tabulky dbo.names vytvořené a předzpracované uloženou procedurou v předchozích krocích

  5. Na kartě Pracovní prostor jako cíl vyberte Lakehouse a pak znovu vyberte Další.

    Snímek obrazovky znázorňující výběr Lakehouse pro cíl kopírování v Pomocníkovi pro kopírování

  6. Zvolte existující nebo vytvořte nový Lakehouse a pak vyberte Další.

    Snímek obrazovky znázorňující výběr cíle Lakehouse v pomocníkovi pro kopírování

  7. Zadejte název cílové tabulky pro data, která se mají zkopírovat do cíle Lakehouse, a vyberte Další.

    Snímek obrazovky s názvem cílové tabulky, který se má použít v cíli Lakehouse

  8. Na poslední stránce Pomocníka pro kopírování si prohlédněte souhrn a pak vyberte OK.

    Snímek obrazovky zobrazující souhrnnou stránku Pomocníka pro kopírování s podrobnostmi o nakonfigurovaných připojeních

  9. Jakmile vyberete OK, nová aktivita Copy se přidá na plátno kanálu.

    Snímek obrazovky znázorňující plátno kanálu s přidanou aktivita Copy

Spuštění dvou aktivit kanálu pro načtení dat

  1. Propojte aktivity Skriptování a Kopírování dat podle při úspěchu z aktivity Skript.

    Snímek obrazovky znázorňující propojení dvou aktivit po úspěšném provedení aktivity skriptu

  2. Vyberte Spustit a potom Uložit a spustit a spusťte obě aktivity v kanálu.

    Snímek obrazovky s tlačítkem Spustit kanál

    Snímek obrazovky s tlačítkem Uložit a spustit pro kanál

  3. Po úspěšném spuštění kanálu můžete zobrazit podrobnosti, kde najdete další informace.

    Snímek obrazovky s tlačítkem zobrazit podrobnosti spuštění kanálu

    Snímek obrazovky s podrobnostmi o spuštění kanálu

  4. Přepněte do pracovního prostoru a výběrem Lakehouse zkontrolujte výsledky.

    Snímek obrazovky znázorňující pracovní prostor se zvýrazněným cílem Lakehouse

  5. Vyberte tabulku SynapseNamesTable a zobrazte datum načtené do Lakehouse.

    Snímek obrazovky zobrazující výsledky v tabulce SynapseNamesTable v Lakehouse

Další kroky

Tato ukázka ukazuje, jak před načtením výsledků do Lakehouse předzpracovat data pomocí uložené procedury. Naučili jste se:

  • Vytvořte datový kanál s aktivitou Script, která spustí uloženou proceduru.
  • K načtení předzpracovaných dat tabulky do Lakehouse použijte aktivitu kanálu.
  • Spuštěním aktivit kanálu načtěte data.

Dále přejděte na další informace o monitorování spuštění kanálu.