Před načtením do Lakehouse předzpracuje data pomocí uložené procedury.
V tomto kurzu vám ukážeme, jak pomocí aktivity skriptů kanálu spustit uloženou proceduru k vytvoření tabulky a předzpracovat data v Data Warehouse Synapse. Potom načteme předzpracovanou tabulku do Lakehouse.
Důležité
Microsoft Fabric je v současné době ve verzi PREVIEW. Tyto informace se týkají předběžné verze produktu, který může být před vydáním podstatně změněn. Společnost Microsoft neposkytuje na zde uvedené informace žádné záruky, vyjádřené ani předpokládané. Projděte si dokumentaci Azure Data Factory pro službu v Azure.
Požadavky
Pracovní prostor s povolenou službou Microsoft Fabric. Pokud ho ještě nemáte, přečtěte si článek Vytvoření pracovního prostoru.
Připravte si uloženou proceduru v Azure Synapse Data Warehouse. Vytvořte předem následující uloženou proceduru:
CREATE PROCEDURE spM_add_names AS --Create initial table IF EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[names]') AND TYPE IN (N'U')) BEGIN DROP TABLE names END; CREATE TABLE names (id INT,fullname VARCHAR(50)); --Populate data INSERT INTO names VALUES (1,'John Smith'); INSERT INTO names VALUES (2,'James Dean'); --Alter table for new columns ALTER TABLE names ADD first_name VARCHAR(50) NULL; ALTER TABLE names ADD last_name VARCHAR(50) NULL; --Update table UPDATE names SET first_name = SUBSTRING(fullname, 1, CHARINDEX(' ', fullname)-1); UPDATE names SET last_name = SUBSTRING(fullname, CHARINDEX(' ', fullname)+1, LEN(fullname)-CHARINDEX(' ', fullname)); --View Result SELECT * FROM names;
Vytvoření kanálu Aktivita skriptu pro spuštění uložené procedury
V této části použijeme aktivitu Script ke spuštění uložené procedury vytvořené v rámci požadavků.
Zvolte Aktivita skriptů a pak vyberte Nový a připojte se ke svému Azure Synapse Data Warehouse.
Vyberte Azure Synapse Analytics a pak Pokračovat.
Zadejte pole Server, Databáze a Uživatelské jméno a Heslo pro základní ověřování a jako Název připojení zadejte SynapseConnection. Pak vyberte Vytvořit a vytvořte nové připojení.
Zadejte EXEC spM_add_names ke spuštění uložené procedury. Vytvoří novou tabulku dbo.name a předzpracuje data jednoduchou transformací, která změní pole fullname na dvě pole, first_name a last_name.
Použití aktivity kanálu k načtení předzpracovaných dat tabulky do Lakehouse
Vyberte Kopírovat data a pak vyberte Použít pomocníka pro kopírování.
Jako zdroj dat vyberte Azure Synapse Analytics a pak vyberte Další.
Zvolte existující připojení SynapseConnection , které jste vytvořili dříve.
Zvolte tabulku dbo.names , která byla vytvořena a předzpracována uloženou procedurou. Pak vyberte Další.
Na kartě Pracovní prostor jako cíl vyberte Lakehouse a pak znovu vyberte Další.
Zvolte existující nebo vytvořte nový Lakehouse a pak vyberte Další.
Zadejte název cílové tabulky pro data, která se mají zkopírovat do cíle Lakehouse, a vyberte Další.
Na poslední stránce Pomocníka pro kopírování si prohlédněte souhrn a pak vyberte OK.
Jakmile vyberete OK, nová aktivita Copy se přidá na plátno kanálu.
Spuštění dvou aktivit kanálu pro načtení dat
Propojte aktivity Skriptování a Kopírování dat podle při úspěchu z aktivity Skript.
Vyberte Spustit a potom Uložit a spustit a spusťte obě aktivity v kanálu.
Po úspěšném spuštění kanálu můžete zobrazit podrobnosti, kde najdete další informace.
Přepněte do pracovního prostoru a výběrem Lakehouse zkontrolujte výsledky.
Vyberte tabulku SynapseNamesTable a zobrazte datum načtené do Lakehouse.
Další kroky
Tato ukázka ukazuje, jak před načtením výsledků do Lakehouse předzpracovat data pomocí uložené procedury. Naučili jste se:
- Vytvořte datový kanál s aktivitou Script, která spustí uloženou proceduru.
- K načtení předzpracovaných dat tabulky do Lakehouse použijte aktivitu kanálu.
- Spuštěním aktivit kanálu načtěte data.
Dále přejděte na další informace o monitorování spuštění kanálu.