Adatok előfeldolgozása tárolt eljárással a Lakehouse-ba való betöltés előtt
Ebben az oktatóanyagban bemutatjuk, hogyan használható folyamatszkript-tevékenység egy tárolt eljárás futtatására egy tábla létrehozásához és az adatok előfeldolgozásához a Synapse-adattárházban. Ezután betöltjük az előfeldolgozott táblát a Lakehouse-ba.
Előfeltételek
Egy Microsoft Fabric-kompatibilis munkaterület. Ha még nincs ilyenje, tekintse meg a Munkaterület létrehozása című cikket.
Tárolt eljárás előkészítése az Azure Synapse-adattárházban. Hozza létre előre a következő tárolt eljárást:
CREATE PROCEDURE spM_add_names AS --Create initial table IF EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[names]') AND TYPE IN (N'U')) BEGIN DROP TABLE names END; CREATE TABLE names (id INT,fullname VARCHAR(50)); --Populate data INSERT INTO names VALUES (1,'John Smith'); INSERT INTO names VALUES (2,'James Dean'); --Alter table for new columns ALTER TABLE names ADD first_name VARCHAR(50) NULL; ALTER TABLE names ADD last_name VARCHAR(50) NULL; --Update table UPDATE names SET first_name = SUBSTRING(fullname, 1, CHARINDEX(' ', fullname)-1); UPDATE names SET last_name = SUBSTRING(fullname, CHARINDEX(' ', fullname)+1, LEN(fullname)-CHARINDEX(' ', fullname)); --View Result SELECT * FROM names;
Folyamatszkript-tevékenység létrehozása a tárolt eljárás futtatásához
Ebben a szakaszban szkripttevékenységet használunk az előfeltételekben létrehozott tárolt eljárás futtatásához.
Válassza a Szkripttevékenység lehetőséget, majd válassza az Új lehetőséget az Azure Synapse Data Warehouse-hoz való csatlakozáshoz.
Válassza az Azure Synapse Analyticset, majd a Folytatás lehetőséget.
Adja meg a Kiszolgáló, adatbázis, felhasználónév és jelszó mezőket az alapszintű hitelesítéshez, és adja meg a Synapse Csatlakozás ion nevet a Csatlakozás ion névhez. Ezután válassza a Létrehozás lehetőséget az új kapcsolat létrehozásához.
A bemeneti EXEC spM_add_names a tárolt eljárás futtatásához. Létrehoz egy új táblát dbo.name, és egy egyszerű átalakítással előre feldolgozhatja az adatokat a teljes név mező két mezőre való módosításához, first_name és last_name.
Folyamattevékenység használata előre feldolgozott táblaadatok lakehouse-ba való betöltéséhez
Válassza az Adatok másolása, majd a Másolási segéd használata lehetőséget.
Válassza az adatforráshoz tartozó Azure Synapse Analytics lehetőséget, majd válassza a Tovább lehetőséget.
Válassza ki a korábban létrehozott synapse Csatlakozás ion kapcsolatot.
Válassza ki a tárolt eljárás által létrehozott és előre feldolgozott dbo.names táblát. Ezután válassza a Tovább gombra.
Célként válassza a Lakehouse lehetőséget a Munkaterület lap alatt, majd kattintson ismét a Tovább gombra.
Válasszon ki egy meglévőt, vagy hozzon létre egy új Lakehouse-t, majd válassza a Tovább gombot.
Adjon meg egy céltáblanevet a Lakehouse-célhelyhez másolni kívánt adatokhoz, és válassza a Tovább lehetőséget.
Tekintse át az összegzést a Másolási segéd utolsó lapján, majd válassza az OK gombot.
Az OK gomb kiválasztása után az új Copy tevékenység fel lesz véve a folyamatvászonra.
Hajtsa végre a két folyamattevékenységet az adatok betöltéséhez
Csatlakozás a szkript- és adatmásolási tevékenységeket a következő szerint:A szkripttevékenység sikerességéről.
Válassza a Futtatás , majd a Mentés és futtatás lehetőséget a folyamat két tevékenységének futtatásához.
A folyamat sikeres futtatása után további információkért tekintse meg a részleteket.
Váltson a munkaterületre, és válassza ki a Lakehouse-t az eredmények ellenőrzéséhez.
Válassza ki a SynapseNamesTable táblát a Lakehouse-ba betöltött dat megtekintéséhez.
Kapcsolódó tartalom
Ez a minta bemutatja, hogyan elő feldolgozhatja az adatokat egy tárolt eljárással, mielőtt betöltené az eredményeket a Lakehouse-ba. Megtanulta végrehajtani az alábbi műveleteket:
- Tárolt eljárás futtatásához hozzon létre egy parancsfájl-tevékenységgel rendelkező adatfolyamot.
- Folyamattevékenység használatával töltse be az előre feldolgozott táblaadatokat a Lakehouse-ba.
- Hajtsa végre a folyamattevékenységeket az adatok betöltéséhez.
A következő lépésben további információt kaphat a folyamatfuttatások monitorozásáról.
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: