Adatok előfeldolgozása tárolt eljárással a Lakehouse-ba való betöltés előtt

Ebben az oktatóanyagban bemutatjuk, hogyan használható folyamatszkript-tevékenység egy tárolt eljárás futtatására egy tábla létrehozásához és az adatok előfeldolgozásához a Synapse-adattárházban. Ezután betöltjük az előfeldolgozott táblát a Lakehouse-ba.

Előfeltételek

  • Egy Microsoft Fabric-kompatibilis munkaterület. Ha még nincs ilyenje, tekintse meg a Munkaterület létrehozása című cikket.

  • Tárolt eljárás előkészítése az Azure Synapse-adattárházban. Hozza létre előre a következő tárolt eljárást:

    CREATE PROCEDURE spM_add_names
    AS
    --Create initial table
    IF EXISTS (SELECT * FROM sys.objects
    WHERE object_id = OBJECT_ID(N'[dbo].[names]') AND TYPE IN (N'U'))
    BEGIN
    DROP TABLE names
    END;
    
    CREATE TABLE names
    (id INT,fullname VARCHAR(50));
    
    --Populate data
    INSERT INTO names VALUES (1,'John Smith');
    INSERT INTO names VALUES (2,'James Dean');
    
    --Alter table for new columns
    ALTER TABLE names
    ADD first_name VARCHAR(50) NULL;
    
    ALTER TABLE names
    ADD last_name VARCHAR(50) NULL;
    
    --Update table
    UPDATE names
    SET first_name = SUBSTRING(fullname, 1, CHARINDEX(' ', fullname)-1);
    
    UPDATE names
    SET last_name = SUBSTRING(fullname, CHARINDEX(' ', fullname)+1, LEN(fullname)-CHARINDEX(' ', fullname));
    
    --View Result
    SELECT * FROM names;
    

    Screenshot showing the results of running the stored procedure to generate a sample table.

Folyamatszkript-tevékenység létrehozása a tárolt eljárás futtatásához

Ebben a szakaszban szkripttevékenységet használunk az előfeltételekben létrehozott tárolt eljárás futtatásához.

  1. Válassza a Szkripttevékenység lehetőséget, majd válassza az Új lehetőséget az Azure Synapse Data Warehouse-hoz való csatlakozáshoz.

    Screenshot showing the pipeline interface to create a new script activity and connect to your Azure Synapse Data Warehouse.

  2. Válassza az Azure Synapse Analyticset, majd a Folytatás lehetőséget.

    Screenshot showing the New connection dialog with Azure Synapse Analytics selected.

  3. Adja meg a Kiszolgáló, adatbázis, felhasználónév és jelszó mezőket az alapszintű hitelesítéshez, és adja meg a Synapse Csatlakozás ion nevet a Csatlakozás ion névhez. Ezután válassza a Létrehozás lehetőséget az új kapcsolat létrehozásához.

    Screenshot showing the create new connection dialog.

  4. A bemeneti EXEC spM_add_names a tárolt eljárás futtatásához. Létrehoz egy új táblát dbo.name, és egy egyszerű átalakítással előre feldolgozhatja az adatokat a teljes név mező két mezőre való módosításához, first_name és last_name.

    Screenshot showing the settings tab of the Script activity configured to execute the spM_add_names stored procedure.

Folyamattevékenység használata előre feldolgozott táblaadatok lakehouse-ba való betöltéséhez

  1. Válassza az Adatok másolása, majd a Másolási segéd használata lehetőséget.

    Screenshot showing the Use copy assistant button under Copy data.

  2. Válassza az adatforráshoz tartozó Azure Synapse Analytics lehetőséget, majd válassza a Tovább lehetőséget.

    Screenshot showing the Copy assistant data source selection page with Azure Synapse Analytics selected.

  3. Válassza ki a korábban létrehozott synapse Csatlakozás ion kapcsolatot.

    Screenshot showing the selection of the previously created SynapseConnection in the Choose data source page of the Copy assistant.

  4. Válassza ki a tárolt eljárás által létrehozott és előre feldolgozott dbo.names táblát. Ezután válassza a Tovább gombra.

    Screenshot showing the selection of the dbo.names table created and preprocessed by the stored procedure in the previous steps.

  5. Célként válassza a Lakehouse lehetőséget a Munkaterület lap alatt, majd kattintson ismét a Tovább gombra.

    Screenshot showing the selection of Lakehouse for the copy destination in the Copy assistant.

  6. Válasszon ki egy meglévőt, vagy hozzon létre egy új Lakehouse-t, majd válassza a Tovább gombot.

    Screenshot showing the selection of a Lakehouse destination in the Copy assistant.

  7. Adjon meg egy céltáblanevet a Lakehouse-célhelyhez másolni kívánt adatokhoz, és válassza a Tovább lehetőséget.

    Screenshot showing the destination table name to be used in the Lakehouse destination.

  8. Tekintse át az összegzést a Másolási segéd utolsó lapján, majd válassza az OK gombot.

    Screenshot showing the summary page of the Copy assistant with details of the configured connections.

  9. Az OK gomb kiválasztása után az új Copy tevékenység fel lesz véve a folyamatvászonra.

    Screenshot showing the pipeline canvas with the Copy activity added.

Hajtsa végre a két folyamattevékenységet az adatok betöltéséhez

  1. Csatlakozás a szkript- és adatmásolási tevékenységeket a következő szerint:A szkripttevékenység sikerességéről.

    Screenshot showing the connection of the two activities on success of the Script activity.

  2. Válassza a Futtatás , majd a Mentés és futtatás lehetőséget a folyamat két tevékenységének futtatásához.

    Screenshot showing the pipeline Run button.

    Screenshot showing the Save and run button for the pipeline.

  3. A folyamat sikeres futtatása után további információkért tekintse meg a részleteket.

    Screenshot showing the view pipeline run details button.

    Screenshot showing the run details for the pipeline.

  4. Váltson a munkaterületre, és válassza ki a Lakehouse-t az eredmények ellenőrzéséhez.

    Screenshot showing the workspace with the Lakehouse destination highlighted.

  5. Válassza ki a SynapseNamesTable táblát a Lakehouse-ba betöltött dat megtekintéséhez.

    Screenshot showing the results in the SynapseNamesTable in Lakehouse.

Ez a minta bemutatja, hogyan elő feldolgozhatja az adatokat egy tárolt eljárással, mielőtt betöltené az eredményeket a Lakehouse-ba. Megtanulta végrehajtani az alábbi műveleteket:

  • Tárolt eljárás futtatásához hozzon létre egy parancsfájl-tevékenységgel rendelkező adatfolyamot.
  • Folyamattevékenység használatával töltse be az előre feldolgozott táblaadatokat a Lakehouse-ba.
  • Hajtsa végre a folyamattevékenységeket az adatok betöltéséhez.

A következő lépésben további információt kaphat a folyamatfuttatások monitorozásáról.