Adatok előfeldolgozása tárolt eljárással a Lakehouse-ba való betöltés előtt

Ebben az oktatóanyagban bemutatjuk, hogyan futtathat folyamatszkript-tevékenységet tárolt eljárás futtatásához egy tábla létrehozásához és az adatok előfeldolgozásához egy Synapse-Data Warehouse. Ezután betöltjük az előre feldolgozott táblát a Lakehouse-ba.

Fontos

A Microsoft Fabric jelenleg előzetes verzióban érhető el. Ezek az információk egy előzetes termékre vonatkoznak, amely a kiadás előtt lényegesen módosítható. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát az itt megadott információkra vonatkozóan. Tekintse meg Azure Data Factory szolgáltatás dokumentációját az Azure-ban.

Előfeltételek

  • Egy Microsoft Fabric-kompatibilis munkaterület. Ha még nincs ilyenje, tekintse meg a Munkaterület létrehozása című cikket.

  • Készítsen elő egy tárolt eljárást a Azure Synapse Data Warehouse. Hozza létre előre a következő tárolt eljárást:

    CREATE PROCEDURE spM_add_names
    AS
    --Create initial table
    IF EXISTS (SELECT * FROM sys.objects
    WHERE object_id = OBJECT_ID(N'[dbo].[names]') AND TYPE IN (N'U'))
    BEGIN
    DROP TABLE names
    END;
    
    CREATE TABLE names
    (id INT,fullname VARCHAR(50));
    
    --Populate data
    INSERT INTO names VALUES (1,'John Smith');
    INSERT INTO names VALUES (2,'James Dean');
    
    --Alter table for new columns
    ALTER TABLE names
    ADD first_name VARCHAR(50) NULL;
    
    ALTER TABLE names
    ADD last_name VARCHAR(50) NULL;
    
    --Update table
    UPDATE names
    SET first_name = SUBSTRING(fullname, 1, CHARINDEX(' ', fullname)-1);
    
    UPDATE names
    SET last_name = SUBSTRING(fullname, CHARINDEX(' ', fullname)+1, LEN(fullname)-CHARINDEX(' ', fullname));
    
    --View Result
    SELECT * FROM names;
    

    Képernyőkép a tárolt eljárás mintatáblák létrehozásához való futtatásának eredményeiről.

Folyamatszkript-tevékenység létrehozása a tárolt eljárás futtatásához

Ebben a szakaszban egy szkripttevékenységet használunk az előfeltételekben létrehozott tárolt eljárás futtatásához.

  1. Válassza a Szkripttevékenység lehetőséget, majd az Új lehetőséget a Azure Synapse Data Warehouse való csatlakozáshoz.

    Képernyőkép a folyamat felületéről egy új szkripttevékenység létrehozásához és a Azure Synapse Data Warehouse való csatlakozáshoz.

  2. Válassza a Azure Synapse Analytics, majd a Folytatás lehetőséget.

    Képernyőkép az Új kapcsolat párbeszédpanelről, amelyen Azure Synapse Analytics van kiválasztva.

  3. Adja meg a Kiszolgáló, az Adatbázis és a Felhasználónév és a Jelszó mezőt az alapszintű hitelesítéshez, és adja meg a SynapseConnection nevet a Kapcsolat neve mezőben. Ezután válassza a Létrehozás lehetőséget az új kapcsolat létrehozásához.

    Képernyőkép az Új kapcsolat létrehozása párbeszédpanelről.

  4. A tárolt eljárás futtatásához adja meg az EXEC-spM_add_names . Létrehoz egy új táblát, dbo.name és egy egyszerű átalakítással előre feldolgozja az adatokat, hogy a teljes név mezőt két mezőre módosítsa, first_name és last_name.

    Képernyőkép a spM_add_names tárolt eljárás végrehajtására konfigurált szkripttevékenység beállítások lapján.

Folyamattevékenység használata az előre feldolgozott táblaadatok Lakehouse-ba való betöltéséhez

  1. Válassza az Adatok másolása , majd a Másolási segéd használata lehetőséget.

    Képernyőkép a Másolási segéd használata gombról az Adatok másolása területen.

  2. Válassza Azure Synapse Elemzés lehetőséget az adatforráshoz, majd válassza a Tovább gombot.

    Képernyőkép a Copy Assistant adatforrás-kiválasztási oldalról, amelyen Azure Synapse Analytics van kiválasztva.

  3. Válassza ki a korábban létrehozott meglévő SynapseConnection kapcsolatot.

    Képernyőkép a korábban létrehozott SynapseConnection kiválasztásáról a Másolási segéd Adatforrás kiválasztása lapján.

  4. Válassza ki a tárolt eljárás által létrehozott és előre feldolgozott dbo.names táblát. Ezután kattintson a Tovább gombra.

    Képernyőkép a tárolt eljárás által az előző lépésekben létrehozott és előre feldolgozott dbo.names tábla kiválasztásáról.

  5. Válassza a Munkaterület lap Lakehouse elemét célként, majd kattintson ismét a Tovább gombra.

    Képernyőkép a Lakehouse kiválasztásáról a másolási célhelyhez a Másolási segédben.

  6. Válasszon ki egy meglévőt, vagy hozzon létre egy új Lakehouse-t, majd válassza a Tovább gombot.

    Képernyőkép egy Lakehouse-célhely kiválasztásáról a Másolási segédben.

  7. Adjon meg egy céltáblanevet a Lakehouse célhelyéhez másolandó adatokhoz, és válassza a Tovább gombot.

    Képernyőkép a Lakehouse-célhelyen használandó céltábla nevéről.

  8. Tekintse át az összefoglalást a Másolási segéd utolsó lapján, majd válassza az OK gombot.

    Képernyőkép a Másolási segéd összegző oldaláról a konfigurált kapcsolatok részleteivel.

  9. Az OK gomb kiválasztása után az új Copy tevékenység bekerül a folyamatvászonra.

    Képernyőkép a folyamatvászonról a hozzáadott Copy tevékenység.

Hajtsa végre a két folyamattevékenységet az adatok betöltéséhez

  1. Csatlakoztassa a szkript- és másolási adattevékenységeket a Sikeres művelethez a Szkript tevékenységből.

    Képernyőkép a szkripttevékenység sikerességéről szóló két tevékenység kapcsolatáról.

  2. A folyamat két tevékenységének futtatásához válassza a Futtatás , majd a Mentés és futtatás lehetőséget.

    Képernyőkép a folyamatfuttatás gombról.

    Képernyőkép a folyamat Mentés és futtatás gombjáról.

  3. A folyamat sikeres futtatása után további információkért tekintse meg a részleteket.

    Képernyőkép a folyamatfuttatás részleteinek megtekintéséről gombról.

    Képernyőkép a folyamat futtatási részleteiről.

  4. Váltson a munkaterületre, és válassza a Lakehouse lehetőséget az eredmények ellenőrzéséhez.

    Képernyőkép a munkaterületről, kiemelve a Lakehouse célhelyét.

  5. Válassza ki a SynapseNamesTable táblát a Lakehouse-ba betöltött dat megtekintéséhez.

    Képernyőkép az eredményekről a Lakehouse-beli SynapseNamesTable-ban.

Következő lépések

Ez a minta bemutatja, hogyan lehet előre feldolgozni az adatokat egy tárolt eljárással, mielőtt betöltené az eredményeket a Lakehouse-ba. Megtanulta végrehajtani az alábbi műveleteket:

  • Hozzon létre egy szkripttevékenységet tartalmazó adatfolyamot egy tárolt eljárás futtatásához.
  • Folyamattevékenység használatával töltse be az előre feldolgozott táblaadatokat a Lakehouse-ba.
  • Hajtsa végre a folyamattevékenységeket az adatok betöltéséhez.

A következő lépésben további információt kaphat a folyamatfuttatások monitorozásáról.