Wstępne przetwarzanie danych za pomocą procedury składowanej przed załadowaniem do usługi Lakehouse
W tym samouczku pokazano, jak za pomocą działania skryptu potoku uruchomić procedurę składowaną w celu utworzenia tabeli i wstępnie przetworzyć dane w usłudze Azure Synapse Data Warehouse. Następnie załadujemy wstępnie przetworzoną tabelę do usługi Lakehouse.
Wymagania wstępne
Obszar roboczy z obsługą usługi Microsoft Fabric. Jeśli jeszcze go nie masz, zapoznaj się z artykułem Tworzenie obszaru roboczego.
Przygotuj procedurę składowaną w usłudze Azure Synapse Data Warehouse. Utwórz następującą procedurę składowaną z wyprzedzeniem:
CREATE PROCEDURE spM_add_names AS --Create initial table IF EXISTS (SELECT * FROM sys.objects WHERE object_id = OBJECT_ID(N'[dbo].[names]') AND TYPE IN (N'U')) BEGIN DROP TABLE names END; CREATE TABLE names (id INT,fullname VARCHAR(50)); --Populate data INSERT INTO names VALUES (1,'John Smith'); INSERT INTO names VALUES (2,'James Dean'); --Alter table for new columns ALTER TABLE names ADD first_name VARCHAR(50) NULL; ALTER TABLE names ADD last_name VARCHAR(50) NULL; --Update table UPDATE names SET first_name = SUBSTRING(fullname, 1, CHARINDEX(' ', fullname)-1); UPDATE names SET last_name = SUBSTRING(fullname, CHARINDEX(' ', fullname)+1, LEN(fullname)-CHARINDEX(' ', fullname)); --View Result SELECT * FROM names;
Tworzenie działania skryptu potoku w celu uruchomienia procedury składowanej
W tej sekcji użyjemy działania Skrypt, aby uruchomić procedurę składowaną utworzoną w wymaganiach wstępnych.
Wybierz działanie Skrypt na pasku narzędzi Działania , a następnie wybierz kartę ustawienia w okienku właściwości, aby wybrać szczegóły połączenia. Wybierz listę rozwijaną Połączenie , aby wybrać pozycję Więcej. Następnie możesz nawiązać połączenie z usługą Azure Synapse Data Warehouse.
Wybierz pozycję Azure Synapse Analytics (SQL DW) w sekcji Nowe źródła .
Podaj pola Serwer, Baza danych i Nazwa użytkownika i Hasło dla uwierzytelniania podstawowego, a następnie wprowadź wartość SynapseConnection jako nazwę połączenia. Następnie wybierz pozycję Utwórz , aby utworzyć nowe połączenie.
Dane wejściowe EXEC spM_add_names do uruchomienia procedury składowanej. Tworzy nową tabelę dbo.name i wstępnie przetwarza dane za pomocą prostego przekształcenia, aby zmienić pole fullname na dwa pola, first_name i last_name.
Ładowanie wstępnie przetworzonych danych tabeli do usługi Lakehouse za pomocą działania potoku
Wybierz pozycję Kopiuj dane na pasku narzędzi Działania , a następnie wybierz pozycję Użyj asystenta kopiowania lub użyj karty Asystent kopiowania danych na stronie docelowej potoku, aby uruchomić asystenta kopiowania danych.
Wprowadź ciąg Synapse w filtrze wyszukiwania i wybierz pozycję Azure Synapse Analytics (SQL DW) dla źródła danych, a następnie wybierz pozycję Dalej.
Wybierz istniejące połączenie SynapseConnection utworzone wcześniej.
Wybierz tabelę dbo.names , która została utworzona i przetworzona wstępnie przez procedurę składowaną. Następnie kliknij przycisk Dalej.
Wybierz pozycję Lakehouse.
Wprowadź nazwę, a następnie wybierz pozycję Utwórz i połącz.
Wprowadź nazwę tabeli docelowej dla danych, które mają zostać skopiowane do miejsca docelowego usługi Lakehouse, a następnie wybierz pozycję Dalej.
Przejrzyj podsumowanie na ostatniej stronie Asystenta kopiowania. Usuń zaznaczenie pola wyboru Rozpocznij transfer danych natychmiast , a następnie wybierz przycisk OK.
Po wybraniu przycisku OK nowe działanie Kopiuj zostaną dodane na kanwę potoku.
Wykonaj dwa działania potoku, aby załadować dane
Połącz działania skryptu i kopiowania danych według powodzenia działania Skrypt.
Wybierz pozycję Uruchom , a następnie pozycję Zapisz i uruchom , aby uruchomić dwa działania w potoku.
Po pomyślnym uruchomieniu potoku możesz wyświetlić szczegóły, aby uzyskać więcej informacji. Wybierz link z nazwą działanie Kopiuj, aby wyświetlić jego szczegóły uruchomienia.
Przejdź do obszaru roboczego i znajdź utworzoną usługę Lakehouse. Wybierz pod nim punkt końcowy analizy SQL, aby sprawdzić wyniki.
Wybierz tabelę SynapseNamesTable, aby wyświetlić dane załadowane do usługi Lakehouse.
Powiązana zawartość
W tym przykładzie pokazano, jak wstępnie przetworzyć dane za pomocą procedury składowanej przed załadowaniem wyników do usługi Lakehouse. W tym samouczku omówiono:
- Utwórz potok danych za pomocą działania Skrypt, aby uruchomić procedurę składowaną.
- Użyj działania potoku, aby załadować wstępnie przetworzone dane tabeli do usługi Lakehouse.
- Wykonaj działania potoku, aby załadować dane.
Następnie przejdź dalej, aby dowiedzieć się więcej na temat monitorowania przebiegów potoku.