Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
DOTYCZY: Azure Data Factory
Azure Synapse Analytics
Napiwek
Wypróbuj usługę Data Factory w usłudze Microsoft Fabric — rozwiązanie analityczne typu all-in-one dla przedsiębiorstw. Usługa Microsoft Fabric obejmuje wszystko, od przenoszenia danych do nauki o danych, analizy w czasie rzeczywistym, analizy biznesowej i raportowania. Dowiedz się, jak bezpłatnie rozpocząć nową wersję próbną !
W tym samouczku utworzysz fabrykę danych za pomocą witryny Azure Portal. Następnie użyj narzędzia do kopiowania danych, aby utworzyć potok, który kopiuje dane z bazy danych programu SQL Server do usługi Azure Blob Storage.
Uwaga
- Jeśli dopiero zaczynasz korzystać z usługi Azure Data Factory, zobacz Wprowadzenie do usługi Data Factory.
Ten samouczek obejmuje wykonanie następujących kroków:
- Tworzenie fabryki danych.
- Tworzenie potoku za pomocą narzędzia do kopiowania danych.
- Monitorowanie uruchomień potoku i działań.
Wymagania wstępne
Subskrypcja platformy Azure
Jeśli nie masz jeszcze subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto.
Role na platformie Azure
Aby utworzyć wystąpienia fabryki danych, konto użytkownika używane do logowania się na platformie Azure musi mieć przypisaną rolę Współtwórca lub Właściciel albo musi być administratorem subskrypcji platformy Azure.
Aby wyświetlić swoje uprawnienia do subskrypcji, przejdź do witryny Azure Portal. Wybierz swoją nazwę użytkownika w prawym górnym rogu, a następnie wybierz pozycję Uprawnienia. Jeśli masz dostęp do wielu subskrypcji, wybierz odpowiednią subskrypcję. Aby uzyskać przykładowe instrukcje dotyczące dodawania użytkownika do roli, zobacz Przypisywanie ról platformy Azure przy użyciu witryny Azure Portal.
Program SQL Server 2014, 2016 oraz 2017
W tym samouczku użyjesz bazy danych programu SQL Server jako źródłowego magazynu danych. Potok w fabryce danych utworzony w tym samouczku kopiuje dane z tej bazy danych programu SQL Server (źródła) do magazynu obiektów blob (ujścia). Następnie utworzysz tabelę o nazwie emp w bazie danych programu SQL Server i wstawisz kilka przykładowych wpisów do tabeli.
Uruchom program SQL Server Management Studio. Jeśli nie jest jeszcze zainstalowana na maszynie, przejdź do pozycji Pobierz program SQL Server Management Studio.
Połącz się z wystąpieniem programu SQL Server przy użyciu swoich poświadczeń.
Utwórz przykładową bazę danych. W widoku drzewa kliknij prawym przyciskiem myszy pozycję Bazy danych, a następnie wybierz pozycję Nowa baza danych.
W oknie Nowa baza danych wprowadź nazwę bazy danych, a następnie wybierz przycisk OK.
Aby utworzyć tabelę emp i wstawić do niej przykładowe dane, uruchom następujący skrypt zapytania względem bazy danych. W widoku drzewa kliknij prawym przyciskiem myszy utworzoną bazę danych, a następnie wybierz pozycję Nowe zapytanie.
CREATE TABLE dbo.emp ( ID int IDENTITY(1,1) NOT NULL, FirstName varchar(50), LastName varchar(50) ) GO INSERT INTO emp (FirstName, LastName) VALUES ('John', 'Doe') INSERT INTO emp (FirstName, LastName) VALUES ('Jane', 'Doe') GO
Konto magazynu Azure
W tym samouczku używasz konta usługi Azure Storage ogólnego przeznaczenia (konkretnie usługi Blob Storage) jako magazynu danych: docelowego/ujścia. Jeśli nie masz konta magazynu ogólnego przeznaczenia, zobacz Tworzenie konta magazynu , aby uzyskać instrukcje tworzenia konta magazynu. Potok w fabryce danych utworzony w tym samouczku kopiuje dane z bazy danych programu SQL Server (źródła) do tego magazynu obiektów blob (ujścia).
Pobieranie nazwy konta i klucza konta magazynu
W tym samouczku używasz nazwy i klucza swojego konta magazynu. Pobierz nazwę i klucz konta magazynu, wykonując następujące kroki:
Zaloguj się do witryny Azure Portal przy użyciu nazwy użytkownika i hasła platformy Azure.
W okienku po lewej stronie wybierz pozycję Wszystkie usługi. Filtruj przy użyciu słowa kluczowego Storage, a następnie wybierz pozycję Konta magazynowania.
Na liście kont magazynu odfiltruj swoje konto magazynu, jeśli to konieczne. Następnie wybierz swoje konto magazynu.
W oknie Konto magazynu wybierz pozycję Klucze dostępu.
W polach Nazwa konta magazynu i klucz1 skopiuj wartości, a następnie wklej je do Notatnika lub innego edytora, aby móc je później użyć w samouczku.
Tworzenie fabryki danych
W górnym menu wybierz Utwórz zasób>Analityka>Data Factory :
Na stronie Nowa fabryka danych w obszarze Nazwa wprowadź ADFTutorialDataFactory.
Nazwa fabryki danych musi być globalnie unikatowa. Jeśli dla pola nazwy zobaczysz poniższy komunikat o błędzie, zmień nazwę fabryki danych (np. twojanazwaADFTutorialDataFactory). Aby uzyskać reguły nazewnictwa artefaktów usługi Data Factory, zobacz Reguły nazewnictwa usługi Data Factory.
Wybierz subskrypcję platformy Azure, w której chcesz utworzyć fabrykę danych.
W przypadku grupy zasobów wykonaj jedną z następujących czynności:
Wybierz pozycję Użyj istniejącej i wybierz istniejącą grupę zasobów z listy rozwijanej.
Wybierz pozycję Utwórz nową i wprowadź nazwę grupy zasobów.
Aby dowiedzieć się więcej o grupach zasobów, zobacz Zarządzanie zasobami platformy Azure przy użyciu grup zasobów.
W obszarze Wersja wybierz pozycję V2.
W obszarze Lokalizacja wybierz lokalizację fabryki danych. Na liście rozwijanej są wyświetlane tylko obsługiwane lokalizacje. Magazyny danych (np. usługi Azure Storage i SQL Database) oraz jednostki obliczeniowe (np. usługa Azure HDInsight) używane przez usługę Data Factory mogą mieścić się w innych lokalizacjach/regionach.
Wybierz pozycję Utwórz.
Po zakończeniu tworzenia zostanie wyświetlona strona Fabryka danych , jak pokazano na obrazie.
Wybierz Otwórz na kafelku Otwórz Azure Data Factory Studio, aby uruchomić interfejs użytkownika Data Factory w osobnej karcie.
Tworzenie potoku za pomocą narzędzia do kopiowania danych
Na stronie głównej usługi Azure Data Factory wybierz pozycję Importowanie, aby uruchomić narzędzie do kopiowania danych.
Na stronie Właściwości narzędzia do kopiowania danych wybierz pozycję Wbudowane zadanie kopiowania w obszarze Typ zadania, a następnie wybierz pozycję Uruchom raz w obszarze Cykl zadań lub harmonogram zadań, a następnie wybierz przycisk Dalej.
Na stronie Źródłowy magazyn danych wybierz pozycję + Utwórz nowe połączenie.
W obszarze Nowe połączenie wyszukaj pozycję SQL Server, a następnie wybierz pozycję Kontynuuj.
W oknie dialogowym Nowe połączenie (serwer SQL) w obszarze Nazwa wprowadź wartość SqlServerLinkedService. Wybierz pozycję +Nowy w obszarze Połącz za pośrednictwem środowiska Integration Runtime. Należy utworzyć środowisko Integration Runtime (Self-hosted), pobrać je na komputer i zarejestrować w usłudze Data Factory. Środowisko Integration Runtime (Self-hosted) kopiuje dane między środowiskiem lokalnym a chmurą.
W oknie dialogowym Konfiguracja środowiska Integration Runtime wybierz pozycję Self-Hosted. Następnie wybierz pozycję Kontynuuj.
W oknie dialogowym Konfiguracja środowiska Integration Runtime w obszarze Nazwa wprowadź tutorialIntegrationRuntime. Następnie wybierz pozycję Utwórz.
W oknie dialogowym Konfiguracja środowiska Integration Runtime wybierz pozycję Kliknij tutaj, aby uruchomić instalację ekspresową dla tego komputera. Ta akcja instaluje na komputerze środowisko Integration Runtime i rejestruje je w usłudze Data Factory. Ewentualnie można użyć opcji instalacji ręcznej w celu pobrania pliku instalacyjnego, uruchomienia go i zarejestrowania środowiska Integration Runtime za pomocą klucza.
Uruchom pobraną aplikację. W oknie zostanie wyświetlony stan instalacji ekspresowej.
W oknie dialogowym Nowe połączenie (SQL Server) upewnij się, że w obszarze Połącz za pośrednictwem środowiska Integration Runtime wybrano pozycję TutorialIntegrationRuntime. Następnie wykonaj następujące czynności:
a. W obszarze Nazwa wprowadź wartość SqlServerLinkedService.
b. W obszarze Nazwa serwera wprowadź nazwę wystąpienia programu SQL Server.
c. W obszarze Nazwa bazy danych wprowadź nazwę lokalnej bazy danych.
d. W obszarze Typ uwierzytelniania wybierz odpowiednie uwierzytelnianie.
e. W obszarze Nazwa użytkownika wprowadź nazwę użytkownika z dostępem do programu SQL Server.
f. Wprowadź hasło użytkownika.
g. Przetestuj połączenie i wybierz pozycję Utwórz.
Na stronie Źródłowy magazyn danych upewnij się, że nowo utworzone połączenie SQL Server zostało wybrane w bloku Połączenie. Następnie w sekcji Tabele źródłowe wybierz pozycję ISTNIEJĄCE TABELE i wybierz tabelę dbo.emp na liście, a następnie wybierz przycisk Dalej. Możesz wybrać dowolną inną tabelę, odpowiednio do bazy danych.
Na stronie Zastosuj filtr możesz wyświetlić podgląd danych i wyświetlić schemat danych wejściowych, wybierając przycisk Podgląd danych . Następnie wybierz pozycję Dalej.
Na stronie Docelowy magazyn danych wybierz pozycję + Utwórz nowe połączenie
W obszarze Nowe połączenie wyszukaj i wybierz pozycję Azure Blob Storage, a następnie wybierz pozycję Kontynuuj.
W oknie dialogowym Nowe połączenie (Azure Blob Storage) wykonaj następujące czynności:
a. W polu Nazwa wprowadź AzureStorageLinkedService.
b. W obszarze Połącz za pośrednictwem środowiska Integration Runtime wybierz pozycję TutorialIntegrationRuntime i wybierz pozycję Klucz konta w obszarze Metoda uwierzytelniania.
c. W obszarze Subskrypcja platformy Azure wybierz subskrypcję platformy Azure z listy rozwijanej.
d. W obszarze Nazwa konta magazynu wybierz swoje konto magazynu z listy rozwijanej.
e. Przetestuj połączenie i wybierz pozycję Utwórz.
W oknie dialogowym Docelowy magazyn danych upewnij się, że nowo utworzone połączenie usługi Azure Blob Storage zostało wybrane w bloku Połączenie . Następnie w obszarze Ścieżka folderu wpisz adftutorial/fromonprem. Utworzyłeś kontener adftutorial jako część wymagań wstępnych. Jeśli folder wyjściowy nie istnieje (w tym przypadku fromonprem), usługa Data Factory automatycznie go utworzy. Możesz również użyć przycisku Przeglądaj, aby przeglądać magazyn danych typu blob oraz jego kontenery i foldery. Jeśli nie określisz żadnej wartości w obszarze Nazwa pliku, domyślnie będzie używana nazwa ze źródła (w tym przypadku dbo.emp).
W oknie dialogowym Ustawienia formatu pliku wybierz przycisk Dalej.
W oknie dialogowym Ustawienia w obszarze Nazwa zadania wprowadź wartość CopyFromOnPremSqlToAzureBlobPipeline, a następnie wybierz przycisk Dalej. Narzędzie do kopiowania danych tworzy potok o nazwie określonej w tym polu.
W oknie dialogowym Podsumowanie przejrzyj wartości wszystkich ustawień, a następnie wybierz pozycję Dalej.
Na stronie Wdrażanie wybierz pozycję Monitor , aby monitorować potok (zadanie).
Po zakończeniu przebiegu potoku można wyświetlić stan utworzonego potoku.
Na stronie "Uruchomienia potoku" wybierz pozycję Odśwież , aby odświeżyć listę. Wybierz link w obszarze Nazwa potoku , aby wyświetlić szczegóły przebiegu działania lub ponownie uruchomić potok.
Na stronie "Uruchomienia działania" wybierz link Szczegóły (ikona okularów) w kolumnie Nazwa działania , aby uzyskać więcej informacji na temat operacji kopiowania. Aby wrócić do strony "Uruchomienia potoku", wybierz link Wszystkie uruchomienia potoku w menu okruszkowym. Aby odświeżyć widok, wybierz pozycję Odśwież.
Upewnij się, że plik wyjściowy jest widoczny w folderze fromonprem kontenera adftutorial .
Wybierz kartę Autor po lewej stronie, aby przełączyć się do trybu edytora. Za pomocą edytora można zaktualizować usługi połączone, zestawy danych i potoki utworzone przez narzędzie. Wybierz Kod, aby wyświetlić kod JSON skojarzony z jednostką otwartą w edytorze. Aby uzyskać szczegółowe informacje na temat edytowania tych jednostek w interfejsie użytkownika usługi Data Factory, zobacz wersję tego samouczka w witrynie Azure Portal.
Powiązana zawartość
Potok w tym przykładzie kopiuje dane z bazy danych programu SQL Server do usługi Blob Storage. W tym samouczku omówiono:
- Tworzenie fabryki danych.
- Tworzenie potoku za pomocą narzędzia do kopiowania danych.
- Monitorowanie uruchomień potoku i działań.
Aby uzyskać listę magazynów danych obsługiwanych przez usługę Data Factory, zobacz Obsługiwane magazyny danych.
Aby dowiedzieć się, jak zbiorczo kopiować dane z lokalizacji źródłowej do docelowej, przejdź do następującego samouczka: