Pozyskiwanie danych do dedykowanej puli SQL
W tym artykule dowiesz się, jak pozyskiwać dane z konta magazynu usługi Azure Data Lake Gen 2 do dedykowanej puli SQL w usłudze Azure Synapse Analytics.
Wymagania wstępne
- Subskrypcja platformy Azure: jeśli nie masz subskrypcji platformy Azure, przed rozpoczęciem utwórz bezpłatne konto platformy Azure .
- Konto usługi Azure Storage: używasz usługi Azure Data Lake Storage Gen 2 jako źródłowego magazynu danych. Jeśli nie masz konta magazynu, zobacz Tworzenie konta usługi Azure Storage , aby uzyskać instrukcje tworzenia konta.
-
Azure Synapse Analytics: używasz dedykowanej puli SQL jako magazynu danych ujścia.
- Jeśli nie masz istniejącego obszaru roboczego usługi Synapse, zobacz Tworzenie obszaru roboczego usługi Synapse
- Jeśli nie masz istniejącej dedykowanej puli SQL. Zobacz Tworzenie dedykowanej puli SQL.
Tworzenie połączonych usług
W usłudze Azure Synapse Analytics połączona usługa służy do definiowania informacji o połączeniu z innymi usługami. W tej sekcji dodasz połączoną usługę Azure Synapse Analytics i Azure Data Lake Storage Gen2.
- Otwórz środowisko użytkownika usługi Azure Synapse Analytics i przejdź do karty Zarządzanie.
- W obszarze Połączenia zewnętrzne wybierz pozycję Połączone usługi.
- Aby dodać połączoną usługę, wybierz pozycję Nowy.
- Wybierz kafelek Azure Data Lake Storage Gen2 z listy i wybierz pozycję Kontynuuj.
- Wprowadź poświadczenia uwierzytelniania. Klucz konta, jednostka usługi i tożsamość zarządzana są obecnie obsługiwanymi typami uwierzytelniania. Wybierz pozycję Testuj połączenie, aby sprawdzić, czy poświadczenia są poprawne. Po zakończeniu wybierz pozycję Utwórz.
- Powtórz kroki 3–5, ale zamiast Azure Data Lake Storage Gen2 wybierz kafelek Azure Synapse Analytics i wprowadź odpowiednie poświadczenia połączenia. W przypadku Azure Synapse Analytics obecnie obsługiwane są uwierzytelnianie SQL, tożsamość zarządzana i jednostka usługi.
Tworzenie potoku
Potok zawiera logiczny przepływ wykonywania zestawu działań. W tej sekcji utworzysz potok zawierający działanie kopiowania, które pozysuje dane z usługi ADLS Gen2 do dedykowanej puli SQL.
- Przejdź do karty Integracja . Wybierz ikonę znaku plus obok nagłówka potoków i wybierz pozycję Potok.
- W obszarze Przenieś i przekształć w okienku działań przeciągnij pozycję Kopiuj dane na kanwę potoku.
- Wybierz działanie kopiowania i przejdź do karty Źródło . Wybierz pozycję Nowy , aby utworzyć nowy źródłowy zestaw danych.
- Wybierz Azure Data Lake Storage gen2 jako magazyn danych i wybierz pozycję Kontynuuj.
- Wybierz pozycję DelimitedText jako format i wybierz pozycję Kontynuuj.
- W okienku właściwości zestawu wybierz utworzoną usługę połączoną ADLS. Określ ścieżkę pliku danych źródłowych i określ, czy pierwszy wiersz ma nagłówek. Schemat można zaimportować z magazynu plików lub przykładowego pliku. Po zakończeniu wybierz przycisk OK.
- Przejdź do karty Ujście . Wybierz pozycję Nowy , aby utworzyć nowy zestaw danych ujścia.
- Wybierz pozycję Azure Synapse Analytics jako magazyn danych i wybierz pozycję Kontynuuj.
- W okienku właściwości zestawu wybierz utworzoną usługę połączoną Azure Synapse Analytics. Jeśli piszesz do istniejącej tabeli, wybierz ją z listy rozwijanej. W przeciwnym razie zaznacz pole Edytuj i wprowadź nazwę nowej tabeli. Po zakończeniu wybierz przycisk OK
- Jeśli tworzysz tabelę, włącz opcję Automatyczne tworzenie tabeli w polu opcji tabeli.
Debugowanie i publikowanie potoku
Po zakończeniu konfigurowania potoku możesz wykonać przebieg debugowania przed opublikowaniem artefaktów, aby sprawdzić, czy wszystko jest poprawne.
- Aby debugować potok, wybierz na pasku narzędzi pozycję Debuguj. Na karcie Dane wyjściowe w dolnej części okna wyświetlany jest stan uruchomienia potoku.
- Po pomyślnym uruchomieniu potoku na górnym pasku narzędzi wybierz pozycję Opublikuj wszystko. Ta akcja powoduje opublikowanie jednostek (zestawów danych i potoków) utworzonych w usłudze Synapse Analytics.
- Poczekaj na wyświetlenie komunikatu Pomyślnie opublikowano. Aby wyświetlić komunikaty powiadomień, wybierz przycisk dzwonka w prawym górnym rogu.
Wyzwalanie i monitorowanie potoku
W tym kroku ręcznie wyzwolisz potok opublikowany w poprzednim kroku.
- Wybierz pozycję Dodaj wyzwalacz na pasku narzędzi, a następnie wybierz pozycję Wyzwól teraz. Na stronie Uruchomienie potoku wybierz przycisk Zakończ.
- Przejdź do karty Monitorowanie znajdującej się na lewym pasku bocznym. Widoczne jest uruchomienie potoku, które zostało wyzwolone za pomocą wyzwalacza ręcznego. Możesz użyć linków w kolumnie Akcje , aby wyświetlić szczegóły działania i ponownie uruchomić potok.
- Aby wyświetlić uruchomienia działań skojarzone z uruchomieniem potoku, wybierz link Wyświetl uruchomienia działań w kolumnie Akcje. W tym przykładzie istnieje tylko jedno działanie, więc na liście jest widoczny tylko jeden wpis. Aby uzyskać szczegółowe informacje na temat operacji kopiowania, wybierz link Szczegóły (ikona okularów) w kolumnie Akcje. Wybierz pozycję Uruchomienia potoku u góry, aby wrócić do widoku Uruchomienia potoku. Aby odświeżyć widok, wybierz pozycję Odśwież.
- Sprawdź, czy dane są poprawnie zapisywane w dedykowanej puli SQL.
Następne kroki
Aby uzyskać więcej informacji na temat integracji danych w usłudze Azure Synapse Analytics, zobacz artykuł Pozyskiwanie danych do Azure Data Lake Storage Gen2.