Mapowanie danych w usłudze Azure Synapse Analytics

Co to jest narzędzie do mapowania danych?

Narzędzie do mapowania danych to proces z przewodnikiem, który ułatwia użytkownikom tworzenie mapowań ETL i mapowanie przepływów danych z danych źródłowych do tabel bazy danych typu lake usługi Synapse bez pisania kodu. Ten proces rozpoczyna się od wyboru tabel docelowych w bazach danych typu lake usługi Synapse, a następnie mapowania ich danych źródłowych na te tabele.

Aby uzyskać więcej informacji na temat baz danych typu lake usługi Synapse, zobacz Omówienie szablonów baz danych usługi Azure Synapse — Azure Synapse Analytics | Microsoft Docs

Narzędzie do mapowania danych zapewnia środowisko z przewodnikiem, w którym użytkownik może wygenerować przepływ mapowania danych bez konieczności rozpoczynania pracy od podstaw. Następnie można szybko wygenerować skalowalny przepływ mapowania danych, który można uruchomić w potokach usługi Synapse.

Wprowadzenie

Narzędzie Dane mapy jest uruchamiane z poziomu środowiska bazy danych usługi Synapse Lake. W tym miejscu możesz wybrać narzędzie Mapuj dane, aby rozpocząć proces.

Zrzut ekranu przedstawiający sposób otwierania danych mapy.

Dane mapy wymagają dostępności zasobów obliczeniowych, aby ułatwić użytkownikom wyświetlanie podglądu danych i odczytywanie schematu plików źródłowych. Podczas korzystania z danych mapy po raz pierwszy w sesji należy rozgrzać klaster. Zrzut ekranu przedstawiający klastry debugowania.

Aby rozpocząć, wybierz źródło danych, które chcesz mapować na tabele bazy danych typu lake. Obecnie obsługiwane źródła danych to bazy danych Azure Data Lake Storage Gen 2 i Synapse Lake. Zrzut ekranu przedstawiający źródła.

Opcje typu pliku

Podczas wybierania magazynu plików, takiego jak Azure Data Lake Storage Gen 2, obsługiwane są następujące typy plików:

  • Common Data Model
  • Rozdzielany tekst
  • Parquet

Tworzenie mapowania danych

Skonfiguruj mapowanie danych przy użyciu wybranego typu źródła. Zrzut ekranu przedstawiający ustawienia konfiguracji pliku danych mapy.

Uwaga

Możesz wybrać folder albo pojedynczy plik. Jeśli wybierzesz folder, będziesz mieć możliwość mapowania wielu plików na tabele bazy danych typu lake. Jeśli wybierzesz folder, po wybraniu opcji kontynuacji zobaczysz pytanie, czy dołączyć tylko konkretne pliki, jeśli jest to konieczne.

Nadaj nazwę mapowaniu danych i wybierz miejsce docelowe w bazie danych typu lake usługi Synapse. Zrzut ekranu przedstawiający nazewnictwo i lokalizację docelową.

Mapowanie źródła na element docelowy

Wybierz podstawową tabelę źródłową do mapowania na tabelę docelową bazy danych usługi Synapse Lake. Zrzut ekranu przedstawiający reguły mapowania danych.

Nowe mapowanie

Użyj przycisku Nowe mapowanie, aby dodać metodę mapowania w celu utworzenia mapowania lub przekształcenia.

Dodatkowe źródło

Użyj przycisku Dodatkowe źródło, aby połączyć się z mapowaniem i dodać inne źródło do mapowania.

Podgląd danych

Karta Podgląd danych zawiera interaktywną migawkę danych każdej transformacji. Aby uzyskać więcej informacji, zobacz Podgląd danych w trybie debugowania.

Metody mapowania

Obsługiwane są następujące metody mapowania:

Tworzenie potoku

Po zakończeniu przekształceń danych mapy wybierz przycisk Utwórz potok, aby wygenerować przepływ mapowania danych i potok w celu debugowania i uruchamiania transformacji.