Mapowanie danych w usłudze Azure Synapse Analytics
Co to jest narzędzie do mapowania danych?
Narzędzie do mapowania danych to proces z przewodnikiem, który ułatwia użytkownikom tworzenie mapowań ETL i mapowanie przepływów danych z danych źródłowych do tabel bazy danych typu lake usługi Synapse bez pisania kodu. Ten proces rozpoczyna się od wyboru tabel docelowych w bazach danych typu lake usługi Synapse, a następnie mapowania ich danych źródłowych na te tabele.
Aby uzyskać więcej informacji na temat baz danych typu lake usługi Synapse, zobacz Omówienie szablonów baz danych usługi Azure Synapse — Azure Synapse Analytics | Microsoft Docs
Narzędzie do mapowania danych zapewnia środowisko z przewodnikiem, w którym użytkownik może wygenerować przepływ mapowania danych bez konieczności rozpoczynania pracy od podstaw. Następnie można szybko wygenerować skalowalny przepływ mapowania danych, który można uruchomić w potokach usługi Synapse.
Wprowadzenie
Narzędzie Dane mapy jest uruchamiane z poziomu środowiska bazy danych usługi Synapse Lake. W tym miejscu możesz wybrać narzędzie Mapuj dane, aby rozpocząć proces.
Dane mapy wymagają dostępności zasobów obliczeniowych, aby ułatwić użytkownikom wyświetlanie podglądu danych i odczytywanie schematu plików źródłowych. Podczas korzystania z danych mapy po raz pierwszy w sesji należy rozgrzać klaster.
Aby rozpocząć, wybierz źródło danych, które chcesz mapować na tabele bazy danych typu lake. Obecnie obsługiwane źródła danych to bazy danych Azure Data Lake Storage Gen 2 i Synapse Lake.
Opcje typu pliku
Podczas wybierania magazynu plików, takiego jak Azure Data Lake Storage Gen 2, obsługiwane są następujące typy plików:
- Common Data Model
- Rozdzielany tekst
- Parquet
Tworzenie mapowania danych
Skonfiguruj mapowanie danych przy użyciu wybranego typu źródła.
Uwaga
Możesz wybrać folder albo pojedynczy plik. Jeśli wybierzesz folder, będziesz mieć możliwość mapowania wielu plików na tabele bazy danych typu lake. Jeśli wybierzesz folder, po wybraniu opcji kontynuacji zobaczysz pytanie, czy dołączyć tylko konkretne pliki, jeśli jest to konieczne.
Nadaj nazwę mapowaniu danych i wybierz miejsce docelowe w bazie danych typu lake usługi Synapse.
Mapowanie źródła na element docelowy
Wybierz podstawową tabelę źródłową do mapowania na tabelę docelową bazy danych usługi Synapse Lake.
Nowe mapowanie
Użyj przycisku Nowe mapowanie, aby dodać metodę mapowania w celu utworzenia mapowania lub przekształcenia.
Dodatkowe źródło
Użyj przycisku Dodatkowe źródło, aby połączyć się z mapowaniem i dodać inne źródło do mapowania.
Podgląd danych
Karta Podgląd danych zawiera interaktywną migawkę danych każdej transformacji. Aby uzyskać więcej informacji, zobacz Podgląd danych w trybie debugowania.
Metody mapowania
Obsługiwane są następujące metody mapowania:
- Direct
- Klucz zastępczy
- Wyszukiwanie
- Anulowanie przestawiania
- Agregacja
- Sum
- Minimum
- Maksimum
- Pierwsze
- Ostatnie
- Odchylenie standardowe
- Średnia
- Średnia
- Kolumna pochodna
- Trim
- Upper
- Niższa
- Zaawansowany
Tworzenie potoku
Po zakończeniu przekształceń danych mapy wybierz przycisk Utwórz potok, aby wygenerować przepływ mapowania danych i potok w celu debugowania i uruchamiania transformacji.