Przekształcanie danych Azure Synapse Link for Dataverse przy użyciu Apache Spark
Artykuł
Użyj narzędzia Azure Synapse Link do łączenia danych Microsoft Dataverse z Azure Synapse Analytics, aby poznać dane i szybciej z nich korzystać. W tym artykule pokazano, jak przekształcić dane Dataverse za pomocą aparatu Apache Spark dostępnego w obszarze roboczym Synapse.
Uwaga
Azure Synapse Link for Microsoft Dataverse, wcześniej znane jako Eksportowanie do data lake. Nazwa usługi została zmieniona w maja 2021 r. i nadal będzie eksportować dane do Azure Data Lake oraz Azure Synapse Analytics.
Wymagania wstępne
W tej sekcji opisano wymagania wstępne niezbędne do przekształcania danych Dataverse z Apache Spark przy użyciu Azure Synapse Link for Dataverse.
Azure Synapse Link for Dataverse. : przyjęto założenie, że dane Dataverse zostały już wyeksportowane za pomocą Azure Synapse Link for Dataverse.
Dostęp do konta magazynu. Musisz posiadać rolę Właściciel, Współautor konta magazynu, Współautor danych obiektu blob magazynu lub Właściciel danych obiektu blob magazynu na koncie magazynu:
Administrator Synapse. Należy przyznać mu dostęp do roli Administrator Synapse też w programie Synapse też.
Przekształcanie danych przy użyciu notesu Apache Spark
W Power Apps wybierz żądane łącze Azure Synapse Link z listy, a następnie wybierz Przejdź do obszaru roboczego Azure Synapse workspace.
Rozwiń bazy danych, wybierz kontener Dataverse. Wyeksportowane tabele są wyświetlane w katalogu Tabele na lewym pasku bocznym.
Kliknij prawym przyciskiem myszy żądaną tabelę i wybierz polecenie Nowy notatnik > Załaduj do DataFrame.
Dołącz notes do puli zadań platformy Apache Spark, wybierając pulę z menu rozwijanego. Jeśli nie masz puli zadań platformy Apache Spark, wybierz Zarządzaj pulami, aby ją utworzyć.
Dodanie komórek kodu w celu przekształcenia danych. Uruchom poszczególne komórki, wybierając przycisk odtwarzania po lewej stronie każdej komórki, lub uruchom kolejno wszystkie komórki, wybierając Uruchom wszystko na górnym pasku.
Omówienie typowych zadań inżynierii danych w celu implementowania obciążeń inżynieryjnych danych i zarządzania nimi na platformie Microsoft Azure przy użyciu wielu usług platformy Azure.
Dowiedz się, jak kwerendować i analizować aktualizacje dynamiczne Microsoft Dataverse wprowadzone do danych w określonych odstępach czasu z Power Apps i Azure Synapse Analytics