Przekształcanie danych za pomocą platformy Spark w usłudze Azure Synapse Analytics

Średni
Inżynier danych
Azure Synapse Analytics

Inżynierowie danych często muszą przekształcać duże ilości danych. Pule platformy Apache Spark w usłudze Azure Synapse Analytics zapewniają rozproszoną platformę przetwarzania, której mogą użyć do osiągnięcia tego celu.

Cele szkolenia

W tym module dowiesz się, jak wykonywać następujące czynności:

  • Modyfikowanie i zapisywanie ramek danych przy użyciu platformy Apache Spark
  • Partycjonowanie plików danych w celu zwiększenia wydajności i skalowalności.
  • Przekształcanie danych przy użyciu języka SQL

Wymagania wstępne

Przed rozpoczęciem pracy z tym modułem należy zapoznać się z pulami platformy Apache Spark w usłudze Azure Synapse Analytics. Najpierw rozważ ukończenie modułu Analyze data with Apache Spark in Azure Synapse Analytics (Analizowanie danych za pomocą platformy Apache Spark w usłudze Azure Synapse Analytics ).