Adatfeldolgozás az Azure Databricksszel
Megtanulhatja, hogyan hasznosíthatja az Apache Spark és az Azure Databricks platformján futó fürtök hatékonyságát ahhoz, hogy nagy méretű adatfeldolgozási számítási feladatokat futtasson a felhőben.
Előfeltételek
None
A képzési terv moduljai
Az Azure Databricks egy felhőszolgáltatás, amely skálázható platformot biztosít az Apache Spark használatával végzett adatelemzéshez.
Az Azure Databricks az Apache Sparkra épül, és lehetővé teszi az adatmérnökök és elemzők számára, hogy Spark-feladatokat futtasson az adatok nagy léptékű átalakításához, elemzéséhez és vizualizációjához.
A Delta Lake egy nyílt forráskód relációs tárolóterület a Spark számára, amellyel data lakehouse-architektúrát implementálhat az Azure Databricksben.
Az Azure Databricks olyan SQL Warehouse-t biztosít, amely lehetővé teszi az adatelemzők számára, hogy ismerős relációs SQL-lekérdezések használatával dolgozzanak az adatokkal.
Az Azure Data Factoryben futó folyamatok használatával jegyzetfüzeteket futtathat az Azure Databricksben, így felhőszinten automatizálhatja az adatelemzési folyamatokat.