שימוש ב- Apache Spark ב- Azure Databricks
ביניים
מהנדס נתונים
Azure Databricks
Azure Databricks בנוי על Apache Spark ומאפשר למהנדסי נתונים ולאנליסטים להפעיל משימות Spark כדי להמיר, לנתח ולהמחיש נתונים בקנה מידה גדול.
מטרות הלמידה
במודול זה, תלמד כיצד:
- תאר רכיבים עיקריים של ארכיטקטורת Apache Spark.
- צור וקבע תצורה של אשכול Spark.
- תאר מקרי שימוש עבור Spark.
- השתמש ב- Spark כדי לעבד ולנתח נתונים המאוחסנים בקבצים.
- השתמש ב- Spark כדי להציג נתונים באופן חזותי.
דרישות מוקדמות
לפני שתתחיל במודול זה, אמור להיות לך ידע בסיסי של Azure Databricks. שקול להשלים את מודול 'סייר ב- Azure Databricks ' לפני מודול זה.