ביצוע הנדסת נתונים באמצעות Azure Synapse Apache Spark Pools

intermediate
data-engineer
azure-synapse-analytics

במבט מהיר

Apache Spark הוא פתרון עיבוד מבוזרת מדרגי ביותר עבור ניתוח נתונים גדול ושינוי. באפשרותך לנצל את העוצמה שלו ב- Azure Synapse Analytics באמצעות מאגרי Spark.

דרישות מוקדמות

לפני שתתחיל בנתיב למידה זה, עליך להכיר את Azure Synapse Analytics. שקול להשלים תחילה את מבוא ל- Azure Synapse Analytics המודול.

מודולים בנתיב למידה זה

Apache Spark היא טכנולוגיית ליבה לניתוח נתונים בקנה מידה גדול. למד כיצד להשתמש ב- Spark ב- Azure Synapse Analytics כדי לנתח ולהמחיש נתונים באגם נתונים.

מהנדסי נתונים בדרך כלל צריכים להמיר כמויות גדולות של נתונים. בריכות Apache Spark ב- Azure Synapse Analytics מספקות פלטפורמת עיבוד מבוזר שבה הם יכולים להשתמש כדי להשיג מטרה זו.

Delta Lake הוא אזור אחסון יחסי של קוד פתוח עבור Spark שניתן להשתמש בו כדי ליישם ארכיטקטורת אגם נתונים ב- Azure Synapse Analytics.