תרגיל - שימוש בנתונים ערבול של Azure Data Factory

הושלם

התכונה Power Query בתוך Azure Data Factory מאפשרת לך לעבוד עם נתונים ולסדר אותם. זהו אובייקט שניתן להוסיף למעצב בד הציור כפעילות בצינור Azure Data Factory כדי לבצע הכנת נתונים ללא קוד. היא מאפשרת לאנשים שאינם מתכנסים עם טכנולוגיות הכנת הנתונים המסורתיות, כגון Spark או SQL Server, ושפות כגון Python ו- T-SQL להכנת נתונים בקנה מידה איטרבי בענן.

התכונה Power Query משתמשת בממשק סוג רשת להכנת נתונים בסיסית, בדומה לאתטיקה של Excel, המכונה 'עורך Mashup מקוון'. העורך גם מאפשר למשתמשים מתקדמים יותר לבצע הכנת נתונים מורכבת יותר באמצעות נוסחאות. תחילה עליך ליצור שירות מקושר למקור הנתונים לפני שתוכל לגשת לנתונים

עורך Mashup מקוון

הנוסחאות פועלות עם Power Query Online והופכת את הפונקציות M של Power Query לזמינים עבור משתמשי מפעל נתונים. לאחר מכן, Power Query מתרגם את שפת M שנוצרה על-ידי Online Mashup Editor לקוד זעיר לביצוע קנה מידה של ענן.

יכולת זו מאפשרת למהנדסי נתונים ולאנליסטים של נתונים לחקור ולהכין ערכות נתונים באופן אינטראקטיבי. בנוסף, הם יכולים לעבוד באופן אינטראקטיבי עם שפת M ולעיין בתוצאה בתצוגה מקדימה לפני הצגתה בהקשר של קו צינור רחב יותר.

כדי להוסיף פעילות Power Query ב- Azure Data Factory, לחץ על סמל החיבור ובחר Power Query בחלונית משאבי היצרן.

יצירת פעילות של Power Query

הוסף ערכת נתונים של מקור עבור זרימת הנתונים הזורם ובחר ערכת נתונים של כיור. מקורות הנתונים הבאים נתמכים.

מחבר תבנית נתונים סוג אימות
אחסון Azure Blob CSV, פרקט מפתח חשבון
Azure Data Lake Storage Gen1 CSV מנהל שירות
Azure Data Lake Storage Gen2 CSV, פרקט מפתח חשבון, מנהל שירות
Azure SQL Database אימות SQL
Azure Synapse Analytics אימות SQL

לאחר שבחרת מקור, לחץ על צור.

הוספת ערכות נתונים של מקור לזרימת נתונים חוצה

פעולה זו פותחת את עורך Mashup המקוון.

ניווט בזרימת הנתונים המסובבת

הוא מורכב מהרכיבים הבאים:

  1. רשימת ערכת נתונים.

    פעולה זו תספק את ערכות הנתונים שהוגדרו כמקור עבור שילוב הנתונים.

  2. סרגל הכלים של הפונקציה Wrangling.

    סרגל הכלים מכיל מגוון של פונקציות ערבול נתונים שהמשתמש יכול לגשת אליו כדי לטפל בנתונים, כולל:

    • ניהול עמודות.
    • ממיר טבלאות.
    • צמצום שורות.
    • מוסיף עמודות.
    • שילוב טבלאות.

    כל פריט הוא תלוי-הקשר והוא מכיל פונקציות משנה ספציפיות לו.

  3. כותרות עמודות.

    כמו גם את היכולת לשנות את שמות העמודות, לחיצה באמצעות לחצן העכבר הימני על העמודה תציג פריטים תלויי-הקשר לניהול עמודות.

  4. הגדרות.

    פעולה זו מאפשרת לך להוסיף או לערוך מקורות נתונים ושוורי נתונים ולשנות את ההגדרה עבור משימת הנתונים המשתתפת.

  5. חלון שלבים.

    חלון זה מציג את השלבים שהוחלו על פלט ה- Wrangling. בדוגמה בגרפיקה, השלב בשם "מקור" הוחל על פלט Wrangling בשם "UserQuery".

  6. רשימת פלט של Power Query.

    פירוט הפלט של ערבול הנתונים שהוגדר.

  7. לחצן 'פרסם'.

    מאפשר לך לפרסם את העבודה שנוצרה.

ניתן להוסיף משימה של Power Query במעצב בד הציור בדיוק כמו משימת העתקת פעילות, או משימה של מיפוי זרימת נתונים, ובאפשרותך לנהל ולנטר אותה באותו אופן.

משלים את זרימת הנתונים הזורמת