נהל מקורות נתונים
עבור אל נתונים>מקורות נתונים כדי להציג את השם של כל מקור נתונים שעובד, את הסטטוס שלו ואת הפעם האחרונה שהנתונים רועננו עבור מקור זה. אתה יכול למיין את רשימת מקורות הנתונים לפי כל עמודה או להשתמש בתיבת החיפוש כדי למצוא את מקור הנתונים שברצונך לנהל.
בחר מקור נתונים כדי להציג פעולות זמינות.
- ערוך את מקור הנתונים כדי לשנות את המאפיינים שלו. לא ניתן לערוך קובץ CSV אחד מקור נתונים ששימש ליצירת תובנות אוטומטית.
- רענן את מקור הנתונים כדי לכלול את הנתונים העדכניים ביותר.
- העשר את מקור הנתונים לפני האיחוד כדי לשפר את האיכות והשלמות לקבלת תוצאות טובות יותר.
- מחק את מקור הנתונים. מקור נתונים ניתן למחוק רק אם הנתונים אינם משמשים בעיבוד כלשהו כגון איחוד, תובנות, הפעלות או ייצוא.
אם יש לך מקור נתונים קיים של Azure Data Lake עם טבלאות Common Data Model, אתה יכול לעדכן אותם לשימוש בטבלאות Delta.
רענון מקורות נתונים
ניתן לרענן את מקורות הנתונים בלוח זמנים אוטומטי או לרענן אותם באופן ידני לפי דרישה. רק הבעלים יכול לרענן ידנית מקור נתונים מקומי.
עבור מקורות נתונים מצורפים, עבוד נתונים צורכת את הנתונים העדכניים ביותר הזמינים מאותו מקור נתונים.
עבור אל הגדרות>מערכת>לוח זמנים כדי להגדיר רענון שתוזמן על ידי המערכת של מקורות הנתונים המעובדים שלך.
כדי לרענן מקור נתונים לפי דרישה:
עבור אל נתונים>מקורות נתונים.
בחר את מקור הנתונים שברצונך לרענן ובחר רענן. מקור הנתונים מופעל כעת עבור רענון ידני. רענון מקור נתונים מעדכן גם את סכימת הטבלה וגם את הנתונים עבור כל הטבלאות שצוינו במקור הנתונים.
בחר את המצב כדי לפתוח את החלונית פרטי התקדמות והצג את ההתקדמות. כדי לבטל את המשימה, בחר בטל את המשימה בחלק התחתון של החלונית.
בדיקת מקורות נתונים פגומים
הנתונים הנקלטים עשויים לכלול רשומות פגומות שעלולות לגרום לתהליך קליטת הנתונים להסתיים בשגיאות או אזהרות.
הערה
אם קליטת הנתונים תסתיים עם שגיאות, המערכת תלדל על עיבוד עוקב (כגון איחוד או יצירת פעילות) הממנף את מקור נתונים זה. אם קליטת הנתונים הושלמה עם אזהרות, העיבוד שלאחר מכן נמשך אך ייתכן שחלק מהרשומות לא ייכללו.
ניתן לראות שגיאות אלו בפרטי המשימה.
רשומות פגומות מוצגות בטבלאות שנוצרו על-ידי מערכת.
תיקון נתונים פגומים
כדי להציג נתונים פגומים, עבור אל נתונים>טבלאות וחפש את הטבלאות הפגומות במקטע מערכת. סכימת מתן השמות של טבלאות פגומות: 'DataSourceName_tableName_corrupt'.
בחר טבלה פגומה ואז את הכרטיסיה נתונים.
זהה את השדות הפגומים ברשומה ואת הסיבה.
הערה
נתונים>טבלאות הצג רק חלק מהרשומות הפגומות. כדי להציג את כל הרשומות הפגומות, ייצא את הקבצים לגורם מכיל בחשבון האחסון באמצעות תהליך הייצוא. אם השתמשת בחשבון אחסון משלך, תוכל גם לעיין בתיקיית Customer Insights בחשבון האחסון שלך.
תקן את הנתונים הפגומים. לדוגמה, עבור מקורות נתונים של Azure Data Lake, תקן את הנתונים ב-Data Lake Storage או עדכן את סוגי הנתונים בקובץ manifest/model.json. עבור מקורות נתונים של Power Query, תקן את הנתונים בקובץ המקור ותקן את סוג הנתונים את שלב ההמרה בדף Power Query - עריכת שאילתות.
לאחר הרענון הבא של מקור הנתונים, הרשומות המתוקנות נקלטות ל- Customer Insights - Data ומועברות לתהליכים במורד הזרם.
לדוגמה, בעמודת 'יום הולדת' סוג הנתונים מוגדר כ'תאריך'. ברשומה של לקוח הוזן תאריך יום ההולדת '01/01/19777 '. המערכת תסמן את הרשומה הזו כפגומה. שנה את יום ההולדת במערכת המקור ל- '1977'. לאחר רענון אוטומטי של מקורות נתונים, לשדה יש כעת תבנית חוקית והרשומה תוסר מהטלבה הפגומה.