הצג נתונים באופן חזותי

הושלם

מדעני נתונים ממחישים נתונים באופן חזותי כדי להבין אותם טוב יותר. הם עשויים לסרוק את הנתונים הגולמיים, לבחון אמצעי סיכום כגון ממוצעים או גרף של הנתונים. גרפים הם אמצעי רב-עוצמה להמחשה חזותית של נתונים, ומדעני נתונים משתמשים לעתים קרובות בגרף כדי להבחין במהירות בדפוסים מורכבים בינוניים.

מייצג נתונים באופן חזותי

יצירת גרפים מתבצעת כדי לספק הערכה איכותית מהירה של הנתונים שלנו, שעשויה להיות שימושית להבנת התוצאות, איתור ערכים חריגים יותר, בחינת אופן ההפצה של מספרים וכן הלאה.

בעוד שלפעמים אנו יודעים מראש איזה סוג גרף יהיה שימושי ביותר, במקרים אחרים אנו משתמשים בגרף בדרך גישוש. כדי להבין את העוצמה של תצוגה חזותית של נתונים, שקול את הנתונים הבאים: המיקום (x,y) של מכונית בנהיגה עצמית. בצורת הנתונים הגולמיים, קשה לראות דפוסים אמיתיים. הממוצע או הממוצע מודיעים לנו שנתיב המכונית הורכב מסביב ל- x=0.2 ו- y=0.3, וטווח המספרים נראה בין -2 ל- 2.

זמן Location-X Location-Y
0 0 2
1 1.682942 1.080605
2 1.818595 -0.83229
3 0.28224 -1.97998
4 -1.5136 -1.30729
5 -1.91785 0.567324
6 -0.55883 1.920341
7 1.313973 1.507805
12 0.00001 0.00001
13 0.840334 1.814894
14 1.981215 0.273474
15 1.300576 -1.51938
16 -0.57581 -1.91532
17 -1.92279 -0.55033
18 -1.50197 1.320633
19 0.299754 1.977409
20 1.825891 0.816164

אם כעת נתווה Location-X זמן, נראה שחסרים לנו ערכים בין השעות 7 ל- 12.

גרף של Location-X קואורדינטות המותווים מול הזמן.

אם אנחנו גרפים X לעומת Y, אנחנו בסופו של דבר עם מפה של איפה המכונית מונעת. זה ברור באופן מיידי שהמכונית נהגה במעגל ובנקודה מסוימת נסעה למרכז העיגול.

גרף של Location-X ו- Location-Y מקואורדינטות.

גרפים אינם מוגבלים להתוות פיזור דו-ממדי כמו אלה שלעיל. הם יכולים לשמש כדי לחקור היבטים אחרים של הנתונים שלך; לדוגמה, פרופורציות (תרשימי עוגה וגרפי עמודות מוערמות) ואופן התפשטות הנתונים (היסטוגרמות ותרשימי קופסאות). לעתים קרובות, כאשר אנו מנסים להבין נתונים גולמיים או תוצאות גולמיים, אנו עשויים להתנסות בסוגים שונים של גרפים עד שנית נתקל בתרשים שמסביר את הנתונים באופן אינטואיטיבי מבחינה חזותית.