הצג נתונים באופן חזותי
מדעני נתונים ממחישים נתונים באופן חזותי כדי להבין אותם טוב יותר. הם עשויים לסרוק את הנתונים הגולמיים, לבחון אמצעי סיכום כגון ממוצעים או גרף של הנתונים. גרפים הם אמצעי רב-עוצמה להמחשה חזותית של נתונים, ומדעני נתונים משתמשים לעתים קרובות בגרף כדי להבחין במהירות בדפוסים מורכבים בינוניים.
מייצג נתונים באופן חזותי
יצירת גרפים מתבצעת כדי לספק הערכה איכותית מהירה של הנתונים שלנו, שעשויה להיות שימושית להבנת התוצאות, איתור ערכים חריגים יותר, בחינת אופן ההפצה של מספרים וכן הלאה.
בעוד שלפעמים אנו יודעים מראש איזה סוג גרף יהיה שימושי ביותר, במקרים אחרים אנו משתמשים בגרף בדרך גישוש. כדי להבין את העוצמה של תצוגה חזותית של נתונים, שקול את הנתונים הבאים: המיקום (x,y) של מכונית בנהיגה עצמית. בצורת הנתונים הגולמיים, קשה לראות דפוסים אמיתיים. הממוצע או הממוצע מודיעים לנו שנתיב המכונית הורכב מסביב ל- x=0.2 ו- y=0.3, וטווח המספרים נראה בין -2 ל- 2.
| זמן | Location-X | Location-Y |
|---|---|---|
| 0 | 0 | 2 |
| 1 | 1.682942 | 1.080605 |
| 2 | 1.818595 | -0.83229 |
| 3 | 0.28224 | -1.97998 |
| 4 | -1.5136 | -1.30729 |
| 5 | -1.91785 | 0.567324 |
| 6 | -0.55883 | 1.920341 |
| 7 | 1.313973 | 1.507805 |
| 12 | 0.00001 | 0.00001 |
| 13 | 0.840334 | 1.814894 |
| 14 | 1.981215 | 0.273474 |
| 15 | 1.300576 | -1.51938 |
| 16 | -0.57581 | -1.91532 |
| 17 | -1.92279 | -0.55033 |
| 18 | -1.50197 | 1.320633 |
| 19 | 0.299754 | 1.977409 |
| 20 | 1.825891 | 0.816164 |
אם כעת נתווה Location-X זמן, נראה שחסרים לנו ערכים בין השעות 7 ל- 12.
אם אנחנו גרפים X לעומת Y, אנחנו בסופו של דבר עם מפה של איפה המכונית מונעת. זה ברור באופן מיידי שהמכונית נהגה במעגל ובנקודה מסוימת נסעה למרכז העיגול.
גרפים אינם מוגבלים להתוות פיזור דו-ממדי כמו אלה שלעיל. הם יכולים לשמש כדי לחקור היבטים אחרים של הנתונים שלך; לדוגמה, פרופורציות (תרשימי עוגה וגרפי עמודות מוערמות) ואופן התפשטות הנתונים (היסטוגרמות ותרשימי קופסאות). לעתים קרובות, כאשר אנו מנסים להבין נתונים גולמיים או תוצאות גולמיים, אנו עשויים להתנסות בסוגים שונים של גרפים עד שנית נתקל בתרשים שמסביר את הנתונים באופן אינטואיטיבי מבחינה חזותית.