זיהוי תבניות נתונים

הושלם

נתונים הם אוסף של עובדות כגון מספרים, תיאורים ותצפיות המשמשים לתיעד מידע. מבני נתונים שבהם נתונים אלה מאורגנים לעתים קרובות מייצגים ישויות החשובות לארגון (כגון לקוחות, מוצרים, הזמנות מכירה וכן הלאה). לכל ישות יש בדרך כלל תכונה אחת או יותר, או מאפיינים (לדוגמה, ייתכן שללקוח יש שם, כתובת, מספר טלפון וכן הלאה).

באפשרותך לסווג נתונים כמובנים, מובנים למחצה או לא מובנים.

נתונים מובנים

נתונים מובנים הם נתונים המצייתים סכימה קבועה, כך שכל הנתונים מכילים את אותם שדות או מאפיינים. בדרך כלל, הסכימה עבור ישויות נתונים מובנות היא טבלאית - במילים אחרות, הנתונים מיוצגים בטבלה אחת או יותר המורכבת משורות כדי לייצג כל מופע של ישות נתונים, ועמודות המייצגות תכונות של הישות. לדוגמה, התמונה הבאה מציגה ייצוגי נתונים טבלאיים עבור ישויות שללקוחות ומוצרים.

דיאגרמה המציגה כיצד נתונים מובנים מיוצגים בטבלאות.

נתונים מובנים מאוחסנים לעתים קרובות במסד נתונים שבו טבלאות מרובות יכולות להפנות זו אל זו באמצעות ערכי מפתח במודל יחסי; שנחקור לעומק מאוחר יותר.

נתונים מובנים למחצה

נתונים מובנים למחצה הם מידע בעל מבנה למחצה, אך מאפשר וריאציה מסוימת בין מופעי ישות. לדוגמה, בעוד שלרב הלקוחות עשויה להיות כתובת דואר אלקטרוני, ייתכן שללקוחות מסוימים יש כתובות דואר אלקטרוני מרובות, וללקוחות מסוימים אין כתובות כלל.

תבנית נפוצה אחת עבור נתונים מובנים למחצה היא סמל אובייקט JavaScript (JSON). הדוגמה שלהלן מציגה זוג מסמכי JSON המייצגים פרטי לקוחות. כל מסמך לקוח כולל כתובת ופרטי קשר, אך השדות הספציפיים משתנים בין הלקוחות.

// Customer 1
{
  "firstName": "Joe",
  "lastName": "Jones",
  "address":
  {
    "streetAddress": "1 Main St.",
    "city": "New York",
    "state": "NY",
    "postalCode": "10099"
  },
  "contact":
  [
    {
      "type": "home",
      "number": "555 123-1234"
    },
    {
      "type": "email",
      "address": "joe@litware.com"
    }
  ]
}

// Customer 2
{
  "firstName": "Samir",
  "lastName": "Nadoy",
  "address":
  {
    "streetAddress": "123 Elm Pl.",
    "unit": "500",
    "city": "Seattle",
    "state": "WA",
    "postalCode": "98999"
  },
  "contact":
  [
    {
      "type": "email",
      "address": "samir@northwind.com"
    }
  ]
}

הערה

JSON הוא רק אחת מהדרכים הרבות שבהן ניתן לייצג נתונים מובנים למחצה. הנקודה כאן אינה לספק בדיקה מפורטת של תחביר JSON, אלא להמחיש את האופי הגמיש של ייצוגי נתונים מובנים למחצה.

נתונים לא ברורים

לא כל הנתונים מובנים או אפילו מובנים למחצה. לדוגמה, ייתכן שלמסמכים, תמונות, נתוני שמע ווידאו וקבצים בינאריים אין מבנה ספציפי. נתונים מסוג זה נקראים נתונים לא ברורים .

דיאגרמה המציגה נתונים לא  ברורים במסמכים.

מאגרי נתונים

ארגונים מאחסנים בדרך כלל נתונים בתבנית מובנית, מובנית למחצה או לא מובנים כדי לתעד פרטים של ישויות (לדוגמה, לקוחות ומוצרים), אירועים ספציפיים (כגון עסקאות מכירה) או מידע אחר במסמכים, בתמונות ובתבניות אחרות. לאחר מכן ניתן לאחזר את הנתונים המאוחסנים לצורך ניתוח ודיווח במועד מאוחר יותר.

קיימות שתי קטגוריות רחבות של מאגר נתונים בשימוש נפוץ:

  • מאגרי קבצים
  • מסדי נתונים

אנו נחקור את שני סוגי מאגר הנתונים הללו בנושאים הבאים.