تحديد تنسيقات البيانات
البيانات عبارة عن مجموعة حقائق مثل الأرقام والأوصاف والملاحظات المستخدمة لتسجيل المعلومات. غالبا ما تمثل بنيات البيانات التي يتم تنظيم هذه البيانات فيها الكيانات المهمة للمؤسسة (مثل العملاء والمنتجات وأوامر المبيعات وما إلى ذلك). يحتوي كل كيان عادة على سمة واحدة أو أكثر، أو على خصائص (على سبيل المثال، قد يكون لدى العميل اسم وعنوان ورقم هاتف وما إلى ذلك).
يمكنك تصنيف البيانات على أنها منظمة أو شبه منظمة أو غير منظمة.
البيانات الهيكلية
البيانات المنظمة هي البيانات التي تلتزم مخطط ثابت، لذلك كل البيانات لديها نفس الحقول أو الخصائص. في الغالب، مخطط كيانات البيانات المنظمة يكون جدولي - بمعنى آخر، تُمثل البيانات في جدول واحد أو أكثر يتكون من صفوف لتمثيل كل مثيل لكيان البيانات، وأعمدة لتمثيل سمات الكيان. على سبيل المثال، تعرض الصورة التالية تمثيلات بيانات جدولية لكيانات العميل والمنتج.
غالبا ما تُخزن البيانات المنظمة في قاعدة بيانات حيث يمكن لجداول متعددة الرجوع إلى بعضها باستخدام قيم المفاتيح في نموذج ارتباطي؛ وهو ما سنتعمق في استكشافه لاحقًا.
بيانات شبه منظّمة البنية
البيانات شبه المنظمة هي معلومات لها بعض البنية، ولكنها تسمح ببعض التباين بين مثيلات الكيان. على سبيل المثال، في حين أن معظم العملاء قد يكون لديهم عنوان بريد إلكتروني، قد يكون لدى بعضهم عِدة عناوين بريد إلكتروني، وقد لا يمتلك البعض أي عنوان مُطلقًا.
أحد التنسيقات الشائعة للبيانات شبه المنظمة هو JavaScript Object Notation (JSON). يعرض المثال أدناه زوجًا من مستندات JSON التي تمثل معلومات العميل. يتضمن كل مستند عميل العنوان ومعلومات جهة الاتصال، ولكن تختلف الحقول المحددة بين العملاء.
// Customer 1
{
"firstName": "Joe",
"lastName": "Jones",
"address":
{
"streetAddress": "1 Main St.",
"city": "New York",
"state": "NY",
"postalCode": "10099"
},
"contact":
[
{
"type": "home",
"number": "555 123-1234"
},
{
"type": "email",
"address": "joe@litware.com"
}
]
}
// Customer 2
{
"firstName": "Samir",
"lastName": "Nadoy",
"address":
{
"streetAddress": "123 Elm Pl.",
"unit": "500",
"city": "Seattle",
"state": "WA",
"postalCode": "98999"
},
"contact":
[
{
"type": "email",
"address": "samir@northwind.com"
}
]
}
إشعار
JSON هو أحد الطرق التي يمكن من خلالها تمثيل البيانات شبه المنظمة من بين عِدة طرق. الهدف هنا ليس تقديم فحص تفصيلي لبناء جملة JSON، بل لتوضيح الطبيعة المرنة لتمثيلات البيانات شبه المنظمة.
البيانات غير المنظّمة
ليست كل البيانات منظمة أو شبه منظمة. على سبيل المثال، قد لا يكون للمستندات والصور وبيانات الصوت والفيديو والملفات الثنائية بنية معينة. يشار إلى هذا النوع من البيانات على أنه بيانات غير منظمة.
تعمل المؤسسات أيضا بشكل متزايد مع البيانات المتجهة (المعروفة أيضا بالتضمينات)—وهو نوع البيانات الذي يمكن مساعدي الذكاء الاصطناعي من الإجابة على الأسئلة عبر مستنداتك وبياناتك.
مخازن البيانات
تخزن المؤسسات البيانات عادة بتنسيق منظم أو شبه منظم أو غير منظم لتسجيل تفاصيل الكيانات (على سبيل المثال العملاء والمنتجات) أو أحداث محددة (مثل عمليات البيع) أو معلومات أخرى في المستندات والصور والتنسيقات الأخرى. يمكن بعد ذلك استرداد البيانات المُخزنة لتحليلها وإعداد التقارير عنها لاحقًا.
هناك فئتان رئيسيتان لمخزن البيانات في الاستخدام الشائع:
- مخازن الملفات
- قواعد البيانات
سنستكشف كلا نوعيّ تخزين البيانات في الموضوعات اللاحقة.