تصنيف بياناتك

مكتمل

تمتلك شركة البيع بالتجزئة عبر الإنترنت أنواعًا مختلفة من البيانات. وقد يستفيد كل نوع من البيانات من الحلول المختلفة للتخزين.

يمكن تصنيف بيانات التطبيق بإحدى الطرق الثلاث التالية: منظّمة البنية، وشبه منظّمة البنية، وغير منظّمة البنية. هنا، ستتعرّف على كيفية تصنيف بياناتك بحيث يمكنك اختيار حل التخزين المناسب لنوع البيانات.

طرق لتخزين البيانات في السحابة

يقدم الفيديو التالي خياراتك لتخزين البيانات في السحابة:

البيانات الهيكلية

في البيانات المنظمة، تسمى أحيانًا البيانات الارتباطية، تحتوي جميع البيانات على نفس الحقول أو الخصائص. تحتوي جميع البيانات على نفس التنظيم والشكل أو المخطط. يسمح المخطط المشترك للبحث عن هذا النوع من البيانات بسهولة ويسر باستخدام لغات الاستعلام مثل لغة الاستعلام المركبة (SQL). تجعل هذه الإمكانية نمط البيانات هذا مثاليًا للتطبيقات مثل أنظمة CRM والحجوزات وإدارة المخزون.

يتم تخزين البيانات المنظمة غالبًا في جداول قاعدة البيانات مع الصفوف والأعمدة. في الجدول، يشير عمود المفتاح إلى كيفية ارتباط صف واحد في جدول بالبيانات الموجودة في صف آخر من جدول آخر. في الصورة التالية، يحصل الجدول الذي يحتوي على بيانات حول التقديرات على بيانات من جدول أسماء الطلاب وجدول بيانات الفصل باستخدام الأعمدة الرئيسية.

Diagram that shows two structured data tables and a relationship table that has data that ties them together.

تعتبر البيانات منظّمة البنية واضحة ومباشرة حيث يسهل إدخالها والاستعلام عنها وتحليلها. جميع البيانات بنفس التنسيق. ومع ذلك، فإن فرض بنية متسقة يعني أيضًا أن تطور البيانات أكثر صعوبة. إذا قمت بإضافة حقول البيانات أو إزالتها، يجب تحديث كل سجل ليتوافق مع البنية الجديدة.

بيانات شبه منظّمة البنية

البيانات شبه المنظمة أقل تنظيمًا من البيانات المنظمة. لا يتم تخزين البيانات شبه المنظمة بتنسيق ارتباطي لأن الحقول لا تتناسب بدقة مع الجداول والصفوف والأعمدة. تحتوي البيانات شبه منظّمة البنية على علامات توضح التنظيم والتسلسل الهرمي للبيانات. أحد الأمثلة على ذلك هو أزواج المفاتيح/القيم. كما يشار إلى البيانات شبه منظّمة البنية بأنها بيانات غير ارتباطية أو بيانات NoSQL.

يتم تعريف البيانات شبه المنظمة بواسطة لغة تسلسل البيانات. في تصنيف البيانات، إنشاء لغة التسلسل هو عملية تحويل البيانات إلى تنسيق يمكن إرساله أو تخزينه.

يستخدم مطوّري البرامج لغات تسلسل البيانات لكتابة البيانات المخزّنة في الذاكرة إلى إحدى الملفات، وإرسالها إلى نظام آخر، وتوزيعها وقراءتها. لا يحتاج المرسل والمتلقي إلى معرفة تفاصيل حول النظام الآخر. طالما يتم استخدام نفس لغة التسلسل، يمكن فهم البيانات بواسطة كلا النظامين.

لغات التسلسل الشائعة

ثلاث لغات تسلسل شائعة هي XML وJSON وYAML.

Xml

كانت لغة التمييز قابلة الامتداد (XML) واحدة من أولى لغات البيانات التي يتم استخدامها على نطاق واسع. حيث تستند XML إلى النص، ما يسهل قراءتها على الإنسان ويمكن قراءتها آليًا. تتوفر محللات XML لجميع منصات التطوير الشائعة تقريبًا.

يمكنك استخدام XML للتعبير عن العلاقات. تحتوي لغة XML على معايير للمخطط والتحويل وحتى العرض على الويب.

فيما يلي مثال لاسم شخص وعمره وهواياته يتم التعبير عنها في لغة XML:

<Person Age="23">
    <FirstName>Quinn</FirstName>
    <LastName>Anderson</LastName>
    <Hobbies>
        <Hobby Type="Sports">Golf</Hobby>
        <Hobby Type="Leisure">Reading</Hobby>
        <Hobby Type="Leisure">Guitar</Hobby>
   </Hobbies>
</Person>

يعبر XML عن شكل البيانات باستخدام العلامات التي تم تعريفها داخل أقواس الزاوية. تأتي هذه العلامات في شكلين: العناصر مثل <FirstName> و السمات التي يمكن التعبير عنها بنص يشبه Age="23". يمكن أن تحتوي العناصر على عناصر تابعة للتعبير عن العلاقات. على سبيل المثال، تعبر العلامة <Hobbies> عن مجموعة من عناصر Hobby.

تتسم لغة XML بالمرونة ويمكن أن تعبر عن البيانات المعقدة بسهولة. ومع ذلك، فإنها تميل إلى أن تتسم بالإسهاب والإطالة؛ ما يجعل تخزينها أو معالجتها أو تمريرها عبر الشبكة أكبر. ونتيجة لذلك، فقد أصبحت التنسيقات الأخرى أكثر شيوعًا.

Json

تتمتع لغة JavaScript Object Notation (JSON)، بمواصفات يسيرة وتعتمد على الأقواس المتعرجة للإشارة إلى بنية البيانات. بالمقارنة مع XML، فإن JSON أقل إسهابًا، ويسهل على البشر قراءتها. كثيرًا ما تستخدم خدمات الويب لغة JSON لإرجاع البيانات.

إليك نفس اسم الشخص وعمره وهواياته المعبر عنها في JSON:

{
    "firstName": "Quinn",
    "lastName": "Anderson",
    "age": "23",
    "hobbies": [
        { "type": "Sports", "value": "Golf" },
        { "type": "Leisure", "value": "Reading" },
        { "type": "Leisure", "value": "Guitar" }
    ]
}

تنسيق JSON ليس رسميًا مثل XML. إنه أقرب إلى نموذج زوج المفتاح/القيمة من تعبير بيانات رسمي. كما يمكنك أن تتصور من الاسم، فإن لغة البرمجة JavaScript تحتوي على دعم مُضمن لهذا التنسيق - ما يجعله أكثر شيوعًا لتطوير الويب. تحتوي اللغات الأخرى على موزّعات يمكنك استخدامها للعمل مع تنسيق البيانات هذا، وذلك تمامًا كما هو الحال بالنسبة إلى لغة XML. يتمثل الجانب السلبي للغة JSON في أنها تميل إلى أن تكون أكثر توجهًا للمبرمجين؛ ما يصعب على الأشخاص غير التقنيين قراءتها وإدخال تعديلات عليها.

YAML

لغة YAML ليست لغة تمييز (YAML) هي لغة تسلسل بيانات تم تطويرها مؤخرًا. تتمثل إحدى فوائد استخدام YAML في أنه يسهل على البشر القراءة أكثر من بعض اللغات الأخرى. يتم تعريف بنية البيانات عن طريق فصل الأسطر والمسافة البادئة. يقلل تنسيق YAML من التبعية على الأحرف الهيكلية مثل الأقواس والفواصل والأقواس المعقوفة.

فيما يلي نفس بيانات الشخص التي جرى التعبير عنها في لغة YAML:

firstName: Quinn
lastName: Anderson
age: 23
hobbies:
    - type: Sports
      value: Golf
    - type: Leisure
      value: Reading
    - type: Leisure
      value: Guitar

يعد هذا التنسيق أيسر في القراءة وأكثر وضوحًا وذلك لما عليه الحال بالنسبة إلى لغة JSON، وغالبًا ما يُستخدم هذا التنسيق لملفات التكوين التي يلزم كتابتها من خلال الأشخاص ولكن يتم تحليلها من خلال البرامج. YAML هو الأحدث من تنسيقات البيانات هذه.

ما البيانات شبه المنظمة؟

يصف الفيديو التالي البيانات شبه المنظمة وخيارات تخزين بيانات NoSQL:

البيانات غير المنظّمة

تنظيم البيانات غير المنظمة غير محدد. غالبًا ما يتم تسليم البيانات غير المنظمة بتنسيق ملف، كما هو الحال في ملفات الصور أو الفيديو. قد يحتوي ملف الفيديو نفسه على بنية شاملة ويأتي مع بيانات تعريفية شبه منظّمة البنية، إلا أن البيانات التي يتكون منها مقطع الفيديو نفسه غير منظّمة البنية. لذلك، تُصنّف الصور ومقاطع الفيديو وغيرها من الملفات المماثلة الأخرى بأنها بيانات غير منظّمة.

فيما يلي أمثلة على البيانات غير منظّمة البنية:

  • ملفات الوسائط، مثل الصور ومقاطع الفيديو والملفات الصوتية
  • ملفات Microsoft 365، مثل مستندات Word
  • ملفات نصية
  • ملفات السجل

تصنيف البيانات: تقييم أنواع البيانات

يمكنك تصنيف البيانات بإحدى الطرق الثلاث: منظّمة البنية، وشبه منظّمة البنية، وغير منظّمة البنية. سيساعدك فهم أوجه الاختلاف بحيث يمكنك تصنيف بياناتك على اختيار الحل الصحيح لعملية التخزين.

البيانات المنظمة هي بيانات منظمة تناسب جداول البيانات أو أعمدتها بدقة. لا تزال البيانات شبه منظّمة البنية منظّمة تنظيمًا جيدًا وتتسم بخصائص وقيم واضحة، فإن هناك تنوعًا في البيانات. لا يتم احتواء البيانات غير المنظمة بدقة في الجداول أو الأعمدة، ولا تحتوي على مخطط موحد.

لنلق نظرة على مجموعات البيانات المستخدمة في أعمال البيع بالتجزئة عبر الإنترنت ونصنفها.

بيانات كتالوج المنتجات

بيانات كتالوج المنتجات لشركات البيع بالتجزئة عبر الإنترنت شبه منظمة في طبيعتها. يحتوي كل منتج على SKU للمنتج ووصف وكمية وسعر وخيارات الحجم وخيارات الألوان وصورة وربما مقطع فيديو. لذلك، تبدو هذه البيانات ارتباطية في البداية، لأنها كلها لها نفس البنية. ومع ذلك، عندما تطرح منتجات جديدة أو أنواعًا مختلفة من المنتجات، قد ترغب في إضافة حقول بيانات. على سبيل المثال، أحذية التنس الجديدة التي تصنعها تكون مزودة بتقنية «Bluetooth» لنقل بيانات المستشعر من الحذاء إلى تطبيق اللياقة البدنية على هاتف المستخدم. يبدو أن هذه الميزة توجّه متزايد، وتريد أن تمنح العملاء خيار التصفية على الأحذية "مزودة بتقنية Bluetooth". لا تريد تحديث جميع بيانات الحذاء الحالية بخاصية "مزودة بتقنية Bluetooth". تريد إضافة هذه الخاصية الجديدة فقط إلى الأحذية الجديدة.

وبفضل إضافة الخاصية "مزودة بتقنية Bluetooth"، لم تعد بيانات حذائك متجانسة. لقد أدخلت اختلافات في المخطط. إذا كان التغيير هذا هو الاستثناء الوحيد الذي تتوقع مواجهته، فإنه يمكنك إعادة البيانات مجددًا إلى حالتها الطبيعية بحيث تشتمل جميع المنتجات على حقل "مزود بتقنية Bluetooth" للحفاظ على تنظيم متماسك وارتباطي. ومع ذلك، إن لم يكن هذا الأمر سوى أحد مجالات التخصص المتعددة التي تتصور دعمها في المستقبل، فإن تصنيف البيانات يكون شبه منظّم البنية. تُنظّم البيانات حسب العلامات، ولكن يمكن أن يحتوي كل منتج في الكتالوج على حقول فريدة.

تصنيف بيانات كتالوج المنتج شبه منظم.

الصور ومقاطع الفيديو

تعد الصور ومقاطع الفيديو المعروضة على صفحات المنتج بيانات غير منظّمة البنية. على الرغم من أن ملف الوسائط قد يحتوي على بيانات التعريف، فإن نص ملف الوسائط غير منظّم البنية.

تصنيف البيانات للصور ومقاطع الفيديو غير منظم.

بيانات الأعمال

يرغب محللو الأعمال في تنفيذ المعلومات المهنية لإجراء تقييمات البنية الأساسية لبرنامج ربط العمليات التجارية الخاصة بالمخزون ومراجعات بيانات المبيعات. لإجراء هذه العمليات، يجب تجميع البيانات المأخوذة من عدة أشهر ثم الاستعلام عنها. وبسبب الحاجة إلى تجميع البيانات المتشابهة، يجب وضع هذه البيانات في إطار منظّم البنية بحيث يمكن مقارنة شهر واحد بالشهر التالي.

تصنيف بيانات الأعمال منظم.

‏‫اختبر معلوماتك

1.

ما نوع البيانات التي يمثلها ملف JSON؟

2.

ما نوع البيانات التي يمثلها الفيديو؟