فهم أنواع البيانات وتخزينها

مكتمل

يعد فهم كيفية تنظيم البيانات وتخزينها خطوة أساسية تحدث في بداية كل مشروع تحليلي، أثناء جمع المتطلبات. كل من البيانات المنظمة وغير المنظمة مناسبة للتحليل، ولكن الأدوات التي سيستخدمها فريق البيانات لاستيعاب البيانات وتحويلها وتخزينها ستختلف وفقاً لنوع البيانات.

البيانات الهيكلية

البيانات المنظمة مألوفة لمعظمنا. يتم تنظيم الحروف والأرقام في أعمدة وصفوف للبحث والمعالجة المبسطة. عادة ما تكون البيانات المنظمة كمية بطبيعتها ويتم تخزينها في قواعد بيانات ارتباطية ومستودعات بيانات. قد توجد البيانات المنظمة في شيء مألوف، مثل جدول Microsoft Excel. قد يُخزن تخزين البيانات المنظمة على نطاق أوسع في قاعدة بيانات ارتباطية، مثل قاعدة بيانات Azure SQL.

توفر البيانات المنظمة خدمة جيدة لجميع أنواع التحليلات وهي الأكثر سهولة من حيث الوصول إليها. تُستخدم لغة الاستعلامات المركبة (SQL) للاستعلام عن قواعد البيانات الارتباطية وتُستخدم عادة من قبل محللي البيانات ومهندسي البيانات وعلماء البيانات على حد سواء.

Excel workbook annual financial report for Contoso, displaying summarized revenues, net profit, interes, depreciation, and operating profit. A table below key metrics displays metrics over time with a 5-year trend line.

يعد عرض البيانات المالية السنوية مثالاً شائعاً على استخدام البيانات المنظمة، سواء تم تخزين هذه البيانات في جداول بيانات Excel أو قاعدة بيانات ارتباطية مثل قاعدة بيانات Azure SQL.

البيانات غير المنظّمة

البيانات غير المنظمة هي معلومات غير منظمة بأي طريقة يمكن تمييزها. غالباً ما تكون البيانات غير المنظمة أكثر ملاءمة للتحليل النوعي ويتم تخزينها في قواعد بيانات غير ارتباطية ومستودعات بيانات.

تتنوع تنسيقات البيانات غير المنظمة بشكل كبير، بين مستندات Word وملفات .csv وملفات json والصور وملفات PDF وملفات الصوت والفيديو. سيتم تخزين هذه الملفات في Azure Data Lake.

Azure Data Lake icon with data from devices, social, LOB applications, video, web, sensors, relationsal, and clickstream shown going into the data lake.