الملخص

مكتمل

غطينا الكثير من الأرض. دعونا نراجع بعض الرسائل الرئيسية.

ما هي البيانات؟

تندرج البيانات في عدة فئات منطقية. ومن الفئات الأكثر شيوعاً ما يلي:

  • البيانات المستمرة (الأعداد)،
  • البيانات الفئوية التي ليس لها ترتيب،
  • البيانات الترتيبية، والتي يمكن التعامل معها كأعداد أو فئات مرتبة.

تخزن أجهزة الكمبيوتر البيانات كأنواع مميزة، وعادة ما نحاول مطابقة نوع البيانات مع البيانات المحددة. على سبيل المثال، لتخزين البيانات المستمرة، تعمل أرقام الفاصلة العائمة بشكل أفضل، لأن أرقام الفاصلة العائمة تسمح بتخزين الكسور. وعلى النقيض من ذلك، غالباً ما تصل البيانات الفئوية كسلاسل (نص) ويجب تحويلها إلى خطوط متجهة أحادية لكي يفهمها الكمبيوتر بشكل صحيح.

ما الذي يجعل مجموعة البيانات ناجحة؟

تعلمنا أن مجموعة البيانات مفيدة إذا كانت:

  • تحتوي على معلومات ذات صلة،
  • مكتملة
  • تمثيلاً جيداً للسكان (في العالم الحقيقي).

إذا كان علينا التعامل مع البيانات غير المكتملة، يمكننا اتخاذ خطوات للتأكد من أن البيانات غير المكتملة لا تسبب مشكلات كبيرة. عند القيام بذلك، يجب علينا تجنب إدخال قضايا جديدة، مثل التغييرات التي من شأنها أن تجعل البيانات لم تعد ممثلة، على سبيل المثال.

التفكير في البيانات

أظهرنا كيف يمكن أن يساعد تصور البيانات في بناء فهم لما قد يكون مفيدا في النموذج. يمكن أن يكون استخدام أنواع مختلفة من الرسوم البيانية والألوان وما إلى ذلك ممتعا ويجعل المعلومات المعقدة أكثر بديهية.

لقد تعلمنا أيضاً أن فهم بياناتنا يتيح لنا اتخاذ قرارات أفضل بشأن النماذج الخاصة بنا. في التمرين الأخير، قمنا بتحسين نموذجنا بينما استكشفنا عدد المقصورات على تيتانيك، ودرسنا كيف ساعدتنا هذه المعلومات. ومع ذلك بشكل عام، وجدنا أنه يمكننا تحسين ذلك من خلال التبسيط في تسع تسميات على سطح السفينة.