تمرين - إحضار مجموعات بيانات SDOH الخاصة بك إلى ليك هاوس

مكتمل

في هذا التمرين، ستتعلم كيفية إعداد مجموعة بيانات لاستيعابها في lakehouse كمجموعة بيانات محددة اجتماعية.

إحضار بيانات SDOH الخاصة بك

لإحضار المحددات الاجتماعية الخاصة بك لبيانات الصحة (SDOH)، اتبع الخطوات التالية:

  1. افتح ملف SDOH_State_Level_DATASET_Starter.xlsx الموجود في مجلد مورد المختبر.

  2. تأكد من عدم وضع علامة سري على إعداد الحساسية في جدول البيانات. إذا تم وضع علامة سري عليه، فسيفشل جدول البيانات أثناء عملية الاستيعاب.

  3. قم بتحرير اسم ورقة العمل عن طريق استبدال المسافات بتسطير أسفل السطر (_). تضمن هذه الخطوة تنسيق الاسم بشكل صحيح للاستخدام أثناء الاستيعاب.

    تعرض الصورة التالية التنسيق الصحيح لاسم ورقة العمل.

  4. حدد ورقة جديدة ثم أنشئ ثلاث أوراق عمل جديدة بالأسماء التالية:

    • التَخطِيط
    • تكوين الموقع
    • بيانات تعريف مجموعة البيانات

    ملاحظة

    إذا قمت بلصق هذه الأسماء، فتأكد من عدم وجود مساحة زائدة في النهاية.

    لديك الآن أربع أوراق عمل، كما هو موضح في لقطة الشاشة التالية.

  5. حدد ورقة عمل التخطيط ثم أضف الرؤوس والصفوف التالية.

    Category فئه فرعيه وصف المحدد الاجتماعي اسم-المحدد-الاجتماعي الوحدات HarmonizationKey
    الاجتماعي الاقتصادي المدارس % ترك المدرسة نسبة التسرب المئوية النسبه المئويه الاجتماعي والاقتصادي
    الاجتماعي والاقتصادي المدارس % تخرج النسبة المئوية للخريجين النسبه المئويه الاجتماعيه
    الاجتماعية والاقتصادية المدارس % المساعدات المالية نسبة المساعدة المالية النسبه المئويه الاجتماعية والاقتصادية

    يجب أن تشبه ورقة عمل التخطيط الصورة التالية.

  6. حدد ورقة عمل LocationConfiguration ثم أضف الرأس والصفوف كما يلي.

    ColumnName StandardColumnName AssociatedWithSDOHValue
    منطقة تعليمية المنطقة_التعليمية صحيح
    المدينة CITY FALSE
    State STATE FALSE

    يجب أن تشبه ورقة عمل LocationConfiguration الصورة التالية.

  7. حدد ورقة عمل DataSetMetadata ثم أضف الرأس والصفوف كما يلي.

    اسم مجموعة البيانات اسم الناشر تاريخ النشر ValidUntil
    تدريب بيانات مدارس الدولة إحصائيات Fabrikam 4/27/2023

    يجب أن تشبه ورقة عمل DataSetMetadata لقطة الشاشة التالية.

  8. احفظ تغييراتك.

  9. انتقل إلى https://app.powerbi.com/ وسجل الدخول.

  10. حدد مساحة عمل FL HC Cloud التي قمت بإنشائها. استبدل FL بالأحرف الأولى من اسمك.

  11. حدد موقع واختر بيت البحيرة FLHeathcare_msft_bronze. استبدل FL بالأحرف الأولى من اسمك.

  12. قم بتوسيع Files > Ingest > SDOH > XLSX ثم اختر علامة الحذف (...) الموجودة على العقدة. حدد مجلد فرعي جديد.

  13. أدخل Fabrikam كاسم المجلد ثم حدد إنشاء. في هذا المثال، يمكنك التوافق مع بنية المجلد الموحد وإنشاء ناشر جديد.

  14. حدد زر علامة الحذف (...) في مجلد Fabrikam ثم حدد Upload > Upload files.

  15. حدد أيقونة المجلد. حدد موقع ملف Excel الذي قمت بتحريره وحدده. حدد تحميل.

  16. بعد اكتمال التحميل، أغلق جزء Upload files .

  17. حدد مساحة العمل التي قمت بإنشائها. حدد موقع مسار بيانات FLHealthcare_msft_sdoh_ingest وحدده.

  18. راجع أنشطة خط العمليات ثم حدد تشغيل.

  19. انتظر حتى يكتمل تشغيل أنبوب العمليات.

الاستعلام عن مستودع الفضة

للاستعلام عن مستودع البيانات سيلفر ليكهاوس، اتبع الخطوات التالية:

  1. حدد Lakehouse في الزاوية العلوية اليسرى ثم قم بالتبديل إلى نقطة نهاية تحليلات SQL.

  2. حدد New SQL query.

  3. الصق الاستعلام كما يلي.

    SELECT
        sd.SocialDeterminantId,
        sd.SocialDeterminantName,
        sd.SocialDeterminantValue,
        sd.HarmonizationKey,
        loc.SocialDeterminantCategoryName AS Category,
        sub.SocialDeterminantSubCategoryName AS SubCategory,
        uom.UnitOfMeasureName AS MeasurementUnit
    FROM SocialDeterminant sd
    JOIN SocialDeterminantSubCategory sub ON sd.SocialDeterminantSubCategoryId = sub.SocialDeterminantSubCategoryId
    JOIN SocialDeterminantCategory loc ON sub.SocialDeterminantCategoryId = loc.SocialDeterminantCategoryId
    JOIN UnitOfMeasure uom ON sd.UnitOfMeasureId = uom.UnitOfMeasureId
    WHERE sd.HarmonizationKey = 'Socioeconomic'
    
  4. حدد تشغيل.

    نتائج الاستعلام كما يلي.