استخدام مستودعات البيانات الحديثة للشركات الصغيرة والمتوسطة الحجم

Azure Data Lake
Azure SQL Database
Microsoft Fabric

توضح هذه المقالة عدة طرق يمكن من خلالها للشركات الصغيرة والمتوسطة الحجم تحديث مخازن البيانات القديمة واستكشاف أدوات البيانات الضخمة وقدراتها دون الإفراط في الميزانيات ومجموعات المهارات الحالية. تتكامل حلول تخزين البيانات الشاملة هذه بسلاسة مع Azure التعلم الآلي وخدمات Azure الذكاء الاصطناعي وMicrosoft Power Platform وMicrosoft Dynamics 365 وتقنيات Microsoft الأخرى. توفر هذه الحلول نقطة دخول سهلة إلى النظام الأساسي لبيانات البرامج المدارة بالكامل كخدمة (SaaS) على Microsoft Fabric التي يمكن أن تتوسع مع نمو احتياجاتك.

قد تستفيد الشركات الصغيرة والمتوسطة التي تستخدم SQL Server المحلي لحلول تخزين البيانات أقل من 500 جيجابايت من استخدام هذا النمط. يستخدمون أدوات مختلفة لاستيعاب البيانات في حل تخزين البيانات، بما في ذلك SQL Server Integration Services (SSIS) وSQL Server Analysis Services (SSAS) وSQL Server Reporting Services (SSRS) وإجراءات SQL المخزنة الشائعة والاستخراج الخارجي والتحويل والتحميل (ETL) وأدوات الاستخراج والتحميل والتحويل (ELT) ووظائف SQL Server Agent والنسخ المتماثل للقطة SQL. عادة ما تستند عمليات مزامنة البيانات إلى اللقطات، ويتم إجراؤها مرة واحدة في اليوم، ولا تحتوي على متطلبات إعداد التقارير في الوقت الفعلي.

بنية مبسطة

رسم تخطيطي يوضح بنية SMB مبسطة.

قم بتنزيل ملف Visio لهذه البنية.

تتضمن فرصة التحديث المفاهيمية نقل حل تخزين البيانات القديم إلى مجموعة من قاعدة بيانات Azure SQL ومثيل Azure SQL المدار والنسيج. تضمن هذه الاستراتيجية توافقا واسعا مع أدوات عميل SQL Server وSQL التقليدية مثل SQL Server Management Studio (SSMS). كما يوفر خيارات الرفع والإزاحة للعمليات الحالية ويتطلب الحد الأدنى من المهارات لفريق الدعم. يعمل هذا الحل كخطوة أولية نحو التحديث الشامل، والذي يمكن المؤسسة من اعتماد نهج مستودع بشكل كامل مع توسع مستودع البيانات ونمو مجموعة مهارات الفريق.

بناء الأنظمة

رسم تخطيطي يوضح بنية موسعة مصممة لتلبية الاحتياجات المستقبلية.

قم بتنزيل ملف Visio لهذه البنية.

يمكن أن تحتوي مستودعات بيانات SMB القديمة على عدة أنواع من البيانات:

  • البيانات غير المنظمة، مثل المستندات والرسومات.

  • البيانات شبه المنظمة، مثل السجلات وملفات CSV وJSON وXML.

  • البيانات الارتباطية المنظمة، بما في ذلك قواعد البيانات التي تستخدم الإجراءات المخزنة لأنشطة ETL و ELT.

تدفق البيانات

يتوافق تدفق البيانات التالي مع الرسم التخطيطي السابق. يوضح استيعاب نوع البيانات الذي تختاره:

  1. تنسق مسارات بيانات النسيج أو مسارات Azure Data Factory استيعاب بيانات المعاملات في حل تخزين البيانات.

    • تنسق المسارات تدفق قواعد البيانات القديمة التي تم ترحيلها أو إعادة بناء التعليمات البرمجية جزئيا وحزم SSIS في قاعدة بيانات SQL ومثيل SQL المدار. يمكنك تنفيذ نهج الرفع والتحويل هذا بسرعة، والذي يضمن انتقالا سلسا من حل SQL المحلي إلى بيئة Fabric SaaS المستقبلية. يمكنك تحديث قواعد البيانات بالتزايد بعد الرفع والتحول.

    • يمكن أن تمرر المسارات البيانات غير المنظمة وشبه المنظمة والمهيكلة إلى Azure Data Lake Storage للتخزين المركزي والتحليل مع مصادر أخرى. استخدم هذا الأسلوب عندما يوفر دمج البيانات فائدة تجارية أكثر من إعادة تنسيق البيانات.

  2. استخدم مصادر بيانات Microsoft Dynamics 365 لإنشاء لوحات معلومات الأعمال المركزية (BI) على مجموعات البيانات المعززة باستخدام أدوات التحليل بلا خادم Fabric. يمكنك إعادة البيانات المدمجة والمعالجة إلى Dynamics واستخدامها لمزيد من التحليل داخل Fabric.

  3. يمكن للبيانات في الوقت الحقيقي من مصادر البث إدخال النظام عبر مراكز الأحداث أو حلول الدفق الأخرى. بالنسبة للعملاء الذين لديهم متطلبات لوحة معلومات في الوقت الحقيقي، يمكن لتحليلات Fabric في الوقت الحقيقي تحليل هذه البيانات على الفور.

  4. يمكن استيعاب البيانات في Fabric OneLake المركزي لمزيد من التحليل والتخزين وإعداد التقارير باستخدام اختصارات Data Lake Storage. تتيح هذه العملية التحليل الموضعي وتسهل استهلاك انتقال البيانات من الخادم.

  5. تتوفر أدوات التحليل بلا خادم، مثل نقطة نهاية SQL Analytics وإمكانيات Fabric Spark، عند الطلب داخل Fabric ولا تتطلب أي موارد متوفرة. تعد أدوات التحليل بلا خادم مثالية ل:

    • أنشطة ETL و ELT على بيانات OneLake.

    • تقديم طبقة ذهبية من بنية الميدالية لتقارير Power BI عبر ميزة DirectLake.

    • استكشافات علوم البيانات المرتجلة بتنسيق T-SQL أو Python.

    • النماذج الأولية لكيانات مستودع البيانات.

يتم دمج Fabric بإحكام مع المستهلكين المحتملين لمجموعات البيانات متعددة المصادر، بما في ذلك تقارير الواجهة الأمامية ل Power BI، التعلم الآلي، وPower Apps، وAzure Logic Apps، وAzure Functions، وتطبيقات الويب Azure App Service.

المكونات

  • Fabric هي خدمة تحليلات تجمع بين هندسة البيانات وتخزين البيانات وعلوم البيانات والبيانات في الوقت الحقيقي وقدرات المعلومات المهنية. في هذا الحل، توفر قدرات هندسة بيانات Fabric نظاما أساسيا تعاونيا لمهندسي البيانات وعلماء البيانات ومحللي البيانات ومحترفي المعلومات المهنية. يتم تشغيل هذا المكون الرئيسي بواسطة محركات الحوسبة بلا خادم ويقدم قيمة تجارية من خلال إنشاء رؤى يتم توزيعها على العملاء.

  • قاعدة بيانات SQL ومثيل SQL المدار هما خدمات قاعدة بيانات ارتباطية مستندة إلى السحابة. تستخدم قاعدة بيانات SQL ومثيل SQL المدار SSMS لتطوير وصيانة البيانات الاصطناعية القديمة مثل الإجراءات المخزنة. في هذا الحل، تستضيف هذه الخدمات مستودع بيانات المؤسسة وتنفذ أنشطة ETL و ELT باستخدام الإجراءات المخزنة أو الحزم الخارجية. قاعدة بيانات SQL ومثيل SQL المدار هما بيئات النظام الأساسي كخدمة (PaaS) التي يمكنك استخدامها لتلبية متطلبات قابلية الوصول العالية والتعافي من الكوارث. تأكد من اختيار SKU الذي يلبي متطلباتك. لمزيد من المعلومات، راجع قابلية الوصول العالية لقاعدة بيانات SQL والتوافر العالي لمثيل SQL المدار.

  • SSMS هي بيئة متكاملة لإدارة بنية SQL الأساسية التي يمكنك استخدامها لتطوير وصيانة البيانات الاصطناعية القديمة، مثل الإجراءات المخزنة.

  • مراكز الأحداث هي نظام أساسي لتدفق البيانات في الوقت الحقيقي وخدمة استيعاب الأحداث. تتكامل مراكز الأحداث بسلاسة مع خدمات بيانات Azure ويمكنها استيعاب البيانات من أي مكان.

البدائل

  • يمكنك استخدام Azure IoT Hub لاستبدال مراكز الأحداث أو إكمالها. اختر الحل الخاص بك استنادا إلى مصدر بيانات الدفق وما إذا كنت بحاجة إلى الاستنساخ والاتصال ثنائي الاتجاه مع أجهزة التقارير.

  • يمكنك استخدام مسارات بيانات Fabric بدلا من مسارات Data Factory لتكامل البيانات. سيعتمد قرارك على عدة عوامل. لمزيد من المعلومات، راجع الحصول على من Azure Data Factory إلى Data Factory في Fabric.

  • يمكنك استخدام Fabric Warehouse بدلا من قاعدة بيانات SQL أو مثيل SQL المدار لتخزين بيانات المؤسسة. تعطي هذه المقالة الأولوية للوقت لتسويق العملاء الذين يرغبون في تحديث مستودعات البيانات الخاصة بهم. لمزيد من المعلومات حول خيارات مخزن البيانات ل Fabric، راجع دليل قرار Fabric.

تفاصيل السيناريو

عندما تقوم الشركات الصغيرة والمتوسطة بتحديث مستودعات البيانات المحلية الخاصة بها للسحابة، يمكنها إما اعتماد أدوات البيانات الضخمة لقابلية التوسع في المستقبل أو استخدام حلول تقليدية تستند إلى SQL لكفاءة التكلفة وسهولة الصيانة والانتقال السلس. يوفر النهج المختلط أفضل ما في العالمين ويتيح الترحيل السهل لممتلكات البيانات الحالية أثناء استخدام الأدوات الحديثة وقدرات الذكاء الاصطناعي. يمكن للشركات الصغيرة والمتوسطة الحفاظ على تشغيل مصادر البيانات المستندة إلى SQL في السحابة وتحديثها حسب الحاجة.

توضح هذه المقالة العديد من الاستراتيجيات للشركات الصغيرة والمتوسطة لتحديث مخازن البيانات القديمة واستكشاف أدوات البيانات الضخمة وقدراتها دون تمديد الميزانيات الحالية ومجموعات المهارات. تتكامل حلول تخزين بيانات Azure الشاملة هذه بسلاسة مع Azure خدمات Microsoft، بما في ذلك خدمات الذكاء الاصطناعي وMicrosoft Dynamics 365 وMicrosoft Power Platform.

حالات الاستخدام المحتملة

  • ترحيل مستودع بيانات علائقي محلي تقليدي أقل من 1 تيرابايت ويستخدم حزم SSIS لتنسيق الإجراءات المخزنة.

  • قم بدمج بيانات Dynamics الحالية أو Microsoft Power Platform Dataverse مع مصادر Data Lake مجمعة وفي الوقت الفعلي.

  • استخدم تقنيات مبتكرة للتفاعل مع بيانات Azure Data Lake Storage Gen2 المركزية. وتشمل هذه التقنيات تحليل بلا خادم، واستخراج المعرفة، ودمج البيانات بين المجالات، واستكشاف بيانات المستخدم النهائي، بما في ذلك Fabric Copilot.

  • إنشاء شركات التجارة الإلكترونية لاعتماد مستودع بيانات لتحسين عملياتها.

لا يُنصح بهذا الحل من أجل:

  • نشر greenfield لمستودعات البيانات.

  • ترحيل مستودعات البيانات المحلية التي يزيد حجمها عن 1 تيرابايت أو من المتوقع أن تصل إلى هذا الحجم في غضون عام.

الاعتبارات

تنفذ هذه الاعتبارات ركائز Azure Well-Architected Framework، وهو عبارة عن مجموعة من المبادئ التوجيهية التي يمكن استخدامها لتحسين جودة حمل العمل. لمزيد من المعلومات، يرجى مراجعةMicrosoft Azure Well-Architected Framework.

تحسين التكلفة

يركز تحسين التكلفة على البحث عن طرق للحد من النفقات غير الضرورية وتحسين الكفاءة التشغيلية. لمزيد من المعلومات، راجع قائمة اختيار مراجعة التصميم لتحسين التكلفة.

  • تمكنك حاسبة تسعير Azure من تعديل القيم لفهم كيفية تأثير متطلباتك المحددة على التكاليف. يمكنك مشاهدة عينة تسعير لسيناريو تخزين بيانات SMB في حاسبة تسعير Azure.

  • يعتمد تسعير قاعدة بيانات SQL على مستويات الحوسبة والخدمة التي تختارها وعدد vCores ووحدات معاملات قاعدة البيانات. يصف المثال قاعدة بيانات واحدة مع حساب مزود وثمانية vCores ويفترض أنك بحاجة إلى تشغيل الإجراءات المخزنة في قاعدة بيانات SQL.

  • يعتمد تسعير Data Lake Storage Gen2 على كمية البيانات التي تقوم بتخزينها وعدد المرات التي تستخدم فيها البيانات. يغطي نموذج التسعير 1 تيرابايت من تخزين البيانات وافتراضات المعاملات الأخرى. يشير 1 تيرابايت إلى حجم مستودع البيانات وليس حجم قاعدة البيانات القديمة الأصلية.

  • يعتمد تسعير النسيج إما على سعر سعة Fabric F أو سعر Premium لكل شخص. تستخدم القدرات بلا خادم وحدة المعالجة المركزية والذاكرة من السعة المخصصة التي اشتريتها.

  • يعتمد تسعير مراكز الأحداث على المستوى الذي تختاره، وعدد وحدات معدل النقل المقدمة، وحركة مرور الدخول المستلمة. يفترض المثال وحدة معدل نقل واحدة في الطبقة القياسية التي تتعامل مع أكثر من مليون حدث شهريا.

المساهمون

تحتفظ Microsoft بهذه المقالة. وهي مكتوبة في الأصل من قبل المساهمين التاليين.

الكاتب الرئيسي:

لمشاهدة ملفات تعريف LinkedIn غير العامة، سجل الدخول إلى LinkedIn.

الخطوات التالية