ما هو ارتباط Azure Synapse Link لقاعدة بيانات Azure Cosmos DB؟
ينطبق على: NoSQL MongoDB العفريت
Azure Synapse Link لـ Azure Cosmos DB هو إمكانية معالجة العمليات والتحليلات الهجينة (HTAP) السحابية الأصلية التي تمكنك من تشغيل تحليلات قريبة من الوقت الحقيقي عبر البيانات التشغيلية في Azure Cosmos DB. ينشئ ارتباط Azure Synapse تكاملاً محكمًا وسلسًا بين Azure Cosmos DB وAzure Synapse Analytics.
هام
النسخ المتطابق ل Azure Cosmos DB في Microsoft Fabric متاح الآن لواجهة برمجة تطبيقات NoSql. توفر هذه الميزة جميع إمكانيات Azure Synapse Link بأداء تحليلي أفضل، والقدرة على توحيد ملكية بياناتك باستخدام Fabric OneLake والوصول المفتوح إلى بياناتك بتنسيق Delta Parquet. إذا كنت تفكر في Azure Synapse Link، نوصي بتجربة النسخ المتطابق لتقييم ملاءمة مؤسستك بشكل عام. ابدأ مع النسخ المتطابق في Microsoft Fabric.
يمكن استخدام مخزن Azure Cosmos DB التحليلي، وهو مخزن أعمدة معزول بالكامل، مع Azure Synapse Link لتمكين تحليلات استخراج وتحويل-تحميل (ETL) في Azure Synapse Analytics مقابل بياناتك التشغيلية على نطاق واسع. يمكن لمحللي الأعمال ومهندسي البيانات وعلماء البيانات الآن استخدام Synapse Spark أو Synapse SQL بالتبادل لتشغيل البنية الأساسية لبرنامج ربط العمليات التجارية للمعلومات المهنية والتحليلات والتعلّم الآلي القريبة من الوقت الحقيقي. يمكنك تحليل البيانات في الوقت الحقيقي دون التأثير على أداء أحمال عمل المعاملات على Azure Cosmos DB.
تظهر الصورة التالية تكامل ارتباطAzure Synapse Link مع قاعدةبياناتAzure Cosmos DB وتحليلات Azure Synapse Analytics:
المزايا
لتحليل مجموعات البيانات التشغيلية الكبيرة مع تقليل أي تأثيرات على أداء أحمال عمل المعاملات الحرجة للمهام، يقوم عملاء Azure Cosmos DB عادة بتصدير البيانات التشغيلية. يتم تنفيذ هذه العمليات بواسطة مسارات Extract-Transform-Load (ETL)، والتي تتطلب العديد من طبقات إدارة البيانات والوظائف، ما يؤدي إلى تعقيد التشغيل وتأثيرات الأداء على أحمال عمل المعاملات الخاصة بك. كما أنه يزيد من زمن الانتقال لتحليل البيانات التشغيلية من وقت المنشأ.
بالمقارنة مع الحلول التقليدية المستندة إلى ETL، يوفر Azure Synapse Link ل Azure Cosmos DB العديد من المزايا مثل:
تقليل التعقيد مع عدم وجود وظائف ETL لإدارتها
يتيح لك Azure Synapse Link الوصول مباشرة إلى المخزن التحليلي لـ Azure Cosmos DB باستخدام Azure Synapse Analytics بلا حركة بيانات معقدة. أي تحديثات يتم إجراؤها على البيانات التشغيلية مرئية في المخزن التحليلي القريب من الوقت الحقيقي مع عدم وجود ETL أو تغيير وظائف الموجز. يمكنك تشغيل تحليلات واسعة النطاق مقابل مخزن تحليلي، من Azure Synapse Analytics، دون تحويل بيانات إضافي.
التفاصيل القريبة من الوقت الحقيقي في البيانات التشغيلية الخاصة بك
يمكنك الآن الحصول على تفاصيل وافية حول البيانات التشغيلية الخاصة بك القريبة من الوقت الحقيقي، وذلك باستخدام ارتباطAzure Synapse Link. تميل الأنظمة المستندة إلى ETL إلى الحصول على زمن انتقال أعلى لتحليل البيانات التشغيلية، نظراً للعديد من الطبقات اللازمة لاستخراج البيانات التشغيلية وتحويلها وتحميلها. مع التكامل الأصلي من المخزن التحليلي لقاعدة بيانات Azure Cosmos DB مع تحليلات Azure Synapse Analytics، يمكنك تحليل البيانات التشغيلية القريب من الوقت الحقيقي مما يتيح سيناريوهات عمل جديدة.
لا يوجد اختراق في الأداء على أحمال العمل التشغيلية
باستخدام Azure Synapse Link، يمكنك تشغيل استعلامات تحليلية مقابل مخزن تحليلي Azure Cosmos DB، وهو تمثيل مخزن أعمدة لبياناتك. يمكنك تشغيل الاستعلامات أثناء معالجة عمليات المعاملات باستخدام معدل النقل المقدم لحمل عمل المعاملات، عبر مخزن المعاملات المستند إلى صف Azure Cosmos DB. حمل العمل التحليلي مستقل عن حركة حمل العمل للمعاملات، ولا يستهلك معدل النقل الذي خصصته لبيانات التشغيل الخاصة بك.
محسن لحمل الأعمال التحليلية على نطاق واسع
تم تحسين المتجر التحليلي لقاعدة بيانات Azure Cosmos DB لتوفير قابلية التوسع والمرونة والأداء لحمل الأعمال التحليلية دون أي تبعية لأوقات تشغيل الحساب. يتم إدارة تكنولوجيا التخزين ذاتيًا لتحسين حمل الأعمال التحليلية. مع الدعم المدمج في تحليلاتAzure Synapse Analytics، يوفر الوصول إلى طبقة التخزين هذه البساطة والأداء العالي.
تكلفة مناسبة
مع ارتباط Azure Synapse Link، يمكنك الحصول على حل محسن التكلفة لخدمة مدارة بشكل كامل للتحليلات التشغيلية. يزيل الطبقات الإضافية للتخزين والحساب المطلوبة في البنية الأساسية لبرنامج ربط العمليات التجارية ETL التقليدية لتحليل البيانات التشغيلية.
يتبع المخزن التحليلي لـ Azure Cosmos DB نموذج تسعير قائم على الاستهلاك، يستند إلى تخزين البيانات وعمليات القراءة/الكتابة التحليلية والاستعلامات المنفذة. لا يتطلب منك تخصيص أي معدل نقل، كما تفعل اليوم لأحمال عمل المعاملات. إن الوصول إلى بياناتك باستخدام محركات حوسبة مرنة للغاية من Azure Synapse Analytics يجعل التكلفة الإجمالية لتشغيل التخزين والحوسبة فعالة.
تحليلات للكتابات المحلية والعمومية ومتعددة المناطق
يمكنك تشغيل الاستعلامات التحليلية بشكل فعّال وفق أقرب نسخة إقليمية من البيانات الخاصة بك في قاعدة بيانات Azure Cosmos DB. توفر قاعدة بيانات Azure Cosmos DB أحدث القدرات لتشغيل حمل الأعمال التحليلية العمومية بالإضافة إلى حمل الأعمال الخاصة بالمعاملات بطريقة نشطة.
تمكين سيناريوهات HTAP لبيانات التشغيل الخاصة بك
يجمع Azure Synapse Link بين مخزن Azure Cosmos DB التحليلي مع دعم وقت تشغيل Azure Synapse Analytics. يمكنك هذا التكامل من إنشاء حلول HTAP الأصلية السحابية التي تنشئ رؤى استنادا إلى تحديثات في الوقت الحقيقي لبيانات التشغيل عبر مجموعات البيانات الكبيرة. فهو يفتح سيناريوهات تجارية جديدة لرفع التنبيهات استنادًا إلى التنبيهات المباشرة، وبناء لوحات معلومات قريبة من الوقت الحقيقي، وتجارب تجارية استنادًا إلى سلوك المستخدم.
المخزن التحليلي لقاعدة بياناتAzure Cosmos DB
يعد المخزن التحليلي لقاعدة بياناتAzure Cosmos DB تمثيل موجه نحو العمود لبيانات التشغيل الخاصة بك في قاعدة بياناتAzure Cosmos DB. هذا المخزن التحليلي مناسب للاستعلامات السريعة والفعالة من حيث التكلفة على مجموعات البيانات التشغيلية الكبيرة. يمكن لهذا المخزن الاستعلام عن البيانات دون نسخ البيانات والتأثير على أداء أحمال العمل الخاصة بالمعاملات.
يحدد المخزن التحليلي عمليات إدراج وتحديث وحذف متكررة بشكل كبير تلقائياً في حمل عمل العمليات في الوقت الحقيقي تقريباً باعتبارها إمكانية مُدارة بالكامل ("المزامنة التلقائية") لـ Azure Cosmos DB. لا يتطلب أي تغيير في الموجز أو ETL.
إذا كان لديك حساب قاعدة بياناتAzure Cosmos DB عمومي، وبعد تمكينك للمخزن التحليلي لحاوية، فإنه سيكون متوفرًا في كافة مناطق هذا الحساب. للحصول على مزيدٍ من المعلومات حول المخزن التحليلي، راجع مقالنظرة عامة حول المخزن التحليلي لقاعدة بيانات Azure Cosmos DB.
البدء باستخدام تحليلاتAzure Synapse Analytics
باستخدام Azure Synapse Link، يمكنك الآن الاتصال مباشرة بحاويات Azure Cosmos DB من Azure Synapse Analytics والوصول إلى المخزن التحليلي بدون موصلات منفصلة. يدعم Azure Synapse Analytics حاليا Azure Synapse Link مع Synapse Apache Spark وتجمع SQL بلا خادم.
يمكنك الاستعلام عن البيانات من المخزن التحليلي لقاعدة بيانات Azure Cosmos DB في وقت واحد، مع التداخل عبر أوقات تشغيل تحليلات مختلفة مدعومة من تحليلاتAzure Synapse Analytics. لا يلزم إجراء تحويلات بيانات إضافية لتحليل البيانات التشغيلية. يمكنك الاستعلام عن بيانات المخزن التحليلي وتحليلها باستخدام:
Synapse Apache Spark مع الدعم الكامل لكل من Scala، وPython، وSparkSQL، وC#. Synapse Spark هو مركزي لهندسة البيانات وسيناريوهات علوم البيانات
تجمع SQL بلا خادم مع لغة T-SQL ودعم لأدوات المعلومات المهنية (BI) المألوفة (على سبيل المثال، Premium Power BI، وما إلى ذلك)
إشعار
من تحليلات Azure Synapse Analytics، يمكنك الوصول إلى كل من المتاجر التحليلية والعمليات في حاوية قاعدة بياناتAzure Cosmos DB. ومع ذلك، إذا كنت ترغب في إجراء تحليلات أو عمليات مسح واسعة النطاق على البيانات التشغيلية الخاصة بك، نوصي باستخدام مخزن تحليلي لتجنب تأثير الأداء على حمل الأعمال المتعلقة بالعمليات.
إشعار
يمكنك تشغيل التحليلات مع زمن انتقال منخفض في منطقة Azure عن طريق توصيل حاوية قاعدة بيانات Azure Cosmos DB الخاصة بك لوقت تشغيل Synapse في تلك المنطقة.
هذا التكامل يتيح سيناريوهات HTAP التالية للمستخدمين مختلفة:
مهندس المعلومات المهنية هو الشخص الذي يريد إنشاء نموذج ونشر تقرير Power BI للوصول إلى البيانات التشغيلية المباشرة في Azure Cosmos DB من خلال SQL Synapse مباشرةً.
محلل البيانات هو الشخص الذي يريد استخلاص نتيجة تحليلات من البيانات التشغيلية في حاوية Azure Cosmos DB عن طريق الاستعلام عنها باستخدام Synapse SQL، وقراءة البيانات على نطاق واسع وجمع هذه النتائج مع مصادر البيانات الأخرى.
عالم البيانات هو الشخص الذي يريد استخدام Synapse Spark للعثور على ميزة لتحسين نموذج وتدريب هذا النموذج دون القيام بتصميمات هندسية معقدة للبيانات. يمكنهم أيضًا كتابة نتائج استنتاج مشاركة النموذج في قاعدة بينات Azure Cosmos DB لتسجيل النقاط في الوقت الحقيقي على البيانات من خلال Spark Synapse.
مهندس البيانات هو الشخص الذي يريد أن يجعل البيانات متوفرة للمستهلكين، من خلال إنشاء جداول SQL أو Spark عبر حاويات Azure Cosmos DB دون عمليات ETL اليدوية.
لمزيد من المعلومات حول دعم وقت تشغيل Azure Synapse Analytics ل Azure Cosmos DB، راجع Azure Synapse Analytics لدعم Azure Cosmos DB.
متى تستخدم ارتباط Azure Synapse Link لقاعدة بيانات Azure Cosmos DB؟
يوصى باستخدام Azure Synapse Link إذا كنت عميل Azure Cosmos DB وتريد تشغيل التحليلات وذكاء المعلومات والتعلم الآلي عبر بياناتك التشغيلية. على سبيل المثال:
إذا كنت تشغِل التحليلات أو المعلومات المهنية على البيانات التشغيلية لـ Azure Cosmos DB مباشرةً باستخدام موصلات منفصلة اليوم، أو
إذا كنت تشغِل عمليات ETL لاستخراج البيانات التشغيلية في نظام تحليلات منفصل.
في مثل هذه الحالات، يوفر Azure Synapse Link تجربة تحليلات أكثر تكاملا دون التأثير على معدل النقل المقدم لمتجر المعاملات الخاص بك.
لا يوصى باستخدام Azure Synapse Link إذا كنت تبحث عن متطلبات مستودع البيانات التقليدية. قد تتضمن هذه المتطلبات تزامنا عاليا وإدارة حمل العمل واستمرار التجميعات عبر مصادر بيانات متعددة. للحصول على مزيدٍ من المعلومات، راجع السيناريوهات الشائعة التي يمكن تشغيلها باستخدام ارتباط Azure Synapse Link لقاعدة بيانات Azure Cosmos DB.
القيود
يتم دعم Azure Synapse Link ل Azure Cosmos DB ل NoSQL وGremlin وMongoDB APIs. وهو غير مدعوم لواجهات برمجة تطبيقات Cassandra أو Table.
لا يسرد مستكشف البيانات في مساحات عمل Synapse الرسوم البيانية Gremlin في طريقة عرض الشجرة. ولكن لا يزال بإمكانك تشغيل الاستعلامات.
الوصول إلى متجر تحليلات قاعدة بياناتAzure Cosmos DB معAzure Synapse Dedicated SQL Pool غير مدعوم حاليًا.
على الرغم من أن بيانات المخزن التحليلي لا يتم نسخها احتياطيا، وبالتالي لا يمكن استعادتها، يمكنك إعادة إنشاء مخزنك التحليلي عن طريق إعادة إنشاء Azure Synapse Link في الحاوية المستعادة. تحقق من وثائق المتجر التحليلي للحصول على مزيد من المعلومات.
رابط Synapse لحسابات قاعدة البيانات باستخدام وضع النسخ الاحتياطي المستمر هو GA. وضع النسخ الاحتياطي المستمر للحسابات الممكنة ل Synapse Link في المعاينة العامة. حاليا، لا يمكن للعملاء الذين عطلوا Synapse Link من الحاويات الترحيل إلى النسخ الاحتياطي المستمر.
لا يتم دعم التحكم في الوصول المستند إلى الدور متعدد المستويات عند الاستعلام من Synapse. يمكن للمستخدمين الذين لديهم حق الوصول إلى مساحة عمل Synapse الخاصة بك ولديهم حق الوصول إلى حساب Azure Cosmos DB الوصول إلى جميع الحاويات داخل هذا الحساب. لا ندعم حاليًا المزيد من الوصول الدقيق إلى الحاويات.
لا تدعم مساحات عمل Azure Synapse حاليًا استخدام الخدمات المرتبطة
Managed Identity
. استخدمMasterKey
الخيار دائمًا.لا يوصى حاليا بحسابات الكتابة متعددة المناطق لبيئات الإنتاج.
الأمان
يتيح لك Azure Synapse Link إمكانية تشغيل تحليلات قريبة من الوقت الحقيقي عبر بيانات المهام الحرجة في Azure Cosmos DB. من الضروري التأكد من تخزين بيانات الأعمال الهامة بشكل آمن عبر كل من المتاجر التحليلية والمعاملات. تم تصميم ارتباط Azure Synapse Link لقاعدة بيانات Azure Cosmos DB للمساعدة في تلبية متطلبات الأمان هذه من خلال الميزات التالية:
عزل الشبكة باستخدام نقاط النهاية الخاصة - يمكنك التحكم في وصول الشبكة إلى البيانات في مخازن العمليات والتحليل بشكل مستقل. يتم عزل الشبكة باستخدام نقاط نهاية خاصة مدارة منفصلة لكل مخزن، داخل الشبكات الظاهرية المدارة في مساحات عمل Azure Synapse. لمعرفة المزيد، راجع كيفية تكوين نقاط النهاية الخاصة لمقالة المخزن التحليلي.
تشفير البيانات باستخدام المفاتيح المدارة من قبل العملاء - يمكنك تشفير البيانات بسلاسة عبر مخازن المعاملات والتحليل باستخدام نفس المفاتيح التي يديرها العميل بتلقائية وشفافية. يدعم Azure Synapse Link فقط تكوين المفاتيح المُدارة بواسطة العميل باستخدام الهوية المُدارة لحساب Azure Cosmos DB. يجب عليك تكوين الهوية المُدارة لحسابك في نهج الوصول إلى Azure Key Vault قبل تمكين ارتباط Azure Synapse على حسابك. لمعرفة المزيد، راجع كيفية تكوين المفاتيح التي يديرها العملاء باستخدام مقالة الهويات المدارة لحسابات Azure Cosmos DB.
إدارة المفاتيح الآمنة - يتطلب الوصول إلى البيانات في مخزن تحليلي من تجمعات SQL بلا خادم من Synapse Spark وSynapse إدارة مفاتيح قاعدة بيانات Azure Cosmos DB داخل مساحات عمل تحليلات Synapse Analytics. بدلاً من استخدام مفاتيح حساب Azure Cosmos DB المضمنة في وظائف Spark أو البرامج النصية SQL، يوفر Azure Synapse Link إمكانيات أكثر أماناً:
عند استخدام تجمعات SQL بلا خادم Synapse، يمكنك الاستعلام عن مخزن Azure Cosmos DB التحليلي عن طريق إنشاء بيانات اعتماد SQL مسبقا لتخزين مفاتيح الحساب والإشارة إلى هذه المفاتيح في
OPENROWSET
الوظيفة. لمعرفة المزيد، راجع الاستعلام باستخدام تجمع SQL بلا خادم في مقالة ارتباطAzure Synapse Link.عند استخدام Synapse Spark، يمكنك تخزين مفاتيح الحساب في كائنات الخدمة المرتبطة التي تشير إلى قاعدة بيانات Azure Cosmos DB والإشارة إلى المفاتيح في تكوين Spark في وقت التشغيل. لمعرفة المزيد، راجع نسخ البيانات من قاعدة بياناتAzure Cosmos DB إلى تجمع SQL مخصص باستخدام مقالة Apache Spark.
التسعير
يتضمن نموذج الفواتير من ارتباطAzure Synapse Link التكاليف المتكبدة باستخدام المخزن التحليلي لقاعدة بيانات Azure Cosmos DB ووقت تشغيل Synapse. لمعرفة المزيد، راجع تسعير المخزن التحليلي لقاعدة بيانات Azure Cosmos DB ومقالات تسعير تحليلاتAzure Synapse Analytics.
الخطوات التالية
لمعرفة المزيد، راجع المستندات التالية: