بيانات التعريف المشتركة لتحليلات Azure Synapse

تسمح Azure Synapse Analytics للمحركات الحسابية المختلفة في مساحة العمل بمشاركة قواعد البيانات والجداول بين مجموعات Apache Spark ومجموعة SQL بلا خادم.

تدعم المشاركة ما يسمى بنمط مستودع البيانات الحديث وتوفر لمساحة العمل SQL محركات الوصول إلى قواعد البيانات والجداول التي تم إنشاؤها باستخدام Spark. كما تسمح لمحركات SQL بإنشاء العناصر الخاصة بهم التي لا يتم مشاركتها مع محركات أخرى.

تدعم مستودع البيانات الحديث

يدعم نموذج بيانات التعريف المشتركة نمط مستودع البيانات الحديث على النحو التالي:

  1. يتم إعداد البيانات الواردة من بحيرة البيانات وتنظيمها بكفاءة مع Spark بتخزين البيانات المعدة (قد تكون مقسمة) في جداول مدعومة بتنسيق Parquet المتاحة في العديد من قواعد البيانات.

  2. تصبح قواعد البيانات المُعدة باستخدام Spark قواعد البيانات وجميع جداولها مرئية في أي من مثيلات تجمع Spark لمساحة عمل في Azure Synapse ويمكن استخدامها من أي من مهام Spark. تخضع هذه الإمكانية للأذونات حيث أن كافة تجمعات Spark في مساحة عمل تشارك مخزن تعريف الكتالوج الأساسي ذاته.

  3. تصبح قواعد البيانات المُعدة باستخدام Spark وجميع جداولها المدعومة من Parquet أو المدعومة من CSV مرئية في تجمع SQL بلا خادم لمساحة العمل. يتم إنشاء قواعد البيانات تلقائيًا في بيانات تعريف تجمع SQL بدون خادم، ويتم الوصول إلى كل من الجداول الخارجية والمدارة التي تم إنشاؤها بمهمة Spark كجداول خارجية في بيانات تعريف تجمع SQL بلا خادم في dbo مخطط قاعدة البيانات المتطابقة.

تحدث مزامنة الكائن بشكل غير متزامن. سيكون للكائنات تأخير بسيط لبضع ثوانٍ حتى تظهر في سياق SQL. بمجرد ظهورها، يمكن الاستعلام عنها، ولكن لن تُجري محركات SQL التي لديها حق الوصول إليها أي تحديث أو تعديل عليها.

كائنات بيانات التعريف المشتركة

يتيح Spark إنشاء قواعد بيانات والجداول الخارجية والجداول مدارة وطرق العرض. نظراً إلى أن طرق عرض Spark تتطلب محرك Spark لمعالجة عبارة SQL Spark المميزة، ولا يمكن لمحرك SQL معالجتها، تتم فقط مشاركة قواعد البيانات وجداولها الخارجية والمُدارة المضمنة التي تستخدم تنسيق تخزين Parquet أو CSV مع محرك SQL في مساحة العمل. تجري مشاركة طرق عرض Spark فقط مع مثيلات تجمع Spark.

نموذج أمان في لمحة

تؤمن قواعد بيانات جداول Spark، جنبًا إلى جنب مع تمثيلاتها المتزامنة في محرك SQL، على مستوى التخزين الأساسي. عند استعلام أي من المشغلات التي يمتلك مقدم الاستعلام الحق في استخدامها عن الجدول، يُمرر مبدأ أمان مقدم الاستعلام إلى الملفات الأساسية. يتم التحقق من الأذونات على مستوى نظام الملفات.

لمزيد من المعلومات، راجع قاعدة بيانات تحليلات Azure Synapse المشتركة.

تغيير الصيانة

في حالة حذف كائن بيانات تعريف أو تعديله باستخدام Spark، تُجمع التعديلات وتُنشر في تجمع SQL بلا خادم. المزامنة غير متزامنة وتنعكس التغييرات في محرك SQL بعد فترة زمنية قصيرة.

الخطوات التالية