مشاركة عبر


قاعدة بيانات البحيرة

تمكّن قاعدة بيانات البحيرة في Azure Synapse Analytics العملاء من الجمع بين تصميم قاعدة البيانات والمعلومات الوصفية حول البيانات المخزنة وإمكانية وصف كيفية ومكان تخزين البيانات. تعالج قاعدة بيانات Lake التحدي الذي تواجهه مستودعات البيانات اليوم حيث يصعب فهم كيفية تنظيم البيانات.

نظرة عامة على قاعدة بيانات Lake

مصمم قاعدة البيانات

يمنحك مصمم قاعدة البيانات الجديد في Synapse Studio إمكانية إنشاء نموذج بيانات لقاعدة بيانات بحيرتك وإضافة معلومات إضافية إليها. يمكن وصف كل كيان وسمة لتوفير مزيد من المعلومات حول النموذج، والذي لا يحتوي فقط على الكيانات ولكن العلاقات أيضًا. على وجه الخصوص، كان عدم القدرة على نمذجة العلاقات تحديًا للتفاعل في مستودع البيانات. يتم التعامل مع هذا التحدي الآن من خلال مصمم متكامل يوفر الإمكانيات التي كانت متاحة في قواعد البيانات ولكن ليس على المستودع. كما تتيح القدرة على إضافة أوصاف وقيم تجريبية محتملة للنموذج للأشخاص الذين يتفاعلون معها في المستقبل الحصول على معلومات حيث يحتاجون إليها للحصول على فهم أفضل للبيانات.

إشعار

الحد الأقصى لحجم بيانات التعريف في قاعدة بيانات البحيرة هو 10 غيغابايت. ستفشل محاولة نشر نموذج يتجاوز حجمه 10 غيغابايت أو تحديثه. لحل هذه المشكلة، قم بتقليل حجم النموذج عن طريق إزالة الجداول والأعمدة. ضع في اعتبارك تقسيم النماذج الكبيرة إلى قواعد بيانات بحيرة متعددة لتجنب هذا الحد.

تخزين البيانات.

تستخدم قواعد بيانات Lake مستودع بيانات على حساب Azure Storage لتخزين بيانات قاعدة البيانات. يمكن تخزين البيانات بتنسيق Parquet أو Delta أو CSV ويمكن استخدام إعدادات مختلفة لتحسين التخزين. تستخدم كل قاعدة بيانات مستودع خدمة مرتبطة لتحديد موقع مجلد البيانات الجذر. لكل كيان، يتم إنشاء مجلدات منفصلة بشكل افتراضي داخل مجلد قاعدة البيانات هذا في مستودع البيانات. بشكل افتراضي كافة الجداول داخل قاعدة بيانات المستودع استخدام نفس التنسيق ولكن يمكن تغيير تنسيقات وموقع البيانات لكل كيان إذا طلب ذلك.

إشعار

لا يؤدي نشر قاعدة بيانات مستودع إلى إنشاء أي من البُنى أو المخططات الأساسية اللازمة للاستعلام عن البيانات في Spark أو SQL. بعد النشر، قم بتحميل البيانات في قاعدة بيانات المستودع الخاصة بك باستخدام المسارات لبدء الاستعلام عنها.

حاليا، دعم تنسيق Delta لقواعد بيانات المستودع غير مدعوم في Synapse Studio.

مزامنة كائنات قاعدة بيانات البحيرة بين التخزين وSynapse أحادي الاتجاه. تأكد من إجراء أي إنشاء أو تعديل مخطط لكائنات قاعدة بيانات البحيرة باستخدام مصمم قاعدة البيانات في Synapse Studio. إذا قمت بدلا من ذلك بإجراء مثل هذه التغييرات من Spark أو مباشرة في التخزين، ستصبح تعريفات قواعد بيانات المستودع الخاصة بك غير متزامنة. إذا حدث ذلك، فقد ترى تعريفات قاعدة بيانات البحيرة القديمة في مصمم قاعدة البيانات. ستحتاج إلى نسخ هذه التغييرات ونشرها في مصمم قاعدة البيانات من أجل إعادة مزامنة قواعد بيانات المستودع.

حساب قاعدة البيانات

يتم الكشف عن قاعدة بيانات البحيرة في تجمع SQL بدون خادم Synapse SQL و Apache Spark مما يوفر للمستخدمين القدرة على فصل التخزين عن الحوسبة. تجعل بيانات التعريف المرتبطة بقاعدة بيانات البحيرة من السهل على محركات الحوسبة المختلفة ليس فقط توفير تجربة متكاملة ولكن أيضا استخدام معلومات إضافية (على سبيل المثال، العلاقات) التي لم تكن مدعومة في الأصل على مستودع البيانات.

متابعة استكشاف قدرات مصمم قاعدة البيانات باستخدام الارتباطات أدناه.