ملفات تخزين الاستعلام مع تجمع SQL بلا خادم في Azure Synapse Analytics

تأتي كل مساحة عمل Azure Synapse Analytics مع نقاط نهاية تجمع SQL بلا خادم يمكنك استخدامها للاستعلام عن البيانات في Azure Data Lake (Parquet أو Delta Lake أو تنسيقات النص المحددة) أو Azure Cosmos DB أو Dataverse.

تجمع SQL بلا خادم هو خدمة استعلام حول البيانات في مستودع البيانات. يمكّنك من الوصول إلى بياناتك من خلال الوظائف التالية:

  • بنية T-SQL مألوفة للاستعلام حول البيانات المتوفرة بدون الحاجة إلى نسخ أو تحميل البيانات في مخزن متخصص. لمعرفة المزيد، راجع قسم دعم T-SQL.
  • الاتصال المتكامل عبر واجهة T-SQL التي توفر مجموعة واسعة من المعلومات المهنية وأدوات الاستعلام المخصصة، بما في ذلك برامج تشغيل الجهاز الأكثر شعبية. لمعرفة المزيد، راجع قسم أدوات العميل. يمكنك معرفة المزيد من مقدمة في فيديو Synapse Serverless SQL Pools.

تجمع SQL بدون خادم هو نظام معالجة بيانات موزع، معد من أجل البيانات كبيرة الحجم ووظائف حاسوبية. تجمع SQL يمكنك من تحليل بياناتك الضخمة في ثوانٍ إلى دقائق اعتمادًا على حمل العمل. بفضل التسامح مع أخطاء تنفيذ الاستعلام المدمج، يوفر النظام معدلات عالية من الموثوقية والنجاح حتى بالنسبة للاستعلامات التي يتم تشغيلها لفترة طويلة والتي تتضمن مجموعات بيانات كبيرة.

تجمع SQL هو خدمة بدون خادم، لذا ليس هناك بنية تحتية للإعداد أو التجميع أو الصيانة. النهاية الطرفية الافتراضية لهذه الخدمة يتم توفيرها في كل مساحة عمل Azure Synapse، لذا بمقدورك البدء في الاستفسار عن البيانات بمجرد إنشاء مساحة العمل.

لا توجد رسوم على الموارد المحجوزة، تتم محاسبتك فقط على البيانات التي تتم معالجتها بواسطة الاستعلامات التي تقوم بتشغيلها، ومن ثم هذا النموذج يُعد نموذجًا للدفع الحقيقي لكل استخدام.

إذا كنت تستخدم Apache Spark لـ Azure Synapse في خط التنفيذ والإمداد للبيانات الخاصة بك، لإعداد البيانات أو أعمال التطهير أو الإثراء، يمكنكالاستعلام عن جداول Spark الخارجية التي أنشأتها في العملية، مباشرة من تجمع SQL بدون خادم. استخدم الارتباط الخاص لإحضار نقطة نهاية تجمع SQL بدون خادم إلى مساحة العمل المدارة VNet.

فوائد تجمع SQL بدون خادم

إذا كنت بحاجة إلى استكشاف البيانات في بحيرة البيانات أو الحصول على رؤى منها أو تحسين خط التنفيذ والإمداد الحالي الخاص بتحويل البيانات، يمكنك الاستفادة من استخدام تجمع SQL بدون خادم. إنه ملائم للسيناريوهات التالية:

  • الاكتشاف والاستكشاف الأساسي - بسرعة سبب حول البيانات في أشكال مختلفة (Parquet، CSV، JSON) في بحيرة البيانات الخاصة بك، حتى تتمكن من خطة كيفية استخراج الأفكار منه.
  • مخزن البيانات المنطقية ــ توفير استخراج ارتباطي على قائمة البيانات الأساسية أو المتباينة، بما يسمح دائمًا برؤية محدثة لبياناتك. تعرف على المزيد حول إنشاء مستودع بيانات منطقي.
  • تحويل البيانات - طريقة بسيطة وقابلة للتطوير وعالية الأداء لتحويل البيانات في البحيرة باستخدام T-SQL، بحيث يمكن تغذيتها إلى أداة BI وغيرها من الأدوات، أو تحميلها في مخزن البيانات العلائقية (قواعد بيانات SQL Synapse، قاعدة بيانات Azure SQL، وما إلى ذلك).

يمكن أن تستفيد الأدوار المهنية المختلفة من تجمع SQL بدون خادم:

  • يمكن لمهندسي البيانات استكشاف البحيرة وتحويل وإعداد البيانات باستخدام هذه الخدمة وتبسيط خطوط التنفيذ والإمداد الخاصة بتحويل بياناتهم. لمزيد من المعلومات، تحقق من هذا البرنامج التعليمي.
  • يمكن لعلماء البيانات أن يعقلوا بسرعة حول محتويات وبنية البيانات في البحيرة، وذلك بفضل ميزات مثل OPENROWSET والاستدلال التلقائي على المخطط.
  • يمكن لمحللي البيانات استكشاف البيانات والجداول الخارجية التي أنشأها علماء البيانات أو مهندسو البيانات باستخدام لغة T-SQL مألوفة أو أدواتهم المفضلة، والتي يمكن الاتصال بتجمع SQL بدون خادم.
  • يمكن لمحترفي أداة BI إنشاء تقارير Power BI بسرعة على رأس البيانات في جداول البحيرة وSpark.

كيفية بدء استخدام تجمع SQL بدون ملقم

يتم توفير نقطة نهاية تجمع SQL بدون ملقم داخل كل مساحة عمل Azure Synapse. يمكنك إنشاء مساحة عمل والبدء في الاستعلام عن البيانات على الفور باستخدام الأدوات التي تعرفها.

تأكد من تطبيق أفضل الممارسات للحصول على أفضل أداء.

أدوات العميل

تجمع SQL بدون خادم يمكن الأدوات القائمة من SQL للاستعلام المخصص وأدوات ذكاء الأعمال للاستفادة من بحيرة البيانات. كما أنه يوفر أداة مألوفة لبناء بنية T-SQL، أي أداة قادرة على تأسيس اتصال TDS إلى العروض SQL بما يمكن من الاتصال بـ والاستعلام من خلال SQL Synapse. يمكنك الاتصال مع Azure Data Studio وتشغيل الاستعلامات المخصصة أو الاتصال بـ Power BI للحصول على الأفكار في غضون دقائق.

دعم SQL T

يوفر تجمع SQL بدون خادم مساحة سطح الاستعلام T-SQL، والتي يتم تحسينها/توسيعها قليلاً في بعض الجوانب لاستيعاب التجارب حول الاستعلام عن البيانات شبه المنظمة وغير المنظمة. علاوة على ذلك، بعض جوانب اللغة T-SQL غير معتمدة بسبب تصميم تجمع SQL بدون ملقم، على سبيل المثال، وظائف DML غير معتمدة حاليًا.

  • يمكن تنظيم عبء العمل باستخدام مفاهيم مألوفة:
  • قواعد البيانات - يمكن أن يكون تجمع SQL بدون خادم نقطة نهاية تجمع قواعد بيانات متعددة.
  • المخططات - داخل قاعدة بيانات، يمكن أن يكون هناك واحد أو العديد من مجموعات ملكية الكائن تسمى المخططات.
  • طرق العرض والإجراءات المخزنة ووظائف قيمة الجدول المضمنة
  • الموارد الخارجية ـ مصادر البيانات، صيغ الملف، والجداول

يمكن فرض الأمان باستخدام:

  • تسجيلات الدخول والمستخدمين
  • بيانات الاعتماد للتحكم في الوصول إلى حسابات التخزين
  • منح الأذونات ورفضها وإبطالها لكل مستوى كائن
  • تكامل Microsoft Entra

T-SQL المدعومة:

  • يتم دعم مساحة سطح SELECT الكاملة، بما في ذلك غالبية وظائف SQL
  • إنشاء جدول خارجي كخيار للتحديد
  • بيانات DDL المتعلقة بطرق العرض والأمان فقط

تجمع SQL بدون خادم لا يوجد لديه تخزين محلي، يتم تخزين كائنات بيانات التعريف فقط في قواعد البيانات. لذلك، لا يتم اعتماد SQL المتعلقة بالمفاهيم التالية:

  • الجداول‏‎
  • المشغلات
  • طرق العرض المجسدة
  • بيانات لغة تحديد البيانات DDL غير تلك المتعلقة بالآراء والأمان
  • بيانات لغة معالجات البيانات DML

إشعار

انتهت مهلة استعلامات تجمع SQL بلا خادم. لمزيد من المعلومات حول مهلة الاستعلام التي قد تؤثر على حمل العمل لديك، راجع قيود نظام تجمع SQL بلا خادم. حاليا لا يمكنك تغيير المهلة.

ملحقات

لتمكين تجربة سلسة للاستعلام عن البيانات الموجودة في ملفات في بحيرة البيانات، تجمع SQL بدون ملقم توسيع الدالة OPENROWSET الموجودة بإضافة القدرات التالية:

الاستعلام عن ملفات أو مجلدات متعددة

الاستعلام عن ملفات Parquet

تنسيق Delta

⁩طلب البحث بتنسيق CSV والنص المحدد (نهاية الحقل، فاصل الصف، حرف الإلغاء)⁧

مخزن تحليلي ل Azure Cosmos DB

قراء مجموعة فرعية مختارة من الأعمدة

استنتاج المخطط

دالة Filename

دالة Filepath

العمل مع الأنواع المعقدة وبنى البيانات المتداخلة أو المتكررة

الأمان

يوفر تجمع SQL بدون خادم آليات لتأمين الوصول إلى بياناتك.

تكامل Microsoft Entra والمصادقة متعددة العوامل

يمكنك تجمع SQL بلا خادم من إدارة هويات مستخدم قاعدة البيانات مركزيا خدمات Microsoft الأخرى مع تكامل Microsoft Entra. تبسط هذه الإمكانية إدارة الأذونات وتحسين الأمان. يدعم Microsoft Entra ID المصادقة متعددة العوامل (MFA) لزيادة أمان البيانات والتطبيق أثناء دعم عملية تسجيل دخول واحدة.

المصادقة

تشير مصادقة تجمع SQL بلا خادم إلى كيفية إثبات المستخدمين هويتهم عند الاتصال بنقطة النهاية. يجري اعتماد نوعين من المصادقة:

  • مصادقة SQL

    يستخدم أسلوب المصادقة هذا اسم مستخدم وكلمة مرور.

  • مصادقة Microsoft Entra:

    يستخدم أسلوب المصادقة هذا الهويات التي يديرها معرف Microsoft Entra. بالنسبة لمستخدمي Microsoft Entra، يمكن تمكين المصادقة متعددة العوامل. مصادقة استخدام المجلد النشط (تكامل الأمان) عندما يكون ذلك ممكنًا.

التصريح

التخويل يشير إلى ما يمكن للمستخدم أن يفعله بداخل قاعدة بيانات SQL بدون خادم، وتخضع لتحكم قاعدة بيانات حساب مستخدمك وعضوية دوره وأذونات الخاصة بمستوى الموضوع.

إذا تم استخدام مصادقة SQL، فسيكون مستخدم SQL موجودًا فقط في تجمع SQL بلا خادم ويتم تطبيق نطاق الأذونات على العناصر الموجودة في تجمع SQL بلا خادم. لا يمكن منح الوصول إلى العناصر القابلة للتأمين في خدمات أخرى (مثل Azure Storage) لمستخدم SQL مباشرةً، حيث إنه موجود فقط في نطاق تجمع SQL بلا خادم. يحتاج مستخدم SQL إلى استخدام واحد من أنماط التخويل التالية للوصول إلى الملفات.

إذا تم استخدام مصادقة Microsoft Entra، يمكن للمستخدم تسجيل الدخول إلى تجمع SQL بلا خادم وخدمات أخرى، مثل Azure Storage، ويمكنه منح أذونات لمستخدم Microsoft Entra.

الوصول إلى حسابات التخزين

تلزم مصادقة المستخدم الذي قام بتسجيل الدخول إلى خدمة تجمع SQL بلا خادم للوصول إلى الملفات الموجودة في Azure Storage والاستعلام عنها. يدعم تجمع SQL بلا خادم أنواع المصادقة الآتية:

  • يوفر توقيع الوصول المشترك (SAS) الوصول المفوض إلى الموارد الموجودة في حساب التخزين. باستخدام SAS، يمكنك منح العملاء حق الوصول إلى الموارد في حساب التخزين، من دون مشاركة مفاتيح الحساب. يمنحك SAS التحكم الدقيق في نوع الوصول الذي تمنحه للعملاء الذين لديهم SAS: الفاصل الزمني للصلاحية، والأذونات الممنوحة، ونطاق عنوان IP مقبول، وبروتوكول مقبول (https/http).

  • هوية المستخدم (المعروفة أيضا باسم "المرور") هي نوع تخويل حيث يتم استخدام هوية مستخدم Microsoft Entra الذي سجل الدخول إلى تجمع SQL بلا خادم لتخويل الوصول إلى البيانات. قبل الوصول إلى البيانات، يجب على مسؤول Azure Storage منح أذونات لمستخدم Microsoft Entra للوصول إلى البيانات. يستخدم نوع التخويل هذا مستخدم Microsoft Entra الذي قام بتسجيل الدخول إلى تجمع SQL بلا خادم، وبالتالي فهو غير مدعوم بأنواع مستخدمي SQL.

  • هوية مساحة العمل هي نوع ترخيص حيث يتم استخدام هوية مساحة عمل Synapse للسماح بالوصول إلى البيانات. قبل الوصول إلى البيانات، فإن مسؤول Azure Storage يجب أن يمنح الأذونات لهوية مساحة العمل من أجل الوصول إلى البيانات.

الوصول إلى Azure Cosmos DB

تحتاج إلى إنشاء بيانات اعتماد على مستوى الخادم أو قاعدة بيانات محددة النطاق باستخدام مفتاح القراءة فقط لحساب Azure Cosmos DB للوصول إلى مخزن Azure Cosmos DB التحليلي.

الخطوات التالية

يمكن العثور على معلومات إضافية حول اتصال نقطة النهاية وملفات الاستعلام في المقالات التالية: