مزامنة أباتشي سبارك لازور Synapse تعريفات الجدول الخارجي في تجمع SQL serverless

يمكن لتجمع SQL Serverless مزامنة البيانات الوصفية تلقائيًا من أباتشي سبارك. سيتم إنشاء قاعدة بيانات تجمع SQL بدون خادم لكل قاعدة بيانات موجودة في تجمعات Apache Spark بدون خادم.

لكل Spark جدول خارجي استنادًا إلى Parquet أو CSV وتقع في تخزين Azure، يتم إنشاء جدول خارجي في قاعدة بيانات تجمع SQL بدون خادم. على هذا النحو، يمكنك إيقاف تشغيل تجمعات Spark والاستعلام عن الجداول الخارجية Spark من تجمع SQL بدون خادم.

عندما يتم تقسيم جدول في Spark، يتم تنظيم الملفات في التخزين بواسطة المجلدات. سيستخدم تجمع SQL Serverless بيانات تعريف القسم ويستهدف فقط المجلدات والملفات ذات الصلة للاستعلام الخاص بك.

يتم تكوين مزامنة بيانات التعريف تلقائيًا لكل تجمع Apache Spark بدون خادم في مساحة عمل Azure Synapse. يمكنك بدء الاستعلام عن الجداول الخارجية Spark على الفور.

يتم تمثيل كل جدول خارجي Spark Parquet أو CSV موجود في تخزين Azure مع جدول خارجي في مخطط dbo يتوافق مع قاعدة بيانات تجمع SQL بدون خادم.

لاستعلامات جدول خارجية Spark، قم بتشغيل استعلام يستهدف [spark_table] خارجيًا. قبل تشغيل المثال التالي، تأكد من أن لديك حق الوصول الصحيح إلى حساب التخزين حيث توجد الملفات.

SELECT * FROM [db].dbo.[spark_table]

أنواع بيانات Apache Spark SQL لتعيين أنواع البيانات

لمزيد من المعلومات حول تعيين أنواع بياناتApache Spark إلى أنواع البيانات، راجع جداول بيانات التعريف المشتركة Azure Synapse Analytics.

الخطوات التالية

تقدم إلى مقالة التحكم في الوصول إلى التخزين لمعرفة المزيد حول التحكم في الوصول إلى التخزين.