cloud_files_state دالة ذات قيمة جدولية

ينطبق على:وضع علامة Databricks SQL وضع علامة Databricks Runtime 11.3 LTS وما فوق

إرجاع حالة مستوى الملف لمحمل تلقائي أو read_files دفق.

بناء الجملة

cloud_files_state( { TABLE ( table_name ) | checkpoint } )

الوسيطات

  • table_name: معرف جدول الدفق الذي تتم كتابته بواسطة read_files. يجب ألا يتضمن الاسم مواصفات زمنية. متوفر في Databricks Runtime 13.3 LTS وما فوق.
  • checkpointSTRING: قيمة حرفية. دليل نقطة التحقق لدفق باستخدام مصدر المحمل التلقائي. راجع ما هو المحمل التلقائي؟.

المرتجعات

إرجاع جدول بالمخطط التالي:

  • path STRING NOT NULL PRIMARY KEY

    مسار ملف.

  • size BIGINT NOT NULL

    حجم ملف بالبايت.

  • create_time TIMESTAMP NOT NULL

    الوقت الذي تم فيه إنشاء ملف.

  • discovery_time TIMESTAMP NOT NULL

    هام

    هذه الميزة في المعاينة الخاصة. لتجربة ذلك، تواصل مع جهة اتصال Azure Databricks.

    الوقت الذي تم فيه اكتشاف ملف.

  • commit_time TIMESTAMP

    هام

    هذه الميزة في المعاينة الخاصة. لتجربة ذلك، تواصل مع جهة اتصال Azure Databricks.

    الوقت الذي تم فيه الالتزام بملف بنقطة التحقق بعد المعالجة. NULL إذا لم تتم معالجة الملف بعد. قد تتم معالجة ملف، ولكن قد يتم وضع علامة عليه على أنه ملتزم بشكل عشوائي لاحقا. يعني وضع علامة على الملف كملتزم به أن "المحمل التلقائي" لا يتطلب الملف للمعالجة مرة أخرى.

  • archive_time TIMESTAMP

    هام

    هذه الميزة في المعاينة الخاصة. لتجربة ذلك، تواصل مع جهة اتصال Azure Databricks.

    الوقت الذي تم فيه أرشفة ملف. NULL إذا لم يتم أرشفة الملف.

  • source_id STRING

    معرف مصدر المحمل التلقائي في استعلام الدفق. هذه القيمة مخصصة '0' للتدفقات التي يتم استيعابها من موقع مخزن عناصر سحابة واحد.

الأذونات

يجب أن يكون لديك:

  • OWNER امتيازات على جدول الدفق إذا كنت تستخدم معرف جدول دفق.
  • READ FILES الامتيازات على موقع نقطة التحقق إذا كانت توفر نقطة تفتيش ضمن موقع خارجي.

الأمثلة

-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
  /some/input/path
  /other/input/path

-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
  /some/input/path
  /other/input/path

-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
  /some/input/path
  /other/input/path