Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Berlaku untuk:
Databricks SQL
Databricks Runtime 11.3 LTS ke atas
Mengembalikan status level file dari Auto Loader atau read_files stream.
Sintaks
cloud_files_state( { TABLE ( table_name ) | checkpoint } )
Argumen
-
table_name: Pengidentifikasi tabel streaming yang sedang ditulis oleh
read_files. Nama tidak boleh menyertakan spesifikasi temporal. Tersedia di Databricks Runtime 13.3 LTS ke atas. -
checkpoint: Sebuah LiteralSTRING. Direktori titik pemeriksaan untuk aliran yang menggunakan sumber Auto Loader. Lihat Apa itu Pemuat Otomatis?.
Pengembalian
Mengembalikan tabel dengan skema berikut:
path STRING NOT NULL PRIMARY KEYJalur file.
size BIGINT NOT NULLUkuran file dalam byte.
create_time TIMESTAMP NOT NULLWaktu file dibuat.
discovery_time TIMESTAMP NOT NULLBerlaku untuk:
Databricks SQL
Databricks Runtime 16.4 ke atasWaktu saat file ditemukan.
processed_time TIMESTAMP NOT NULLBerlaku untuk:
Databricks SQL
Databricks Runtime 16.4 ke atas ketika cloudFiles.cleanSourcediaktifkan. Lihat Opsi Auto Loader.Waktu file diproses. Jika batch mengalami kegagalan dan dicoba kembali, file mungkin diproses beberapa kali. Saat percobaan ulang terjadi, bidang ini berisi waktu pemrosesan terbaru.
commit_time TIMESTAMPBerlaku untuk:
Databricks SQL
Databricks Runtime 16.4 ke atas ketika cloudFiles.cleanSourcediaktifkan. Lihat Opsi Auto Loader.Waktu file di-commit ke checkpoint setelah diproses.
NULLjika file belum diproses. Tidak ada jaminan latensi untuk menandai file sebagai dikomit; file mungkin diproses tetapi ditandai sebagai dikomit secara acak nanti. Menandai file sebagai telah disetujui artinya Auto Loader tidak memerlukan file tersebut untuk diproses lagi.archive_time TIMESTAMPBerlaku untuk:
Databricks SQL
Databricks Runtime 16.4 ke atas ketika cloudFiles.cleanSourcediaktifkan. Lihat Opsi Auto Loader.Waktu file diarsipkan.
NULLjika file belum diarsipkan.archive_mode STRINGBerlaku untuk:
Databricks SQL
Databricks Runtime 16.4 ke atas ketika cloudFiles.cleanSourcediaktifkan. Lihat Opsi Auto Loader.MOVEjikacloudFiles.cleanSourcediatur keMOVEketika file diarsipkan.DELETEjikacloudFiles.cleanSourcediatur keDELETEketika file diarsipkan.NULLjikacloudFiles.cleanSourcediatur keOFF(default).move_location STRINGBerlaku untuk:
Databricks SQL
Databricks Runtime 16.4 ke atas ketika cloudFiles.cleanSourcediaktifkan. Lihat Opsi Auto Loader.Jalur lengkap tempat file dipindahkan selama operasi pengarsipan ketika
cloudFiles.cleanSourcediatur keMOVE.NULLjika file belum diarsipkan ataucloudFiles.cleanSourcemerupakan salah satu dariDELETEatauOFF.source_id STRINGID sumber Auto Loader pada kueri streaming. Nilai ini adalah
'0'untuk aliran yang mengambil dari satu lokasi penyimpanan objek cloud.flow_name STRINGBerlaku untuk:
Databricks SQL
Databricks Runtime 13.3 ke atasMewakili aliran streaming tertentu di Alur Deklaratif Lakeflow Spark yang berisi satu atau beberapa sumber file cloud. NULL jika tidak ada table_name yang diberikan.
ingestion_state STRINGBerlaku untuk:
Databricks SQL
Databricks Runtime 16.4 ke atas ketika cloudFiles.cleanSourcediaktifkan. Lihat Opsi Auto Loader.Apakah file telah diserap, ditunjukkan oleh salah satu status berikut:
-
NULL: File belum diproses, atau status file tidak dapat ditentukan oleh Auto Loader. -
PROCESSING: File sedang diproses. -
SKIPPED_CORRUPTED: File tidak diserap karena rusak. -
SKIPPED_MISSING: File tidak diserap karena tidak ditemukan selama pemrosesan. -
INGESTED: File telah diproses oleh sink setidaknya sekali. Ini mungkin diproses ulang oleh sink non-idempotent sepertiforeachBatchjika terjadi kegagalan dalam aliran. Hanya file dengan bidang non-nullcommit_timeyang dalam statusINGESTEDtelah selesai diproses. -
NOT_RECOGNIZED_BY_DBR: Dicadangkan untuk kompatibilitas versi. Status ini akan ditampilkan untuk status yang diperkenalkan dalam versi Databricks Runtime selanjutnya yang tidak dikenali oleh versi Databricks Runtime sebelumnya.
-
Izin
Anda harus memiliki:
- Jika menggunakan pengidentifikasi tabel streaming
- Databricks Runtime 17.1 ke bawah:
OWNERhak istimewa pada tabel streaming - Databricks SQL dan Databricks Runtime 17.2 ke atas: hak akses
SELECTdanMODIFYpada tabel streaming
- Databricks Runtime 17.1 ke bawah:
-
READ FILEShak istimewa pada lokasi titik pemeriksaan jika menyediakan titik pemeriksaan di bawah lokasi eksternal.
Contoh
-- Simple example from checkpoint
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint');
/some/input/path
/other/input/path
-- Simple example from source subdir
> SELECT path FROM CLOUD_FILES_STATE('/some/checkpoint/sources/0');
/some/input/path
/other/input/path
-- Simple example from streaming table
> SELECT path FROM CLOUD_FILES_STATE(TABLE(my_streaming_table));
/some/input/path
/other/input/path
Keterbatasan
- Pengguna yang membaca tampilan yang mereferensikan
cloud_files_statetabel streaming harus memilikiSELECThak istimewa pada tampilan dan hak istimewa yang diperlukan pada tabel streaming.