Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Berlaku untuk:
Databricks SQL
Databricks Runtime 13.3 LTS ke atas
Mengembalikan log peristiwa untuk tampilan materialisasi, tabel streaming, dan Alur Deklaratif Lakeflow Spark.
Pelajari selengkapnya tentang log peristiwa Lakeflow Spark Declarative Pipelines.
Note
Fungsi event_log bernilai tabel hanya dapat dipanggil oleh pemilik tabel streaming atau tampilan materialisasi, dan tampilan yang dibuat melalui fungsi bernilai tabel event_log hanya dapat dikueri oleh pemilik tabel streaming atau tampilan materialisasi. Tampilan tidak dapat dibagikan dengan pengguna lain.
Syntax
event_log( { TABLE ( table_name ) | pipeline_id } )
Arguments
- table_name: Nama tampilan materialisasi atau tabel streaming. Nama tidak boleh menyertakan spesifikasi temporal. Jika nama tidak memenuhi syarat, katalog dan skema saat ini digunakan untuk memenuhi syarat pengidentifikasi.
-
pipeline_id: String pengidentifikasi dari pipeline.
Returns
-
id STRING NOT NULL: Pengidentifikasi unik untuk catatan log peristiwa. -
sequence STRING NOT NULL: Objek JSON yang berisi metadata untuk mengidentifikasi dan mengurutkan peristiwa. -
origin STRING NOT NULL: Objek JSON yang berisi metadata untuk asal peristiwa, misalnya, penyedia cloud, wilayah,user_id, ataupipeline_id. -
timestamp TIMESTAMP NOT NULL: Waktu peristiwa direkam dalam UTC. -
message STRING NOT NULL: Pesan yang dapat dibaca manusia yang menjelaskan peristiwa tersebut. -
level STRING NOT NULL: Tingkat pengelogan, misalnya, ,INFO,WARNERROR, atauMETRICS. -
maturity_level STRING NOT NULL: Stabilitas skema peristiwa. Nilai yang mungkin adalah:-
STABLE: Skema stabil dan tidak akan berubah. -
NULL: Skema stabil dan tidak akan berubah. Nilainya mungkinNULLjika rekaman dibuat sebelummaturity_levelbidang ditambahkan (rilis 2022.37). -
EVOLVING: Skema tidak stabil dan dapat berubah. -
DEPRECATED: Skema tidak digunakan lagi dan runtime Alur Deklaratif Lakeflow Spark dapat berhenti menghasilkan peristiwa ini kapan saja.
-
-
error STRING: Jika terjadi kesalahan, detail yang menjelaskan kesalahan. -
details STRING NOT NULL: Objek JSON yang berisi detail terstruktur peristiwa. Ini adalah bidang utama yang digunakan untuk menganalisis peristiwa. -
event_type STRING NOT NULL: Jenis peristiwa.
Examples
Lihat Log peristiwa pipeline untuk contoh lebih lanjut.
-- View the events on a materialized view
> SELECT timestamp, message, details
FROM event_log(table(my_mv))
WHERE level in ('INFO', 'WARN', 'ERROR')
ORDER BY timestamp;
timestamp, message, details
---------------------------
2023-08-12 01:03:05.000, 'Flow "my_mv" is STARTING.', '{"flow_progress":{"status":"STARTING"}}'
-- Create a temp view with the latest update to the table/pipeline
> CREATE OR REPLACE TEMP VIEW latest_update AS
SELECT origin.update_id AS id FROM event_log('<pipeline-ID>')
WHERE event_type = 'create_update' ORDER BY timestamp DESC LIMIT 1;
-- Query lineage information
> SELECT
details:flow_definition.output_dataset as output_dataset,
details:flow_definition.input_datasets as input_dataset
FROM
event_log('<pipeline-ID>'),
latest_update
WHERE
event_type = 'flow_definition' AND origin.update_id = latest_update.id;
output_dataset, input_dataset
-----------------------------
customers, null
sales_orders_raw, null
sales_orders_cleaned, ["customers", "sales_orders_raw"]
sales_order_in_la, ["sales_orders_cleaned"]
-- Query data quality expectation history for a streaming table
> WITH expectations_parsed AS (
SELECT
explode(
from_json(
details:flow_progress.data_quality.expectations,
"array<struct<name: string, dataset: string, passed_records: int, failed_records: int>>"
)
) row_expectations
FROM
event_log(table(my_st)),
latest_update
WHERE
event_type = 'flow_progress'
AND origin.update_id = latest_update.id
)
SELECT
row_expectations.dataset as dataset,
row_expectations.name as expectation,
SUM(row_expectations.passed_records) as passing_records,
SUM(row_expectations.failed_records) as failing_records
FROM expectations_parsed
GROUP BY
row_expectations.dataset,
row_expectations.name;
dataset, expectation, passing_records, failing_records
------------------------------------------------------
sales_orders_cleaned, valid_order_number, 4083, 0