Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Importante
Questa funzionalità è in Anteprima Pubblica.
Questa pagina descrive lo schema della tabella dei risultati della classificazione dei dati e include query di esempio. La tabella archivia i rilevamenti per le classi di dati sensibili a livello di colonna nei cataloghi abilitati nel metastore.
Percorso tabella: system.data_classification.results
Schema della tabella dei risultati della classificazione dei dati
La tabella di sistema dei risultati della classificazione dei dati usa lo schema seguente:
| Nome della colonna | Tipo di dati | Description | Example |
|---|---|---|---|
latest_detected_time |
Marca temporale | Data e ora in cui la colonna è stata analizzata più di recente. | 2025-06-27T12:34 |
first_detected_time |
Marca temporale | Ora in cui il rilevamento della colonna è stato per la prima volta registrato. | 2025-06-27T12:34 |
catalog_id |
corda | ID del catalogo. | 3f1a7d6e-9c59-... |
table_id |
corda | ID della tabella. | 3f1a7d6e-9c59-... |
catalog_name |
corda | Nome catalogo. | main_catalog |
schema_name |
corda | Nome schema. | public |
table_name |
corda | Nome della tabella. | sales_data |
column_name |
corda | Nome colonna. | customer_email |
data_type |
corda | Tipo di dati della colonna. I tipi complessi includono definizioni di struct complete. | struct<name:string, age:int> |
class_tag |
corda | Tag per l'entità rilevata o la chiave del tag e il valore facoltativo. |
class.us_ssn o pii: confidential |
samples |
array<string> |
Fino a cinque valori di esempio corrispondenti al rilevamento. | ["a@b.com", ...] |
confidence |
corda | Attendibilità del rilevamento. O HIGH o LOW |
HIGH |
frequency |
galleggiare | Stima della percentuale di righe corrispondenti nell'esempio. Tra 0 e 1. | 0.87 |
Interrogazioni di esempio
Sostituire i valori dei parametri con i propri prima dell'esecuzione.
Ottenere tutti i rilevamenti per una tabella
SELECT *
FROM system.data_classification.results
WHERE
catalog_name = "c"
AND schema_name = "s"
AND table_name = "t";
Ottenere tutti i rilevamenti con attendibilità elevata
SELECT *
FROM system.data_classification.results
WHERE
catalog_name = "c"
AND schema_name = "s"
AND table_name = "t"
AND confidence = "HIGH";
Ottenere il numero di tabelle interessate da una classificazione specifica
SELECT
class_tag,
COUNT(DISTINCT catalog_name, schema_name, table_name) AS num_tables
FROM
system.data_classification.results
WHERE
class_tag IS NOT NULL
GROUP BY class_tag;
Ottenere il numero di utenti che hanno eseguito query sulle tabelle con dati sensibili negli ultimi 30 giorni
WITH table_accesses AS (
SELECT
IFNULL(
request_params.full_name_arg,
CONCAT(request_params.catalog_name, '.', request_params.schema_name, '.', request_params.name)
) AS table_full_name,
COUNT(DISTINCT user_identity.email) AS num_users
FROM
system.access.audit
WHERE
action_name IN ("createTable", "getTable", "updateTable", "deleteTable")
AND (
-- For performance, limit the blast radius of the audit log query to only the current catalog
request_params.catalog_name = :catalog_name OR
request_params.full_name_arg LIKE :catalog_name || '%'
)
AND event_time >= DATE_SUB(current_date(), 30)
GROUP BY table_full_name
),
sensitive_tables AS (
SELECT
DISTINCT CONCAT(catalog_name, '.', schema_name, '.', table_name) AS table_full_name
FROM
system.data_classification.results
WHERE class_tag IS NOT NULL
)
SELECT
st.table_full_name,
ta.num_users
FROM
sensitive_tables st
JOIN table_accesses ta
ON st.table_full_name = ta.table_full_name