Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Belangrijk
Deze functie bevindt zich in openbare preview-versie.
Op deze pagina ziet u een overzicht van het tabelschema met resultaten van gegevensclassificatie en bevat voorbeeldquery's. In de tabel worden detecties opgeslagen voor gevoelige gegevensklassen op kolomniveau voor ingeschakelde catalogi in uw metastore.
Tabelpad: system.data_classification.results
Tabelschema voor gegevensclassificatieresultaten
De systeemtabel met resultaten van gegevensclassificatie maakt gebruik van het volgende schema:
| Kolomnaam | Gegevenstype | Description | Example |
|---|---|---|---|
latest_detected_time |
tijdstempel | Tijdstip waarop de kolom het laatst is gescand. | 2025-06-27T12:34 |
first_detected_time |
tijdstempel | Tijdstip waarop de kolomdetectie voor het eerst is vastgelegd. | 2025-06-27T12:34 |
catalog_id |
touw | Id van de catalogus. | 3f1a7d6e-9c59-... |
table_id |
touw | Id van de tabel. | 3f1a7d6e-9c59-... |
catalog_name |
touw | Catalogusnaam. | main_catalog |
schema_name |
touw | Schemanaam. | public |
table_name |
touw | Tabelnaam. | sales_data |
column_name |
touw | Kolomnaam. | customer_email |
data_type |
touw | Gegevenstype van de kolom. Complexe typen bevatten volledige structdefinities. | struct<name:string, age:int> |
class_tag |
touw | Tag voor de gedetecteerde entiteit of tagsleutel en optionele waarde. |
class.us_ssn of pii: confidential |
samples |
array<string> |
Maximaal vijf voorbeeldwaarden die overeenkomen met de detectie. | ["a@b.com", ...] |
confidence |
touw | Betrouwbaarheid van detectie. Of HIGHLOW |
HIGH |
frequency |
zweven | Schatting van het aandeel overeenkomende rijen in het voorbeeld. Tussen 0 en 1. | 0.87 |
Voorbeeldvragen
Vervang parameterwaarden door uw eigen waarden voordat u deze uitvoert.
Alle detecties voor een tabel ophalen
SELECT *
FROM system.data_classification.results
WHERE
catalog_name = "c"
AND schema_name = "s"
AND table_name = "t";
Alle detecties met hoge betrouwbaarheid ophalen
SELECT *
FROM system.data_classification.results
WHERE
catalog_name = "c"
AND schema_name = "s"
AND table_name = "t"
AND confidence = "HIGH";
Het aantal tabellen ophalen dat wordt beïnvloed door een specifieke classificatie
SELECT
class_tag,
COUNT(DISTINCT catalog_name, schema_name, table_name) AS num_tables
FROM
system.data_classification.results
WHERE
class_tag IS NOT NULL
GROUP BY class_tag;
Het aantal gebruikers ophalen dat in de afgelopen 30 dagen query's heeft uitgevoerd op tabellen met gevoelige gegevens
WITH table_accesses AS (
SELECT
IFNULL(
request_params.full_name_arg,
CONCAT(request_params.catalog_name, '.', request_params.schema_name, '.', request_params.name)
) AS table_full_name,
COUNT(DISTINCT user_identity.email) AS num_users
FROM
system.access.audit
WHERE
action_name IN ("createTable", "getTable", "updateTable", "deleteTable")
AND (
-- For performance, limit the blast radius of the audit log query to only the current catalog
request_params.catalog_name = :catalog_name OR
request_params.full_name_arg LIKE :catalog_name || '%'
)
AND event_time >= DATE_SUB(current_date(), 30)
GROUP BY table_full_name
),
sensitive_tables AS (
SELECT
DISTINCT CONCAT(catalog_name, '.', schema_name, '.', table_name) AS table_full_name
FROM
system.data_classification.results
WHERE class_tag IS NOT NULL
)
SELECT
st.table_full_name,
ta.num_users
FROM
sensitive_tables st
JOIN table_accesses ta
ON st.table_full_name = ta.table_full_name