Aracılığıyla paylaş


Veri sınıflandırma sistemi tablo referansı

Önemli

Bu özellik Genel Önizleme aşamasındadır. Önizlemeler sayfasında önizleme kaydını onaylayabilirsiniz. Bkz. Azure Databricks önizlemelerini yönetme.

Bu sayfa, veri sınıflandırma sonuçları tablosu şemasını özetler ve örnek sorgular içerir. Tablo, meta veri deponuzdaki etkin kataloglar arasında sütun düzeyinde hassas veri sınıflarına yönelik algılamaları depolar.

Tablo yolu: system.data_classification.results

Veri sınıflandırma sonuçları tablo şeması

Veri sınıflandırma sonuçları sistem tablosu aşağıdaki şemayı kullanır:

Sütun adı Veri türü Description Example
latest_detected_time Tarih damgası Sütunun en son taranma zamanı geldi. 2025-06-27T12:34
first_detected_time Tarih damgası Sütun algılamasının ilk kez kaydedildiği zaman. 2025-06-27T12:34
catalog_id String Kataloğun ID'si. 3f1a7d6e-9c59-...
table_id String Tablonun kimliği. 3f1a7d6e-9c59-...
catalog_name String Katalog adı. main_catalog
schema_name String Şema adı. public
table_name String Tablo adı. sales_data
column_name String Sütun adı. customer_email
data_type String Sütunun veri türü. Karmaşık türler tam yapı tanımlarını içerir. struct<name:string, age:int>
class_tag String Algılanan varlık veya etiket anahtarı ve isteğe bağlı değer için etiket. class.us_ssn veya pii: confidential
samples array<string> Algılamaya eşleşen en fazla beş örnek değer. ["a@b.com", ...]
confidence String Algılama güvenilirliği. ya da HIGHLOW HIGH
frequency yüzmek Örnekte eşleşen satırların oranını tahmin etme. 0 ile 1 arasında. 0.87

Örnek sorgular

Çalıştırmadan önce parametre değerlerini kendi değerlerinizle değiştirin.

Bir tablo için tüm tespitleri al

SELECT *
FROM system.data_classification.results
WHERE
  catalog_name = "c"
  AND schema_name = "s"
  AND table_name = "t";

Tüm yüksek güvenilirlikteki tespitleri al

SELECT *
FROM system.data_classification.results
WHERE
  catalog_name = "c"
  AND schema_name = "s"
  AND table_name = "t"
  AND confidence = "HIGH";

Belirli bir sınıflandırmadan etkilenen tablo sayısını alma

SELECT
  class_tag,
  COUNT(DISTINCT catalog_name, schema_name, table_name) AS num_tables
FROM
  system.data_classification.results
WHERE
  class_tag IS NOT NULL
GROUP BY class_tag;

Son 30 gün içinde hassas verilerle tabloları sorgulayan kullanıcı sayısını alma

WITH table_accesses AS (
  SELECT
    IFNULL(
      request_params.full_name_arg,
      CONCAT(request_params.catalog_name, '.', request_params.schema_name, '.', request_params.name)
    ) AS table_full_name,
    COUNT(DISTINCT user_identity.email) AS num_users
  FROM
    system.access.audit
  WHERE
    action_name IN ("createTable", "getTable", "updateTable", "deleteTable")
    AND (
      -- For performance, limit the blast radius of the audit log query to only the current catalog
      request_params.catalog_name = :catalog_name OR
      request_params.full_name_arg LIKE :catalog_name || '%'
    )
    AND event_time >= DATE_SUB(current_date(), 30)
  GROUP BY table_full_name
),
sensitive_tables AS (
  SELECT
    DISTINCT CONCAT(catalog_name, '.', schema_name, '.', table_name) AS table_full_name
  FROM
    system.data_classification.results
  WHERE class_tag IS NOT NULL
)

SELECT
  st.table_full_name,
  ta.num_users
FROM
  sensitive_tables st
  JOIN table_accesses ta
  ON st.table_full_name = ta.table_full_name