Tata kelola fitur dan keturunan

Halaman ini menjelaskan kemampuan tata kelola dan rekayasa fitur serta silsilah di Unity Catalog.

Untuk informasi tentang memantau performa model yang dilayani dan perubahan data tabel fitur, lihat Pembuatan profil data.

Mengontrol akses ke tabel fitur

Kontrol akses untuk tabel fitur di Unity Catalog dikelola oleh Unity Catalog. Lihat izin Unity Catalog .

Menampilkan tabel fitur, fungsi, dan silsilah model

Saat Anda mencatat model menggunakan , fitur yang digunakan dalam model secara otomatis dilacak dan dapat dilihat di tab Silsilah dari Catalog Explorer. Selain tabel fitur, UDF Python yang digunakan untuk menghitung fitur sesuai permintaan juga dilacak.

Cara mengambil silsilah data tabel fitur, fungsi, atau model

Fitur pelacakan informasi silsilah data, termasuk tabel dan fungsi yang digunakan dalam model, secara otomatis dicatat saat Anda memanggil log_model. Lihat contoh kode berikut.

from databricks.feature_engineering import FeatureEngineeringClient, FeatureLookup, FeatureFunction
fe = FeatureEngineeringClient()

features = [
    FeatureLookup(
        table_name = "main.on_demand_demo.restaurant_features",
        feature_names = ["latitude", "longitude"],
        rename_outputs={"latitude": "restaurant_latitude", "longitude": "restaurant_longitude"},
        lookup_key = "restaurant_id",
        timestamp_lookup_key = "ts"
    ),
    FeatureFunction(
        udf_name="main.on_demand_demo.extract_user_latitude",
        output_name="user_latitude",
        input_bindings={"blob": "json_blob"},
    ),
    FeatureFunction(
        udf_name="main.on_demand_demo.extract_user_longitude",
        output_name="user_longitude",
        input_bindings={"blob": "json_blob"},
    ),
    FeatureFunction(
        udf_name="main.on_demand_demo.haversine_distance",
        output_name="distance",
        input_bindings={"x1": "restaurant_longitude", "y1": "restaurant_latitude", "x2": "user_longitude", "y2": "user_latitude"},
    )
]

training_set = fe.create_training_set(
    label_df, feature_lookups=features, label="label", exclude_columns=["restaurant_id", "json_blob", "restaurant_latitude", "restaurant_longitude", "user_latitude", "user_longitude", "ts"]
)

class IsClose(mlflow.pyfunc.PythonModel):
    def predict(self, ctx, inp):
        return (inp['distance'] < 2.5).values

model_name = "fe_packaged_model"
mlflow.set_registry_uri("databricks-uc")

fe.log_model(
    IsClose(),
    model_name,
    flavor=mlflow.pyfunc,
    training_set=training_set,
    registered_model_name=registered_model_name
)

Menampilkan silsilah tabel fitur, model, atau fungsi

Untuk melihat silsilah tabel fitur, model, atau fungsi, ikuti langkah-langkah berikut:

  1. Navigasi ke tabel, versi model, atau halaman fungsi di Catalog Explorer.

  2. Pilih tab Silsilah. Bilah sisi kiri memperlihatkan komponen Katalog Unity yang direkam bersama tabel, versi model, atau fungsi ini.

    Tab silsilah data pada halaman model di Catalog Explorer

  3. Klik Lihat grafik silsilah. Grafik silsilah muncul. Untuk detail tentang menjelajahi grafik silsilah data, lihat Menampilkan silsilah data menggunakan Katalog Unity.

    layar silsilah

  4. Untuk menutup grafik silsilah data, klik tombol tutup untuk grafik silsilah data di sudut kanan atas.