Bagikan melalui


Menampilkan silsilah penyimpanan fitur

Saat Anda mencatat model menggunakan FeatureEngineeringClient.log_model, fitur yang digunakan dalam model secara otomatis dilacak dan dapat dilihat di tab Silsilah Data di Catalog Explorer. Selain tabel fitur, UDF Python yang digunakan untuk menghitung fitur sesuai permintaan juga dilacak.

Cara mengambil silsilah data tabel fitur, fungsi, atau model

Tabel dan fungsi fitur pelacakan informasi silsilah data yang digunakan dalam model secara otomatis diambil saat Anda memanggil log_model. Lihat contoh kode berikut.

from databricks.feature_engineering import FeatureEngineeringClient, FeatureLookup, FeatureFunction
fe = FeatureEngineeringClient()

features = [
    FeatureLookup(
        table_name = "main.on_demand_demo.restaurant_features",
        feature_names = ["latitude", "longitude"],
        rename_outputs={"latitude": "restaurant_latitude", "longitude": "restaurant_longitude"},
        lookup_key = "restaurant_id",
        timestamp_lookup_key = "ts"
    ),
    FeatureFunction(
        udf_name="main.on_demand_demo.extract_user_latitude",
        output_name="user_latitude",
        input_bindings={"blob": "json_blob"},
    ),
    FeatureFunction(
        udf_name="main.on_demand_demo.extract_user_longitude",
        output_name="user_longitude",
        input_bindings={"blob": "json_blob"},
    ),
    FeatureFunction(
        udf_name="main.on_demand_demo.haversine_distance",
        output_name="distance",
        input_bindings={"x1": "restaurant_longitude", "y1": "restaurant_latitude", "x2": "user_longitude", "y2": "user_latitude"},
    )
]

training_set = fe.create_training_set(
    label_df, feature_lookups=features, label="label", exclude_columns=["restaurant_id", "json_blob", "restaurant_latitude", "restaurant_longitude", "user_latitude", "user_longitude", "ts"]
)

class IsClose(mlflow.pyfunc.PythonModel):
    def predict(self, ctx, inp):
        return (inp['distance'] < 2.5).values

model_name = "fe_packaged_model"
mlflow.set_registry_uri("databricks-uc")

fe.log_model(
    IsClose(),
    model_name,
    flavor=mlflow.pyfunc,
    training_set=training_set,
    registered_model_name=registered_model_name
)

Menampilkan silsilah tabel fitur, model, atau fungsi

Untuk melihat silsilah tabel fitur, model, atau fungsi, ikuti langkah-langkah berikut:

  1. Navigasi ke tabel, versi model, atau halaman fungsi di Catalog Explorer.

  2. Pilih tab Silsilah data. Bilah sisi kiri memperlihatkan komponen Katalog Unity yang dicatat dengan tabel, versi model, atau fungsi ini.

    Lineage tab on model page in Catalog Explorer

  3. Klik Lihat grafik silsilah data. Grafik silsilah muncul. Untuk detail tentang menjelajahi grafik silsilah data, lihat Menangkap dan menjelajahi silsilah data.

    lineage screen

  4. Untuk menutup grafik silsilah data, klik close button for lineage graph di sudut kanan atas.