Aracılığıyla paylaş


Unity Kataloğu'nda özellik tablolarıyla çalışma

Bu sayfada Unity Kataloğu'nda özellik tablolarının nasıl oluşturulacağı ve bunlarla nasıl çalışıldığı açıklanmaktadır.

Bu sayfa yalnızca Unity Kataloğu için etkinleştirilmiş çalışma alanları için geçerlidir. Çalışma alanınız Unity Kataloğu için etkinleştirilmediyse bkz. Çalışma Alanı Özellik Deposu'nda (eski) özellik tablolarıyla çalışma.

Örneklerde kullanılan komutlar ve parametreler hakkında ayrıntılı bilgi için Özellik Mühendisliği Python API başvurusuna bakın.

Gereksinimler

Unity Kataloğu'nda Özellik Mühendisliği için Databricks Runtime 13.2 veya üzeri gerekir. Ayrıca Unity Kataloğu meta veri deposunun Privilege Model Sürüm 1.0'a sahip olması gerekir.

Unity Kataloğu Python istemcisinde Özellik Mühendisliği'ni yükleme

Unity Kataloğu'nda Özellik Mühendisliği'nin bir Python istemcisi FeatureEngineeringClientvardır. Sınıf, PyPI üzerinde databricks-feature-engineering paketiyle kullanılabilir ve Databricks Runtime 13.3 LTS ML ve üzeri sürümlerde önceden yüklenmiştir. ML olmayan bir Databricks Runtime kullanıyorsanız istemciyi el ile yüklemeniz gerekir. Databricks Runtime sürümünüz için doğru sürümü bulmak için uyumluluk matrisini kullanın.

%pip install databricks-feature-engineering

dbutils.library.restartPython()

Unity Kataloğu'nda özellik tabloları için katalog ve şema oluşturma

Özellik tabloları için yeni bir katalog oluşturmanız veya mevcut bir kataloğu kullanmanız gerekir.

Yeni bir katalog oluşturmak için meta veri deposunda ayrıcalığınız CREATE CATALOGolmalıdır.

CREATE CATALOG IF NOT EXISTS <catalog-name>

Mevcut bir kataloğu kullanmak için katalogda ayrıcalığınız USE CATALOG olmalıdır.

USE CATALOG <catalog-name>

Unity Kataloğu'ndaki özellik tabloları bir şemada depolanmalıdır. Katalogda yeni bir şema oluşturmak için, katalogda ayrıcalığınız CREATE SCHEMA olmalıdır.

CREATE SCHEMA IF NOT EXISTS <schema-name>

Unity Kataloğu'nda özellik tablosu oluşturma

Not

Unity Kataloğu'nda özellik tablosu olarak birincil anahtar kısıtlaması içeren mevcut bir Delta tablosunu kullanabilirsiniz. Tabloda tanımlanmış bir birincil anahtar yoksa, kısıtlamayı eklemek için DDL deyimlerini kullanarak ALTER TABLE tabloyu güncelleştirmeniz gerekir. Bkz . Unity Kataloğu'nda var olan bir Delta tablosunu özellik tablosu olarak kullanma.

Ancak, bir akış tablosuna birincil anahtar veya Lakeflow Bildirimli İşlem Hatları tarafından Unity Kataloğu'nda yayımlanan gerçekleştirilmiş görünüm eklemek için akış tablosunun şemasının değiştirilmesi veya gerçekleştirilmiş görünüm tanımının birincil anahtarı içerecek şekilde değiştirilmesi ve ardından akış tablosunun veya gerçekleştirilmiş görünümün yenilenmesi gerekir. Bkz. Lakeflow Bildirimli İşlem Hatları tarafından oluşturulan bir akış tablosunu veya materyalize edilmiş bir görünümü, özellik tablosu olarak kullanma.

Unity Kataloğu'ndaki özellik tabloları Delta tablolarıdır. Özellik tablolarında birincil anahtar bulunmalıdır. Unity Kataloğu'ndaki diğer veri varlıkları gibi özellik tablolarına üç düzeyli bir ad alanı kullanılarak erişilir: <catalog-name>.<schema-name>.<table-name>.

Unity Kataloğu'nda özellik tabloları oluşturmak için Databricks SQL, Python FeatureEngineeringClientveya Lakeflow Bildirimli İşlem Hatlarını kullanabilirsiniz.

Databricks SQL

Birincil anahtar kısıtlaması olan herhangi bir Delta tablosunu özellik tablosu olarak kullanabilirsiniz. Aşağıdaki kodda birincil anahtarla tablo oluşturma gösterilmektedir:

CREATE TABLE ml.recommender_system.customer_features (
  customer_id int NOT NULL,
  feat1 long,
  feat2 varchar(100),
  CONSTRAINT customer_features_pk PRIMARY KEY (customer_id)
);

Zaman serisi özellik tablosu oluşturmak için, birincil anahtar sütunu olarak bir saat sütunu ekleyin ve TIMESERIES anahtar sözcüğünü belirtin. TIMESERIES anahtar sözcüğü Databricks Runtime 13.3 LTS veya üzerini gerektirir.

CREATE TABLE ml.recommender_system.customer_features (
  customer_id int NOT NULL,
  ts timestamp NOT NULL,
  feat1 long,
  feat2 varchar(100),
  CONSTRAINT customer_features_pk PRIMARY KEY (customer_id, ts TIMESERIES)
);

Tablo oluşturulduktan sonra, diğer Delta tabloları gibi bu tabloya da veri yazabilirsiniz ve özellik tablosu olarak kullanılabilir.

Piton

Aşağıdaki örneklerde kullanılan komutlar ve parametreler hakkında ayrıntılı bilgi için Özellik Mühendisliği Python API başvuru bölümüne bakın.

  1. Özellikleri hesaplamak için Python işlevlerini yazın. Her işlevin çıkışı, benzersiz bir birincil anahtara sahip bir Apache Spark DataFrame olmalıdır. Birincil anahtar bir veya daha fazla sütundan oluşabilir.
  2. FeatureEngineeringClient'ı başlatarak ve create_table kullanarak bir özellik tablosu oluşturun.
  3. write_tablekullanarak özellik tablosunu doldurun.
from databricks.feature_engineering import FeatureEngineeringClient

fe = FeatureEngineeringClient()

# Prepare feature DataFrame
def compute_customer_features(data):
  ''' Feature computation code returns a DataFrame with 'customer_id' as primary key'''
  pass

customer_features_df = compute_customer_features(df)

# Create feature table with `customer_id` as the primary key.
# Take schema from DataFrame output by compute_customer_features
customer_feature_table = fe.create_table(
  name='ml.recommender_system.customer_features',
  primary_keys='customer_id',
  schema=customer_features_df.schema,
  description='Customer features'
)

# An alternative is to use `create_table` and specify the `df` argument.
# This code automatically saves the features to the underlying Delta table.

# customer_feature_table = fe.create_table(
#  ...
#  df=customer_features_df,
#  ...
# )

# To use a composite primary key, pass all primary key columns in the create_table call

# customer_feature_table = fe.create_table(
#   ...
#   primary_keys=['customer_id', 'date'],
#   ...
# )

# To create a time series table, set the timeseries_columns argument

# customer_feature_table = fe.create_table(
#   ...
#   primary_keys=['customer_id', 'date'],
#   timeseries_columns='date',
#   ...
# )

Lakeflow Bildirimli İşlem Hatları ile Unity Kataloğu'nda özellik tablosu oluşturma

Not

Tablo kısıtlamaları için Lakeflow Bildirimli İşlem Hatları desteği Genel Önizleme aşamasındadır. Aşağıdaki kod örnekleri Lakeflow Bildirimli İşlem Hatları önizleme kanalı kullanılarak çalıştırılmalıdır.

Lakeflow Bildirimli İşlem Hatlarından yayımlanan ve birincil anahtar kısıtlaması içeren tüm tablolar özellik tablosu olarak kullanılabilir. Birincil anahtara sahip bir işlem hattında tablo oluşturmak için Databricks SQL veya Lakeflow Bildirimli İşlem Hatları Python programlama arabirimini kullanabilirsiniz.

Birincil anahtara sahip bir işlem hattında tablo oluşturmak için aşağıdaki söz dizimini kullanın:

Databricks SQL

CREATE MATERIALIZED VIEW customer_features (
  customer_id int NOT NULL,
  feat1 long,
  feat2 varchar(100),
  CONSTRAINT customer_features_pk PRIMARY KEY (customer_id)
) AS SELECT * FROM ...;

Piton

import dlt

@dlt.table(
  schema="""
          customer_id int NOT NULL,
          feat1 long,
          feat2 varchar(100),
          CONSTRAINT customer_features_pk PRIMARY KEY (customer_id)
    """)
def customer_features():
  return ...

Zaman serisi özellik tablosu oluşturmak için, birincil anahtar sütunu olarak bir saat sütunu ekleyin ve TIMESERIES anahtar sözcüğünü belirtin.

Databricks SQL

CREATE MATERIALIZED VIEW customer_features (
  customer_id int NOT NULL,
  ts timestamp NOT NULL,
  feat1 long,
  feat2 varchar(100),
  CONSTRAINT customer_features_pk PRIMARY KEY (customer_id, ts TIMESERIES)
) AS SELECT * FROM ...;

Piton

import dlt

@dlt.table(
  schema="""
    customer_id int NOT NULL,
    ts timestamp NOT NULL,
    feat1 long,
    feat2 varchar(100),
    CONSTRAINT customer_features_pk PRIMARY KEY (customer_id, ts TIMESERIES)
    """)
def customer_features():
  return ...

Tablo oluşturulduktan sonra, diğer Lakeflow Bildirimli İşlem Hatları veri kümeleri gibi ona veri yazabilirsiniz ve bir özellik tablosu olarak kullanılabilir.

Unity Kataloğu'nda var olan bir Delta tablosunu özellik tablosu olarak kullanma

Unity Kataloğu'nda birincil anahtara sahip herhangi bir Delta tablosu Unity Kataloğu'ndaki bir özellik tablosu olabilir ve özellikler kullanıcı arabirimini ve API'sini tabloyla birlikte kullanabilirsiniz.

Not

  • Yalnızca tablo sahibi birincil anahtar kısıtlamalarını bildirebilir. Sahibin adı Katalog Gezgini'nin tablo ayrıntı sayfasında görüntülenir.
  • Delta tablosundaki veri türünün Unity Kataloğu'nda Özellik Mühendisliği tarafından desteklendiğini doğrulayın. Bkz. Desteklenen veri türleri.
  • TIMESERIES anahtar sözcüğü Databricks Runtime 13.3 LTS veya üzerini gerektirir.

Mevcut bir Delta tablosunun birincil anahtar kısıtlaması yoksa aşağıdaki gibi bir tane oluşturabilirsiniz:

  1. Birincil anahtar sütunlarını olarak NOT NULLayarlayın. Her birincil anahtar sütunu için şunu çalıştırın:

    ALTER TABLE <full_table_name> ALTER COLUMN <pk_col_name> SET NOT NULL
    
  2. Birincil anahtar kısıtlamasını eklemek için tabloyu değiştirin:

    ALTER TABLE <full_table_name> ADD CONSTRAINT <pk_name> PRIMARY KEY(pk_col1, pk_col2, ...)
    

    pk_name birincil anahtar kısıtlamasının adıdır. Kurala göre, tablo adını (şema ve katalog olmadan) bir _pk sonekle kullanabilirsiniz. Örneğin, adı "ml.recommender_system.customer_features" olan bir tablonun birincil anahtar kısıtlamasının adı customer_features_pk olurdu.

    Tabloyu bir zaman serisi özellik tablosu yapmak için, birincil anahtar sütunlarından birinde TIMESERIES anahtar sözcüğünü aşağıdaki gibi belirtin:

    ALTER TABLE <full_table_name> ADD CONSTRAINT <pk_name> PRIMARY KEY(pk_col1 TIMESERIES, pk_col2, ...)
    

    Tabloya birincil anahtar kısıtlamasını ekledikten sonra, tablo Özellikler kullanıcı arabiriminde görünür ve bunu özellik tablosu olarak kullanabilirsiniz.

Lakeflow Bildirimli İşlem Hatları tarafından oluşturulan bir akış tablosunu veya gerçekleştirilmiş görünümü özellik tablosu olarak kullanma

Birincil anahtara sahip Unity Kataloğu'ndaki herhangi bir akış tablosu veya gerçekleştirilmiş görünüm, Unity Kataloğu'ndaki bir özellik tablosu olabilir ve özellikler kullanıcı arabirimini ve API'sini tabloyla birlikte kullanabilirsiniz.

Not

  • Tablo kısıtlamaları için Lakeflow Bildirimli İşlem Hatları desteği Genel Önizleme aşamasındadır. Aşağıdaki kod örnekleri Lakeflow Bildirimli İşlem Hatları önizleme kanalı kullanılarak çalıştırılmalıdır.
  • Yalnızca tablo sahibi birincil anahtar kısıtlamalarını bildirebilir. Sahibin adı Katalog Gezgini'nin tablo ayrıntı sayfasında görüntülenir.
  • Unity Kataloğu'nda Özellik Mühendisliği'nin Delta tablosundaki veri türünü desteklediğini doğrulayın. Bkz. Desteklenen veri türleri.

Mevcut bir akış tablosunun veya gerçekleştirilmiş görünümün birincil anahtarlarını ayarlamak için, akış tablosunun şemasını veya nesneyi yöneten not defterinde gerçekleştirilmiş görünümü güncelleştirin. Ardından Unity Kataloğu nesnesini güncelleştirmek için tabloyu yenileyin.

Gerçekleştirilmiş görünüme birincil anahtar ekleme söz dizimi aşağıdadır:

Databricks SQL

CREATE OR REFRESH MATERIALIZED VIEW existing_live_table(
  id int NOT NULL PRIMARY KEY,
  ...
) AS SELECT ...

Piton

import dlt

@dlt.table(
  schema="""
    id int NOT NULL PRIMARY KEY,
    ...
    """
)
def existing_live_table():
  return ...

Unity Kataloğu'nda var olan bir görünümü özellik tablosu olarak kullanma

Görünümü özellik tablosu olarak kullanmak için Databricks Runtime 16.0 ML'de yerleşik olarak bulunan databricks-feature-engineering sürüm 0.7.0 veya üzerini kullanmanız gerekir.

Unity Kataloğu'ndaki basit bir SELECT görünümü, Unity Kataloğu'ndaki bir özellik tablosu olabilir ve Özellikler API'sini tabloyla birlikte kullanabilirsiniz.

Not

  • Basit bir SELECT görünümü, Unity Kataloğu'nda özellik tablosu olarak kullanılabilen ve birincil anahtarları JOIN, GROUP BYveya DISTINCT yan tümceleri olmadan seçilen tek bir Delta tablosundan oluşturulmuş bir görünüm olarak tanımlanır. SQL deyimindeki kabul edilebilir anahtar sözcükler SELECT, FROM, WHERE, ORDER BY, LIMITve OFFSET.
  • Desteklenen veri türleri için 'a bakın.
  • Görünümler tarafından desteklenen özellik tabloları Features UI'da görünmez.
  • Kaynak Delta tablosunda sütunlar yeniden adlandırılırsa, görünüm tanımının SELECT deyimindeki sütunlar eşleşecek şekilde yeniden adlandırılmalıdır.

Özellik tablosu olarak kullanılabilecek basit bir SELECT görünümü örneği aşağıda verilmiştir:

CREATE OR REPLACE VIEW ml.recommender_system.content_recommendation_subset AS
SELECT
    user_id,
    content_id,
    user_age,
    user_gender,
    content_genre,
    content_release_year,
    user_content_watch_duration,
    user_content_like_dislike_ratio
FROM
    ml.recommender_system.content_recommendations_features
WHERE
    user_age BETWEEN 18 AND 35
    AND content_genre IN ('Drama', 'Comedy', 'Action')
    AND content_release_year >= 2010
    AND user_content_watch_duration > 60;

Görünümleri temel alan özellik tabloları çevrimdışı model eğitimi ve değerlendirmesi için kullanılabilir. Çevrimiçi mağazalarda yayımlanamazlar. Bu tablo ve modellerden bu özelliklere dayalı özellikler sunulamaz.

Unity Kataloğu'nda özellik tablosunu güncelleştirme

Unity Kataloğu'nda yeni özellikler ekleyerek veya birincil anahtara göre belirli satırları değiştirerek özellik tablosunu güncelleştirebilirsiniz.

Aşağıdaki özellik tablosu meta verileri güncelleştirilmemelidir:

  • Birincil anahtar.
  • Bölümlendirme anahtarı.
  • Mevcut bir özelliğin adı veya veri türü.

Bunların değiştirilmesi, modelleri eğitme ve sunma için özellikleri kullanan alt işlem hatlarının bozulmasına neden olur.

Unity Kataloğu'nda var olan bir özellik tablosuna yeni özellikler ekleme

Mevcut bir özellik tablosuna yeni özellikler eklemek için şu iki yöntemden birini kullanabilirsiniz:

  • Mevcut özellik hesaplama işlevini güncelleştirin ve döndürülen DataFrame ile write_table çalıştırın. Bu, özellik tablosu şemasını güncelleştirir ve yeni özellik değerlerini birincil anahtara göre birleştirir.
  • Yeni özellik değerlerini hesaplamak için yeni bir özellik hesaplama işlevi oluşturun. Bu yeni hesaplama işlevi tarafından döndürülen DataFrame, özellik tablolarının birincil ve bölüm anahtarlarını (tanımlandıysa) içermelidir. Aynı birincil anahtarı kullanarak yeni özellikleri mevcut özellik tablosuna yazmak için DataFrame ile komutunu çalıştırın write_table .

Özellik tablosunda yalnızca belirli satırları güncelleştirme

mode = "merge" kullanın write_table içinde. Çağrıda write_table gönderilen DataFrame'de birincil anahtarı olmayan satırlar değişmeden kalır.

from databricks.feature_engineering import FeatureEngineeringClient
fe = FeatureEngineeringClient()
fe.write_table(
  name='ml.recommender_system.customer_features',
  df = customer_features_df,
  mode = 'merge'
)

Bir özellik tablosunu güncellemek için bir iş planla

Özellik tablolarındaki özelliklerin her zaman en son değerlere sahip olduğundan emin olmak için Databricks, özellik tablonuzu her gün gibi düzenli aralıklarla güncelleştirmek için not defteri çalıştıran bir iş oluşturmanızı önerir. Önceden oluşturulmuş zamanlanmamış bir işiniz varsa, özellik değerlerinin her zaman güncel olduğundan emin olmak için bunu zamanlanmış bir işe dönüştürebilirsiniz. Bakınız Lakeflow İşleri.

Bir özellik tablosunu güncelleştirme kodu, aşağıdaki örnekte gösterildiği gibi mode='merge'kullanır.

from databricks.feature_engineering import FeatureEngineeringClient
fe = FeatureEngineeringClient()

customer_features_df = compute_customer_features(data)

fe.write_table(
  df=customer_features_df,
  name='ml.recommender_system.customer_features',
  mode='merge'
)

Günlük özelliklerin geçmiş değerlerini depolama

Bileşik birincil anahtarla bir özellik tablosu tanımlayın. Birincil anahtara tarih ekleyin. Örneğin, customer_featuresbir özellik tablosu için, etkili okumalar için bileşik birincil anahtar (date, customer_id) ve bölüm anahtarı date kullanabilirsiniz.

Databricks, verimli okumalar için tabloda sıvı kümelediğini etkinleştirmenizi önerir. Sıvı kümelemesi kullanmıyorsanız, daha iyi okuma performansı için tarih sütununu bölüm anahtarı olarak ayarlayın.

Databricks SQL

CREATE TABLE ml.recommender_system.customer_features (
  customer_id int NOT NULL,
  `date` date NOT NULL,
  feat1 long,
  feat2 varchar(100),
  CONSTRAINT customer_features_pk PRIMARY KEY (`date`, customer_id)
)
-- If you are not using liquid clustering, uncomment the following line.
-- PARTITIONED BY (`date`)
COMMENT "Customer features";

Piton

from databricks.feature_engineering import FeatureEngineeringClient
fe = FeatureEngineeringClient()
fe.create_table(
  name='ml.recommender_system.customer_features',
  primary_keys=['date', 'customer_id'],
  # If you are not using liquid clustering, uncomment the following line.
  # partition_columns=['date'],
  schema=customer_features_df.schema,
  description='Customer features'
)

Ardından, date'ı filtreleyerek ilgilendiğiniz zaman aralığını özellik tablosundan okumak için kod oluşturabilirsiniz.

Zaman serisi özellik tablosu oluşturabilir ve veya create_training_set kullanırken belirli bir zamandaki aramaları etkinleştirebilirsiniz. Bkz . Unity Kataloğu'nda özellik tablosu oluşturma.

Özellik tablosunu güncel tutmak için, özellik yazmak veya yeni özellik değerlerini özellik tablosuna akışla aktarmak için düzenli olarak zamanlanmış bir iş ayarlayın.

Özellikleri güncelleştirmek için bir akış tabanlı hesaplama boru hattı oluşturun.

Akış özelliği hesaplama işlem hattı oluşturmak için DataFrame'yu bağımsız değişken olarak write_table'e geçirin. Bu yöntem bir StreamingQuery nesne döndürür.

def compute_additional_customer_features(data):
  ''' Returns Streaming DataFrame
  '''
  pass

from databricks.feature_engineering import FeatureEngineeringClient
fe = FeatureEngineeringClient()

customer_transactions = spark.readStream.table("prod.events.customer_transactions")
stream_df = compute_additional_customer_features(customer_transactions)

fe.write_table(
  df=stream_df,
  name='ml.recommender_system.customer_features',
  mode='merge'
)

Unity Kataloğu'ndaki bir özellik tablosundan okuma

Özellik değerlerini okumak için read_table kullanın.

from databricks.feature_engineering import FeatureEngineeringClient
fe = FeatureEngineeringClient()
customer_features_df = fe.read_table(
  name='ml.recommender_system.customer_features',
)

Unity Kataloğu'nda özellik tablolarını arama ve göz atma

Unity Kataloğu'nda özellik tablolarını aramak veya göz atmak için Özellikler kullanıcı arabirimini kullanın.

  1. Özellikler kullanıcı arabirimini görüntülemek için kenar çubuğunda Özellik Mağazası Simgesi ve Özellikler üzerine tıklayın.

  2. Katalogdaki tüm kullanılabilir özellik tablolarını görüntülemek için katalog seçicisi olan kataloğu seçin. Arama kutusuna özellik tablosunun, özelliğin veya açıklamanın adının tamamını veya bir bölümünü girin. Ayrıca, bir etiketin anahtarının veya değerinin tamamını veya bir kısmını da girebilirsiniz. Arama metninde büyük-küçük harf farkı yoktur.

    Özellik arama örneği

Unity Kataloğu'nda özellik tablolarının meta verilerini alma

Özellik tablosu meta verilerini almak için get_table kullanın.

from databricks.feature_engineering import FeatureEngineeringClient
fe = FeatureEngineeringClient()
ft = fe.get_table(name="ml.recommender_system.user_feature_table")
print(ft.features)

Unity Kataloğu'nda özellik tabloları ve özelliklerle etiketler kullanma

Özellik tablolarınızı ve özelliklerinizi kategorilere ayırmak ve yönetmek için basit anahtar-değer çiftleri olan etiketleri kullanabilirsiniz.

Özellik tabloları için Katalog Gezgini'ni, not defterindeki VEYA SQL sorgu düzenleyicisindeki SQL deyimlerini veya Özellik Mühendisliği Python API'sini kullanarak etiket oluşturabilir, düzenleyebilir ve silebilirsiniz.

Özellikler için, bir not defterinde veya SQL sorgu düzenleyicisinde Katalog Gezgini'ni veya SQL deyimlerini kullanarak etiket oluşturabilir, düzenleyebilir ve silebilirsiniz.

Bkz. Unity Kataloğu güvenli hale getirilebilir nesnelere ve Python API'sine etiket uygulama.

Aşağıdaki örnekte özellik tablosu etiketlerini oluşturmak, güncelleştirmek ve silmek için Özellik Mühendisliği Python API'sinin nasıl kullanılacağı gösterilmektedir.

from databricks.feature_engineering import FeatureEngineeringClient
fe = FeatureEngineeringClient()

# Create feature table with tags
customer_feature_table = fe.create_table(
  # ...
  tags={"tag_key_1": "tag_value_1", "tag_key_2": "tag_value_2", ...},
  # ...
)

# Upsert a tag
fe.set_feature_table_tag(name="customer_feature_table", key="tag_key_1", value="new_key_value")

# Delete a tag
fe.delete_feature_table_tag(name="customer_feature_table", key="tag_key_2")

Unity Kataloğu'nda özellik tablosunu silme

Unity Kataloğu'nda bir özellik tablosunu, Katalog Gezgini'ni veya Özellik Mühendisliği Python API'sini kullanarak Unity Kataloğu'ndaki Delta tablosunu doğrudan silerek silebilirsiniz.

Not

  • Özellik tablosunun silinmesi, yukarı akış üreticilerinde ve aşağı akış tüketicilerinde (modeller, uç noktalar ve zamanlanmış işler) beklenmeyen hatalara yol açabilir. Yayımlanan çevrimiçi mağazaları bulut sağlayıcınızla birlikte silmeniz gerekir.
  • Unity Kataloğu'nda bir özellik tablosunu sildiğinizde, temel delta tablosu da bırakılır.
  • drop_table Databricks Runtime 13.1 ML veya altında desteklenmez. Tabloyu silmek için SQL komutunu kullanın.

Databricks SQL'i kullanabilir veya FeatureEngineeringClient.drop_table Unity Kataloğu'nda bir özellik tablosunu silebilirsiniz:

Databricks SQL

DROP TABLE ml.recommender_system.customer_features;

Piton

from databricks.feature_engineering import FeatureEngineeringClient
fe = FeatureEngineeringClient()
fe.drop_table(
  name='ml.recommender_system.customer_features'
)

Unity Kataloğu'nda çalışma alanları veya hesaplar arasında özellik tablosu paylaşma

Unity Catalog'daki bir özellik tablosu, Unity Catalog'un meta deposuna atanan tüm çalışma alanları tarafından erişilebilir.

Özellik tablosunu aynı Unity Kataloğu meta deposuna atanmamış çalışma alanlarıyla paylaşmak için Delta Sharing'i kullanın.

Örnek not defterleri

Temel not defteri özellik tablosu oluşturmayı, modeli eğitmek için kullanmayı ve otomatik özellik aramasını kullanarak toplu puanlama çalıştırmayı gösterir. Ayrıca özellik aramak ve özelliklerin nasıl oluşturulduğunu ve kullanıldığını anlamak için kullanabileceğiniz Özellik Mühendisliği kullanıcı arabirimini de gösterir.

Unity Kataloğu'nda Temel Özellik Mühendisliği örnek not defteri

Dizüstü bilgisayar al

Taksi örneği not defteri, özellik oluşturma, bunları güncelleştirme ve model eğitimi ve toplu çıkarım için kullanma sürecini gösterir.

Unity Kataloğu'nda Özellik Mühendisliği taksi örneği defteri

Dizüstü bilgisayar al