Catatan rilis untuk rekayasa fitur Databricks dan penyimpanan fitur ruang kerja warisan
Halaman ini mencantumkan rilis Rekayasa Fitur Databricks di klien Unity Catalog dan klien Penyimpanan Fitur Ruang Kerja Databricks. Kedua klien tersedia di PyPI sebagai databricks-feature-engineering.
Pustaka digunakan untuk:
- Membuat, membaca, dan menulis tabel fitur.
- Melatih model pada data fitur.
- Menerbitkan tabel fitur ke penyimpanan online untuk penyajian secara real-time.
Untuk dokumentasi penggunaan, lihat Penyimpanan Fitur Databricks. Untuk dokumentasi Python API, lihat Python API.
Rekayasa Fitur di klien Katalog Unity berfungsi untuk fitur dan tabel fitur di Katalog Unity. Klien Penyimpanan Fitur Ruang Kerja berfungsi untuk fitur dan tabel fitur di Penyimpanan Fitur Ruang Kerja. Kedua klien telah diinstal sebelumnya di Databricks Runtime untuk Pembelajaran Mesin. Mereka juga dapat berjalan pada Databricks Runtime setelah menginstal databricks-feature-engineering
dari PyPI (pip install databricks-feature-engineering
). Hanya untuk pengujian unit, kedua klien dapat digunakan secara lokal atau di lingkungan CI/CD.
Untuk tabel yang memperlihatkan kompatibilitas versi klien dengan versi Databricks Runtime dan Databricks Runtime ML, lihat matriks kompatibilitas Rekayasa Fitur. Versi lama klien Penyimpanan Fitur Ruang Kerja Databricks tersedia di PyPI sebagai databricks-feature-store.
databricks-feature-engineering 0.7.0
- Tampilan tertentu di Unity Catalog sekarang dapat digunakan sebagai tabel fitur untuk pelatihan dan evaluasi model offline. Lihat Membaca dari tabel fitur di Katalog Unity.
- Set pelatihan sekarang dapat dibuat dengan pencarian fitur atau spesifikasi fitur. Lihat referensi Python SDK.
databricks-feature-engineering 0.6.0
- Menjalankan gabungan point-in-time dengan Spark asli sekarang didukung, selain dukungan yang ada dengan Tempo. Terima kasih banyak kepada Semyon Sinchenko karena telah menyarankan idenya!
StructType
sekarang didukung sebagai jenis data PySpark.StructType
tidak didukung untuk melayani online.write_table
sekarang mendukung penulisan ke tabel yang mengaktifkan pengklusteran cairan .- Parameter
timeseries_columns
untukcreate_table
telah diganti namanya menjaditimeseries_column
. Alur kerja yang ada dapat terus menggunakantimeseries_columns
parameter . score_batch
sekarang mendukungenv_manager
parameter . Lihat dokumentasi MLflow untuk informasi selengkapnya.
databricks-feature-engineering 0.5.0
- API
update_feature_spec
baru didatabricks-feature-engineering
yang memungkinkan pengguna memperbarui pemilik FeatureSpec di Unity Catalog.
databricks-feature-engineering 0.4.0
- Perbaikan dan peningkatan bug kecil.
databricks-feature-engineering 0.3.0
log_model
sekarang menggunakan paket PyPI databricks-feature-lookup baru, yang mencakup peningkatan performa untuk penyajian model online.
databricks-feature-store 0.17.0
databricks-feature-store
tidak digunakan lagi. Semua modul yang ada dalam paket ini tersedia dalamdatabricks-feature-engineering
versi 0.2.0 ke atas. Untuk detailnya, lihat Python API.
databricks-feature-engineering 0.2.0
databricks-feature-engineering
sekarang berisi semua modul daridatabricks-feature-store
. Untuk detailnya, lihat Python API.
databricks-feature-store 0.16.3
- Memperbaiki bug batas waktu saat menggunakan Mosaic AutoML dengan tabel fitur.
databricks-feature-engineering 0.1.3
- Peningkatan kecil di UpgradeClient.
databricks-feature-store 0.16.2
- Sekarang Anda dapat membuat titik akhir Fitur &Fungsi Penyajian. Untuk detailnya, lihat Fitur & Penyajian Fungsi.
databricks-feature-store 0.16.1
- Perbaikan dan peningkatan bug kecil.
databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0
- Perbaikan dan peningkatan bug kecil.
- Memperbaiki URL silsilah pekerjaan yang salah yang dicatat dengan penyiapan ruang kerja tertentu.
databricks-feature-engineering 0.1.1
- Perbaikan dan peningkatan bug kecil.
databricks-feature-engineering 0.1.0
- Rilis GA Rekayasa Fitur di Klien Python Katalog Unity ke PyPI
databricks-feature-store 0.15.1
- Perbaikan dan peningkatan bug kecil.
databricks-feature-store 0.15.0
- Anda sekarang dapat secara otomatis menyimpulkan dan mencatat contoh input saat Anda mencatat model. Untuk melakukan ini, atur
infer_model_example
keTrue
saat Anda memanggillog_model
. Contohnya didasarkan pada data pelatihan yang ditentukan dalamtraining_set
parameter .
databricks-feature-store 0.14.2
- Perbaiki bug dalam penerbitan ke Aurora MySQL dari MariaDB Connector/J >=2.7.5.
databricks-feature-store 0.14.1
- Perbaikan dan peningkatan bug kecil.
databricks-feature-store 0.14.0
Dimulai dengan 0.14.0, Anda harus menentukan kolom kunci tanda waktu dalam primary_keys
argumen. Kunci tanda waktu adalah bagian dari "kunci primer" yang secara unik mengidentifikasi setiap baris dalam tabel fitur. Seperti kolom kunci utama lainnya, kolom kunci tanda waktu tidak boleh berisi nilai NULL.
Dalam contoh berikut, DataFrame user_features_df
berisi kolom berikut: user_id
, , ts
purchases_30d
, dan is_free_trial_active
.
0.14.0 ke atas
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)
0.13.1 ke bawah
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)
databricks-feature-store 0.13.1
- Perbaikan dan peningkatan bug kecil.
databricks-feature-store 0.13.0
- Versi minimum yang diperlukan
mlflow-skinny
sekarang adalah 2.4.0. - Membuat set pelatihan gagal jika DataFrame yang disediakan tidak berisi semua kunci pencarian yang diperlukan.
- Saat mencatat model yang menggunakan tabel fitur di Unity Catalog, tanda tangan MLflow secara otomatis dicatat dengan model.
databricks-feature-store 0.12.0
- Anda sekarang dapat menghapus toko online dengan menggunakan
drop_online_table
API.
databricks-feature-store 0.11.0
- Di ruang kerja yang mendukung Katalog Unity, Anda sekarang dapat menerbitkan tabel fitur ruang kerja dan Katalog Unity ke toko online Cosmos DB. Ini memerlukan Databricks Runtime 13.0 ML atau lebih tinggi.
databricks-feature-store 0.10.0
- Perbaikan dan peningkatan bug kecil.
databricks-feature-store 0.9.0
- Perbaikan dan peningkatan bug kecil.
databricks-feature-store 0.8.0
- Perbaikan dan peningkatan bug kecil.
databricks-feature-store 0.7.1
- Tambahkan
flask
sebagai dependensi untuk memperbaiki masalah dependensi yang hilang saat menilai model denganscore_batch
.
databricks-feature-store 0.7.0
- Perbaikan dan peningkatan bug kecil.
databricks-feature-store 0.6.1
- Rilis publik awal klien Penyimpanan Fitur Databricks ke PyPI.