Bagikan melalui


Catatan rilis untuk rekayasa fitur Databricks dan penyimpanan fitur ruang kerja warisan

Halaman ini mencantumkan rilis Rekayasa Fitur Databricks di klien Unity Catalog dan klien Penyimpanan Fitur Ruang Kerja Databricks. Kedua klien tersedia di PyPI sebagai databricks-feature-engineering.

Pustaka digunakan untuk:

  • Membuat, membaca, dan menulis tabel fitur.
  • Melatih model pada data fitur.
  • Menerbitkan tabel fitur ke penyimpanan online untuk penyajian secara real-time.

Untuk dokumentasi penggunaan, lihat Penyimpanan Fitur Databricks. Untuk dokumentasi Python API, lihat Python API.

Rekayasa Fitur di klien Katalog Unity berfungsi untuk fitur dan tabel fitur di Katalog Unity. Klien Penyimpanan Fitur Ruang Kerja berfungsi untuk fitur dan tabel fitur di Penyimpanan Fitur Ruang Kerja. Kedua klien telah diinstal sebelumnya di Databricks Runtime untuk Pembelajaran Mesin. Mereka juga dapat berjalan pada Databricks Runtime setelah menginstal databricks-feature-engineering dari PyPI (pip install databricks-feature-engineering). Hanya untuk pengujian unit, kedua klien dapat digunakan secara lokal atau di lingkungan CI/CD.

Untuk tabel yang memperlihatkan kompatibilitas versi klien dengan versi Databricks Runtime dan Databricks Runtime ML, lihat matriks kompatibilitas Rekayasa Fitur. Versi lama klien Penyimpanan Fitur Ruang Kerja Databricks tersedia di PyPI sebagai databricks-feature-store.

databricks-feature-engineering 0.7.0

  • Tampilan tertentu di Unity Catalog sekarang dapat digunakan sebagai tabel fitur untuk pelatihan dan evaluasi model offline. Lihat Membaca dari tabel fitur di Katalog Unity.
  • Set pelatihan sekarang dapat dibuat dengan pencarian fitur atau spesifikasi fitur. Lihat referensi Python SDK.

databricks-feature-engineering 0.6.0

  • Menjalankan gabungan point-in-time dengan Spark asli sekarang didukung, selain dukungan yang ada dengan Tempo. Terima kasih banyak kepada Semyon Sinchenko karena telah menyarankan idenya!
  • StructType sekarang didukung sebagai jenis data PySpark. StructType tidak didukung untuk melayani online.
  • write_table sekarang mendukung penulisan ke tabel yang mengaktifkan pengklusteran cairan .
  • Parameter timeseries_columns untuk create_table telah diganti namanya menjadi timeseries_column. Alur kerja yang ada dapat terus menggunakan timeseries_columns parameter .
  • score_batch sekarang mendukung env_manager parameter . Lihat dokumentasi MLflow untuk informasi selengkapnya.

databricks-feature-engineering 0.5.0

  • API update_feature_spec baru di databricks-feature-engineering yang memungkinkan pengguna memperbarui pemilik FeatureSpec di Unity Catalog.

databricks-feature-engineering 0.4.0

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-engineering 0.3.0

  • log_modelsekarang menggunakan paket PyPI databricks-feature-lookup baru, yang mencakup peningkatan performa untuk penyajian model online.

databricks-feature-store 0.17.0

  • databricks-feature-store tidak digunakan lagi. Semua modul yang ada dalam paket ini tersedia dalam databricks-feature-engineering versi 0.2.0 ke atas. Untuk detailnya, lihat Python API.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering sekarang berisi semua modul dari databricks-feature-store. Untuk detailnya, lihat Python API.

databricks-feature-store 0.16.3

  • Memperbaiki bug batas waktu saat menggunakan Mosaic AutoML dengan tabel fitur.

databricks-feature-engineering 0.1.3

  • Peningkatan kecil di UpgradeClient.

databricks-feature-store 0.16.2

  • Sekarang Anda dapat membuat titik akhir Fitur &Fungsi Penyajian. Untuk detailnya, lihat Fitur & Penyajian Fungsi.

databricks-feature-store 0.16.1

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0

  • Perbaikan dan peningkatan bug kecil.
    • Memperbaiki URL silsilah pekerjaan yang salah yang dicatat dengan penyiapan ruang kerja tertentu.

databricks-feature-engineering 0.1.1

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-engineering 0.1.0

  • Rilis GA Rekayasa Fitur di Klien Python Katalog Unity ke PyPI

databricks-feature-store 0.15.1

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-store 0.15.0

  • Anda sekarang dapat secara otomatis menyimpulkan dan mencatat contoh input saat Anda mencatat model. Untuk melakukan ini, atur infer_model_example ke True saat Anda memanggil log_model. Contohnya didasarkan pada data pelatihan yang ditentukan dalam training_set parameter .

databricks-feature-store 0.14.2

  • Perbaiki bug dalam penerbitan ke Aurora MySQL dari MariaDB Connector/J >=2.7.5.

databricks-feature-store 0.14.1

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-store 0.14.0

Dimulai dengan 0.14.0, Anda harus menentukan kolom kunci tanda waktu dalam primary_keys argumen. Kunci tanda waktu adalah bagian dari "kunci primer" yang secara unik mengidentifikasi setiap baris dalam tabel fitur. Seperti kolom kunci utama lainnya, kolom kunci tanda waktu tidak boleh berisi nilai NULL.

Dalam contoh berikut, DataFrame user_features_df berisi kolom berikut: user_id, , tspurchases_30d, dan is_free_trial_active.

0.14.0 ke atas

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 ke bawah

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-store 0.13.0

  • Versi minimum yang diperlukan mlflow-skinny sekarang adalah 2.4.0.
  • Membuat set pelatihan gagal jika DataFrame yang disediakan tidak berisi semua kunci pencarian yang diperlukan.
  • Saat mencatat model yang menggunakan tabel fitur di Unity Catalog, tanda tangan MLflow secara otomatis dicatat dengan model.

databricks-feature-store 0.12.0

  • Anda sekarang dapat menghapus toko online dengan menggunakan drop_online_table API.

databricks-feature-store 0.11.0

  • Di ruang kerja yang mendukung Katalog Unity, Anda sekarang dapat menerbitkan tabel fitur ruang kerja dan Katalog Unity ke toko online Cosmos DB. Ini memerlukan Databricks Runtime 13.0 ML atau lebih tinggi.

databricks-feature-store 0.10.0

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-store 0.9.0

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-store 0.8.0

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-store 0.7.1

  • Tambahkan flask sebagai dependensi untuk memperbaiki masalah dependensi yang hilang saat menilai model dengan score_batch.

databricks-feature-store 0.7.0

  • Perbaikan dan peningkatan bug kecil.

databricks-feature-store 0.6.1

  • Rilis publik awal klien Penyimpanan Fitur Databricks ke PyPI.