分享方式:


Databricks 功能工程和舊版工作區功能存放區的版本資訊

此頁面列出 Unity 目錄用戶端和 Databricks 工作區功能存放區用戶端中 Databricks 功能工程的版本。 這兩個用戶端都可在 PyPI 上以 databricks-feature-engineering 的形式取得。

連結庫可用來:

  • 建立、讀取和寫入功能數據表。
  • 在特徵數據上定型模型。
  • 將功能數據表發佈至在線商店以進行實時服務。

如需使用方式檔,請參閱 Databricks 功能存放區。 如需 Python API 檔,請參閱 Python API

Unity 類別目錄中的功能工程用戶端適用於 Unity 目錄中的功能和功能資料表。 工作區功能存放區用戶端適用於工作區功能存放區中的功能和功能數據表。 這兩個用戶端都預安裝在 databricks Runtime 中,適用於 機器學習。 它們也可以在從 PyPIpip install databricks-feature-engineering 安裝databricks-feature-engineering之後,在 Databricks Runtime 上執行 。 針對僅限單元測試,這兩個用戶端都可以在本機或 CI/CD 環境中使用。

如需數據表,其中顯示與 Databricks Runtime 和 Databricks Runtime ML 版本的用戶端版本相容性,請參閱 功能工程相容性矩陣。 舊版 Databricks 工作區功能存放區用戶端可在 PyPI 上以 databricks-feature-store 的形式取得。

databricks-feature-engineering 0.6.0

  • 除了 Tempo 的現有支援之外,現在也支援使用原生 Spark 執行時間點聯結。 感謝塞米翁·辛琴科提出這個想法!
  • StructType 現在支援為 PySpark 資料類型。 StructType 不支援在線服務。
  • write_table 現在支援寫入已啟用 液體叢集的 數據表。
  • timeseries_columnscreate_table 已重新命名為 timeseries_column。 現有的工作流程可以繼續使用 timeseries_columns 參數。
  • score_batch 現在支持 env_manager 參數。 如需詳細資訊, 請參閱 MLflow 檔

databricks-feature-engineering 0.5.0

  • 中的databricks-feature-engineering新 API update_feature_spec 可讓使用者更新 Unity 目錄中 FeatureSpec 的擁有者。

databricks-feature-engineering 0.4.0

  • 小錯誤修正和改進。

databricks-feature-engineering 0.3.0

databricks-feature-store 0.17.0

  • databricks-feature-store 已被取代。 此套件中的所有現有模組都可在 databricks-feature-engineering 0.2.0 版和更新版本中取得。 如需詳細資訊,請參閱 Python API

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering 現在包含 來自 databricks-feature-store的所有模組。 如需詳細資訊,請參閱 Python API

databricks-feature-store 0.16.3

  • 修正搭配功能數據表使用 AutoML 時的逾時錯誤。

databricks-feature-engineering 0.1.3

  • UpgradeClient 中的小型改善。

databricks-feature-store 0.16.2

  • 您現在可以建立功能與函式服務端點。 如需詳細資訊,請參閱 功能與函式服務

databricks-feature-store 0.16.1

  • 小錯誤修正和改進。

databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0

  • 小錯誤修正和改進。
    • 修正了以特定工作區設定記錄的不正確作業歷程 URL。

databricks-feature-engineering 0.1.1

  • 小錯誤修正和改進。

databricks-feature-engineering 0.1.0

  • Unity 目錄 Python 用戶端中的功能工程正式發行至 PyPI

databricks-feature-store 0.15.1

  • 小錯誤修正和改進。

databricks-feature-store 0.15.0

  • 您現在可以在記錄模型時自動推斷和記錄輸入範例。 若要這樣做,請在呼叫 log_model時將 設定infer_model_exampleTrue 。 此範例是以 參數中指定的 training_set 定型數據為基礎。

databricks-feature-store 0.14.2

  • 修正從 MariaDB 連接器/J >=2.7.5 發行至 Aurora MySQL 時的錯誤。

databricks-feature-store 0.14.1

  • 小錯誤修正和改進。

databricks-feature-store 0.14.0

從 0.14.0 開始,您必須在 primary_keys 自變數中指定時間戳索引鍵數據行。 時間戳索引鍵是「主鍵」的一部分,可唯一識別功能數據表中的每個數據列。 與其他主鍵數據行一樣,時間戳索引鍵數據行不能包含NULL值。

在下列範例中,DataFrame user_features_df 包含下列資料行: user_idtspurchases_30dis_free_trial_active

0.14.0 和更新版本

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 和以下版本

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • 小錯誤修正和改進。

databricks-feature-store 0.13.0

  • 最低必要 mlflow-skinny 版本現在是 2.4.0。
  • 如果提供的 DataFrame 未包含所有必要的查閱索引鍵,則建立定型集會失敗。
  • 記錄在 Unity 目錄中使用功能數據表的模型時,系統會自動使用模型記錄 MLflow 簽章。

databricks-feature-store 0.12.0

  • 您現在可以使用 drop_online_table API 刪除線上商店。

databricks-feature-store 0.11.0

  • 在已啟用 Unity 目錄的工作區中,您現在可以將工作區和 Unity 目錄功能資料表發佈至 Cosmos DB 在線商店。 這需要 Databricks Runtime 13.0 ML 或更新版本。

databricks-feature-store 0.10.0

  • 小錯誤修正和改進。

databricks-feature-store 0.9.0

  • 小錯誤修正和改進。

databricks-feature-store 0.8.0

  • 小錯誤修正和改進。

databricks-feature-store 0.7.1

  • 將 新增 flask 為相依性,以修正使用 score_batch評分模型時遺漏的相依性問題。

databricks-feature-store 0.7.0

  • 小錯誤修正和改進。

databricks-feature-store 0.6.1

  • Databricks Feature Store 用戶端的初始公開發行至 PyPI。