Poznámky k verzi pro tvorbu funkcí Databricks a starší úložiště funkcí Workspace

Tato stránka obsahuje seznam verzí přípravy funkcí Databricks v klientovi katalogu Unity a klienta úložiště funkcí pracovního prostoru Databricks. Oba klienti jsou k dispozici v PyPI jako databricks-feature-engineering.

Knihovny se používají k:

  • Vytváření, čtení a zápis tabulek funkcí
  • Trénování modelů na datech funkcí
  • Publikování tabulek funkcí do online obchodů pro obsluhu v reálném čase

Dokumentaci k použití najdete v úložišti funkcí Databricks. Dokumentaci k rozhraní Python API najdete v tématu Rozhraní Python API.

Příprava funkcí v klientovi katalogu Unity funguje pro funkce a tabulky funkcí v katalogu Unity. Klient úložiště funkcí pracovního prostoru funguje pro funkce a tabulky funkcí v úložišti funkcí pracovního prostoru. Oba klienti jsou předinstalované v Prostředí Databricks Runtime pro Machine Learning. Po instalaci databricks-feature-engineering z PyPI (PyPIpip install databricks-feature-engineering) můžou běžet také v prostředí Databricks Runtime. Pouze pro testování jednotek je možné oba klienty používat místně nebo v prostředí CI/CD.

Tabulka zobrazující kompatibilitu verzí klienta s verzemi Databricks Runtime a Databricks Runtime ML najdete v matici kompatibility přípravy funkcí. Starší verze klienta úložiště funkcí pracovního prostoru Databricks jsou k dispozici v PyPI jako úložiště funkcí Databricks.

databricks-feature-engineering 0.8.0

  • Podpora použití params ve vyvoláních score_batch, což umožňuje předávat modelu další parametry pro inferenci.
  • Opravy chyb a vylepšení

databricks-feature-engineering 0.7.0

  • Některá zobrazení v katalogu Unity se teď dají použít jako tabulky funkcí pro trénování a vyhodnocení offline modelu. Viz Čtení z tabulky funkcí v katalogu Unity.
  • Trénovací sady je teď možné vytvořit pomocí vyhledávání funkcí nebo specifikace funkce. Viz referenční informace k sadě Python SDK.

databricks-feature-engineering 0.6.0

  • Spouštění spojení k určitému bodu v čase pomocí nativního Sparku se teď podporuje kromě stávající podpory pro Tempo. Obrovský díky Semyon Sinchenko za navržení nápadu!
  • StructType se teď podporuje jako datový typ PySpark. StructType není podporováno pro online poskytování služeb.
  • write_table nyní podporuje zápis do tabulek s povoleným clusteringem liquid.
  • Parametr timeseries_columns pro create_table byl přejmenován na timeseries_column. Existující pracovní postupy můžou parametr dál používat timeseries_columns .
  • score_batch teď podporuje env_manager parametr. Další informace najdete v dokumentaci k MLflow.

databricks-feature-engineering 0.5.0

  • Nové rozhraní API update_feature_spec , které databricks-feature-engineering uživatelům umožňuje aktualizovat vlastníka featureSpec v katalogu Unity.

Databricks-feature-engineering 0.4.0

  • Malé opravy chyb a vylepšení

databricks-feature-engineering 0.3.0

Databricks-feature-store 0.17.0

  • databricks-feature-store je zastaralý. Všechny existující moduly v tomto balíčku jsou k dispozici ve databricks-feature-engineering verzi 0.2.0 a vyšší. Podrobnosti najdete v rozhraní Python API.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering nyní obsahuje všechny moduly z databricks-feature-store. Podrobnosti najdete v rozhraní Python API.

databricks-feature-store 0.16.3

  • Opravuje chybu časového limitu při použití AutoML s tabulkami funkcí.

Databricks-feature-engineering 0.1.3

  • Malá vylepšení v UpgradeClient.

Úložiště funkcí databricks 0.16.2

  • Teď můžete vytvářet koncové body funkcí a obsluhy funkcí. Podrobnosti najdete v tématu Funkce a obsluha funkcí.

Databricks-feature-store 0.16.1

  • Malé opravy chyb a vylepšení

Databricks-feature-engineering 0.1.2 a databricks-feature-store 0.16.0

  • Malé opravy chyb a vylepšení
    • Opravili jsme nesprávné adresy URL rodokmenu úloh zaprotokolované s určitými nastaveními pracovního prostoru.

Databricks-feature-engineering 0.1.1

  • Malé opravy chyb a vylepšení

databricks-feature-engineering 0.1.0

  • Verze ga pro přípravu funkcí v klientovi Pythonu v katalogu Unity do PyPI

Úložiště funkcí databricks 0.15.1

  • Malé opravy chyb a vylepšení

Úložiště funkcí databricks 0.15.0

  • Při protokolování modelu teď můžete automaticky odvodit a protokolovat vstupní příklad. Chcete-li to provést, nastavte infer_model_example na True hodnotu při volání log_model. Příklad je založený na trénovacích datech zadaných v parametru training_set .

databricks-feature-store 0.14.2

  • Oprava chyby při publikování na Aurora MySQL z konektoru MariaDB/J >=2.7.5

Úložiště funkcí databricks 0.14.1

  • Malé opravy chyb a vylepšení

databricks-feature-store 0.14.0

Počínaje verzí 0.14.0 je nutné zadat klíčové sloupce časového razítka v argumentu primary_keys . Klíče časového razítka jsou součástí "primárních klíčů", které jednoznačně identifikují každý řádek v tabulce funkcí. Stejně jako jiné sloupce primárního klíče nemohou sloupce klíče časového razítka obsahovat hodnoty NULL.

V následujícím příkladu datový rámec user_features_df obsahuje následující sloupce: user_id, ts, purchases_30da is_free_trial_active.

0.14.0 a vyšší

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 a novější

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

Databricks-feature-store 0.13.1

  • Malé opravy chyb a vylepšení

databricks-feature-store 0.13.0

  • Minimální požadovaná mlflow-skinny verze je teď 2.4.0.
  • Vytvoření trénovací sady selže, pokud zadaný datový rámec neobsahuje všechny požadované vyhledávací klíče.
  • Při protokolování modelu, který používá tabulky funkcí v katalogu Unity, se podpis MLflow automaticky zaprotokoluje s modelem.

databricks-feature-store 0.12.0

  • Teď můžete odstranit online obchod pomocí drop_online_table rozhraní API.

databricks-feature-store 0.11.0

  • V pracovních prostorech s podporou katalogu Unity teď můžete publikovat tabulky funkcí pracovního prostoru i katalogu Unity do online úložišť Cosmos DB. To vyžaduje Databricks Runtime 13.0 ML nebo vyšší.

databricks-feature-store 0.10.0

  • Malé opravy chyb a vylepšení

databricks-feature-store 0.9.0

  • Malé opravy chyb a vylepšení

databricks-feature-store 0.8.0

  • Malé opravy chyb a vylepšení

Úložiště funkcí databricks 0.7.1

  • Přidání flask jako závislosti pro opravu problému s chybějící závislostí při vyhodnocování modelů pomocí score_batch.

databricks-feature-store 0.7.0

  • Malé opravy chyb a vylepšení

databricks-feature-store 0.6.1

  • Počáteční veřejná verze klienta úložiště funkcí Databricks do PyPI.