Dela via


Viktig information för Databricks funktionsutveckling och äldre funktionslager för arbetsytor

På den här sidan visas versioner av Databricks Feature Engineering i Unity Catalog-klienten och Databricks Workspace Feature Store-klienten. Båda klienterna är tillgängliga i PyPI som databricks-feature-engineering.

Biblioteken används för att:

  • Skapa, läsa och skriva funktionstabeller.
  • Träna modeller på funktionsdata.
  • Publicera funktionstabeller i onlinebutiker för realtidsservering.

Information om användningsdokumentation finns i Databricks Feature Store. Information om Python API-dokumentation finns i Python API.

Feature Engineering i Unity Catalog-klienten fungerar för funktioner och funktionstabeller i Unity Catalog. Funktionslagerklienten för arbetsytan fungerar för funktioner och funktionstabeller i Arbetsytans funktionslager. Båda klienterna är förinstallerade i Databricks Runtime för Mašinsko učenje. De kan också köras på Databricks Runtime efter installation databricks-feature-engineering från PyPI (pip install databricks-feature-engineering). Endast för enhetstestning kan båda klienterna användas lokalt eller i CI/CD-miljöer.

En tabell som visar klientversionskompatibilitet med Databricks Runtime- och Databricks Runtime ML-versioner finns i kompatibilitetsmatris för funktionstekniker. Äldre versioner av Databricks Workspace Feature Store-klienten är tillgängliga i PyPI som databricks-feature-store.

databricks-feature-engineering 0.6.0

  • Det finns nu stöd för att köra punkt-i-tid-kopplingar med inbyggd Spark, förutom befintligt stöd med Tempo. Stort tack till Semyon Sinchenko för att föreslå idén!
  • StructType stöds nu som en PySpark-datatyp. StructType stöds inte för onlineservering.
  • write_table har nu stöd för att skriva till tabeller som har flytande klustring aktiverat.
  • Parametern timeseries_columns för create_table har bytt namn till timeseries_column. Befintliga arbetsflöden kan fortsätta att använda parametern timeseries_columns .
  • score_batch stöder nu parametern env_manager . Mer information finns i MLflow-dokumentationen .

databricks-feature-engineering 0.5.0

  • Nytt API update_feature_spec i databricks-feature-engineering som gör det möjligt för användare att uppdatera ägaren till en FeatureSpec i Unity Catalog.

databricks-feature-engineering 0.4.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-engineering 0.3.0

databricks-feature-store 0.17.0

  • databricks-feature-store är inaktuell. Alla befintliga moduler i det här paketet är tillgängliga i databricks-feature-engineering version 0.2.0 och senare. Mer information finns i Python API.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering innehåller nu alla moduler från databricks-feature-store. Mer information finns i Python API.

databricks-feature-store 0.16.3

  • Åtgärdar tidsgränsfel vid användning av AutoML med funktionstabeller.

databricks-feature-engineering 0.1.3

  • Små förbättringar i UpgradeClient.

databricks-feature-store 0.16.2

databricks-feature-store 0.16.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0

  • Små felkorrigeringar och förbättringar.
    • Åtgärdade felaktiga url:er för jobbursprung som loggats med vissa konfigurationer av arbetsytan.

databricks-feature-engineering 0.1.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-engineering 0.1.0

  • GA-version av Funktionsteknik i Unity Catalog Python-klienten till PyPI

databricks-feature-store 0.15.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.15.0

  • Nu kan du automatiskt härleda och logga ett indataexempel när du loggar en modell. För att göra detta anger infer_model_example du till True när du anropar log_model. Exemplet baseras på träningsdata som anges i parametern training_set .

databricks-feature-store 0.14.2

  • Åtgärda fel vid publicering till Aurora MySQL från MariaDB Connector/J >=2.7.5.

databricks-feature-store 0.14.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.14.0

Från och med 0.14.0 måste du ange tidsstämpelnyckelkolumner i primary_keys argumentet. Tidsstämpelnycklar är en del av de "primära nycklar" som unikt identifierar varje rad i funktionstabellen. Precis som andra primärnyckelkolumner kan tidsstämpelnyckelkolumner inte innehålla NULL-värden.

I följande exempel innehåller DataFrame user_features_df följande kolumner: user_id, ts, purchases_30doch is_free_trial_active.

0.14.0 och senare

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 och lägre

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.13.0

  • Den lägsta version som krävs mlflow-skinny är nu 2.4.0.
  • Det går inte att skapa en träningsuppsättning om den angivna DataFrame inte innehåller alla nödvändiga uppslagsnycklar.
  • När du loggar en modell som använder funktionstabeller i Unity Catalog loggas en MLflow-signatur automatiskt med modellen.

databricks-feature-store 0.12.0

  • Nu kan du ta bort en onlinebutik med hjälp av API:et drop_online_table .

databricks-feature-store 0.11.0

  • I Unity Catalog-aktiverade arbetsytor kan du nu publicera funktionstabeller för både arbetsyta och Unity Catalog till Cosmos DB-onlinebutiker. Detta kräver Databricks Runtime 13.0 ML eller senare.

databricks-feature-store 0.10.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.9.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.8.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.7.1

  • Lägg till flask som ett beroende för att åtgärda problem med saknade beroenden vid bedömning av modeller med score_batch.

databricks-feature-store 0.7.0

  • Små felkorrigeringar och förbättringar.

databricks-feature-store 0.6.1

  • Första offentliga versionen av Databricks Feature Store-klienten till PyPI.