Viktig information för Databricks funktionsutveckling och äldre funktionslager för arbetsytor
På den här sidan visas versioner av Databricks Feature Engineering i Unity Catalog-klienten och Databricks Workspace Feature Store-klienten. Båda klienterna är tillgängliga i PyPI som databricks-feature-engineering.
Biblioteken används för att:
- Skapa, läsa och skriva funktionstabeller.
- Träna modeller på funktionsdata.
- Publicera funktionstabeller i onlinebutiker för realtidsservering.
Information om användningsdokumentation finns i Databricks Feature Store. Information om Python API-dokumentation finns i Python API.
Feature Engineering i Unity Catalog-klienten fungerar för funktioner och funktionstabeller i Unity Catalog. Funktionslagerklienten för arbetsytan fungerar för funktioner och funktionstabeller i Arbetsytans funktionslager. Båda klienterna är förinstallerade i Databricks Runtime för Mašinsko učenje. De kan också köras på Databricks Runtime efter installation databricks-feature-engineering
från PyPI (pip install databricks-feature-engineering
). Endast för enhetstestning kan båda klienterna användas lokalt eller i CI/CD-miljöer.
En tabell som visar klientversionskompatibilitet med Databricks Runtime- och Databricks Runtime ML-versioner finns i kompatibilitetsmatris för funktionstekniker. Äldre versioner av Databricks Workspace Feature Store-klienten är tillgängliga i PyPI som databricks-feature-store.
databricks-feature-engineering 0.6.0
- Det finns nu stöd för att köra punkt-i-tid-kopplingar med inbyggd Spark, förutom befintligt stöd med Tempo. Stort tack till Semyon Sinchenko för att föreslå idén!
StructType
stöds nu som en PySpark-datatyp.StructType
stöds inte för onlineservering.write_table
har nu stöd för att skriva till tabeller som har flytande klustring aktiverat.- Parametern
timeseries_columns
förcreate_table
har bytt namn tilltimeseries_column
. Befintliga arbetsflöden kan fortsätta att använda parameterntimeseries_columns
. score_batch
stöder nu parameternenv_manager
. Mer information finns i MLflow-dokumentationen .
databricks-feature-engineering 0.5.0
- Nytt API
update_feature_spec
idatabricks-feature-engineering
som gör det möjligt för användare att uppdatera ägaren till en FeatureSpec i Unity Catalog.
databricks-feature-engineering 0.4.0
- Små felkorrigeringar och förbättringar.
databricks-feature-engineering 0.3.0
log_model
använder nu det nya PyPI-paketet databricks-feature-lookup , som innehåller prestandaförbättringar för onlinemodellservering.
databricks-feature-store 0.17.0
databricks-feature-store
är inaktuell. Alla befintliga moduler i det här paketet är tillgängliga idatabricks-feature-engineering
version 0.2.0 och senare. Mer information finns i Python API.
databricks-feature-engineering 0.2.0
databricks-feature-engineering
innehåller nu alla moduler fråndatabricks-feature-store
. Mer information finns i Python API.
databricks-feature-store 0.16.3
- Åtgärdar tidsgränsfel vid användning av AutoML med funktionstabeller.
databricks-feature-engineering 0.1.3
- Små förbättringar i UpgradeClient.
databricks-feature-store 0.16.2
- Nu kan du skapa funktions- och funktionsserverslutpunkter. Mer information finns i Funktions- och funktionsservering.
databricks-feature-store 0.16.1
- Små felkorrigeringar och förbättringar.
databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0
- Små felkorrigeringar och förbättringar.
- Åtgärdade felaktiga url:er för jobbursprung som loggats med vissa konfigurationer av arbetsytan.
databricks-feature-engineering 0.1.1
- Små felkorrigeringar och förbättringar.
databricks-feature-engineering 0.1.0
- GA-version av Funktionsteknik i Unity Catalog Python-klienten till PyPI
databricks-feature-store 0.15.1
- Små felkorrigeringar och förbättringar.
databricks-feature-store 0.15.0
- Nu kan du automatiskt härleda och logga ett indataexempel när du loggar en modell. För att göra detta anger
infer_model_example
du tillTrue
när du anroparlog_model
. Exemplet baseras på träningsdata som anges i parameterntraining_set
.
databricks-feature-store 0.14.2
- Åtgärda fel vid publicering till Aurora MySQL från MariaDB Connector/J >=2.7.5.
databricks-feature-store 0.14.1
- Små felkorrigeringar och förbättringar.
databricks-feature-store 0.14.0
Från och med 0.14.0 måste du ange tidsstämpelnyckelkolumner i primary_keys
argumentet. Tidsstämpelnycklar är en del av de "primära nycklar" som unikt identifierar varje rad i funktionstabellen. Precis som andra primärnyckelkolumner kan tidsstämpelnyckelkolumner inte innehålla NULL-värden.
I följande exempel innehåller DataFrame user_features_df
följande kolumner: user_id
, ts
, purchases_30d
och is_free_trial_active
.
0.14.0 och senare
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)
0.13.1 och lägre
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)
databricks-feature-store 0.13.1
- Små felkorrigeringar och förbättringar.
databricks-feature-store 0.13.0
- Den lägsta version som krävs
mlflow-skinny
är nu 2.4.0. - Det går inte att skapa en träningsuppsättning om den angivna DataFrame inte innehåller alla nödvändiga uppslagsnycklar.
- När du loggar en modell som använder funktionstabeller i Unity Catalog loggas en MLflow-signatur automatiskt med modellen.
databricks-feature-store 0.12.0
- Nu kan du ta bort en onlinebutik med hjälp av API:et
drop_online_table
.
databricks-feature-store 0.11.0
- I Unity Catalog-aktiverade arbetsytor kan du nu publicera funktionstabeller för både arbetsyta och Unity Catalog till Cosmos DB-onlinebutiker. Detta kräver Databricks Runtime 13.0 ML eller senare.
databricks-feature-store 0.10.0
- Små felkorrigeringar och förbättringar.
databricks-feature-store 0.9.0
- Små felkorrigeringar och förbättringar.
databricks-feature-store 0.8.0
- Små felkorrigeringar och förbättringar.
databricks-feature-store 0.7.1
- Lägg till
flask
som ett beroende för att åtgärda problem med saknade beroenden vid bedömning av modeller medscore_batch
.
databricks-feature-store 0.7.0
- Små felkorrigeringar och förbättringar.
databricks-feature-store 0.6.1
- Första offentliga versionen av Databricks Feature Store-klienten till PyPI.