Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En esta página se enumeran las versiones del cliente de Databricks Feature Engineering en el cliente del catálogo de Unity y el cliente del Almacén de características del área de trabajo de Databricks. Ambos clientes están disponibles en PyPI: databricks-feature-engineering y databricks-feature-store.
Las bibliotecas se usan para:
- Crear, leer y escribir tablas de características.
- Entrenar modelos en datos de atributos.
- Publicar tablas de características en tiendas en línea para el servicio en tiempo real.
Para obtener documentación de uso, consulte Almacén de características de Databricks. Para obtener documentación sobre la API de Python, consulte API de Python.
El cliente de ingeniería de características en el catálogo de Unity funciona para características y tablas de características en el catálogo de Unity. El cliente del Almacén de características del área de trabajo funciona para características y tablas de características en el Almacén de características del área de trabajo. Ambos clientes están preinstalados en Databricks Runtime para Machine Learning. También se pueden ejecutar en Databricks Runtime después de instalar databricks-feature-engineering desde PyPI (pip install databricks-feature-engineering). Ambos clientes se pueden usar localmente o en entornos de CI/CD solo para pruebas unitarias.
Para ver una tabla que muestra la compatibilidad de versiones de cliente con Databricks Runtime y las versiones de Databricks Runtime ML, consulte Matriz de compatibilidad de la ingeniería de características. Las versiones anteriores del cliente de Databricks Workspace Feature Store están disponibles en PyPI como databricks-feature-store.
databricks-feature-engineering 0.12.1
- Admite valores predeterminados para búsquedas de características.
- Correcciones de errores y mejoras.
databricks-feature-engineering 0.11.0
- Añadir compatibilidad con la versión 3.0 de
mlflow. - Correcciones de errores y mejoras.
databricks-feature-engineering 0.10.2
- Agregue compatibilidad con la versión
mlflow2.20.0 y posteriores. - Agregue compatibilidad con la
numpyversión 2.x. - Correcciones de errores y mejoras.
databricks-feature-engineering 0.9.0
- Compatibilidad con el uso
prebuilt_envenscore_batchinvocaciones. - Características a un momento dado que combinan mejoras de rendimiento con Photon.
- Correcciones de errores y mejoras.
databricks-feature-engineering 0.8.0
- Soporte con el uso
paramsdescore_batchinvocación, que permite pasar parámetros adicionales al modelo para la inferencia. - Correcciones de errores y mejoras.
databricks-feature-engineering 0.7.0
- Algunas vistas de Unity Catalog ahora se pueden usar como tablas de características para el entrenamiento y la evaluación de modelos sin conexión. Consulte Leer desde una tabla de características en el catálogo de Unity.
- Ahora se pueden crear conjuntos de formación con búsquedas de características o una especificación de características. Consulte la referencia del SDK de Python.
databricks-feature-engineering 0.6.0
- Ahora se admite la ejecución de combinaciones a un momento dado con Spark nativo, además de la compatibilidad existente con Tempo. Mil gracias a Semyon Sinchenko por sugerir la idea.
-
StructTypeya se admite como tipo de datos de PySpark.StructTypeno se admite para el servicio en línea. -
write_tableya admite la escritura en tablas que tengan habilitada la agrupación en clústeres líquidos. - Se cambió el nombre del parámetro
timeseries_columnsparacreate_tableatimeseries_column. Los flujos de trabajo existentes pueden seguir usando el parámetrotimeseries_columns. -
score_batchya admite el parámetroenv_manager. Para obtener más información, consulte la documentación de MLflow.
databricks-feature-engineering 0.5.0
- Nueva API
update_feature_specendatabricks-feature-engineeringque permite a los usuarios cambiar el propietario de un FeatureSpec en el catálogo de Unity.
databricks-feature-engineering 0.4.0
- Mejoras y correcciones de errores pequeños.
databricks-feature-engineering 0.3.0
-
log_modelahora usa el nuevo paquete PyPI databricks-feature-lookup, que incluye mejoras de rendimiento para el servicio de modelo en línea.
databricks-feature-store 0.17.0
-
databricks-feature-storeestá en desuso. Todos los módulos existentes de este paquete están disponibles endatabricks-feature-engineeringen la versión 0.2.0 y posteriores. Para obtener más información, consulte API de Python.
databricks-feature-engineering 0.2.0
-
databricks-feature-engineeringahora contiene todos los módulos dedatabricks-feature-store. Para obtener más información, consulte API de Python.
databricks-feature-store 0.16.3
- Corrige el error del tiempo de espera al usar AutoML con tablas de características.
databricks-feature-engineering 0.1.3
- Pequeñas mejoras en UpgradeClient.
databricks-feature-store 0.16.2
- Ahora puede crear puntos de conexión de característica y Function Serving. Para obtener más información, consulte Feature & Function Serving.
databricks-feature-store 0.16.1
- Mejoras y correcciones de errores pequeños.
databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0
- Mejoras y correcciones de errores pequeños.
- Se han corregido direcciones URL de linaje de trabajos incorrectas registradas con determinadas configuraciones del área de trabajo.
databricks-feature-engineering 0.1.1
- Mejoras y correcciones de errores pequeños.
databricks-feature-engineering 0.1.0
- Versión de disponibilidad general del cliente Python del catálogo de Unity en PyPI
databricks-feature-store 0.15.1
- Mejoras y correcciones de errores pequeños.
databricks-feature-store versión 0.15.0
- Ahora puede deducir y registrar automáticamente un ejemplo de entrada al registrar un modelo. Para ello, establezca
infer_model_exampleenTruecuando llame alog_model. El ejemplo se basa en los datos de entrenamiento especificados en el parámetrotraining_set.
databricks-feature-store 0.14.2
- Corregir error en la publicación a Aurora MySQL desde MariaDB Connector/J >=2.7.5.
databricks-feature-store 0.14.1
- Mejoras y correcciones de errores pequeños.
databricks-feature-store 0.14.0
A partir de la 0.14.0, es necesario especificar columnas de clave de marca de tiempo en el argumento primary_keys. Las claves de marca de tiempo forman parte de las "claves principales" que identifican de forma única cada fila de la tabla de características. Al igual que otras columnas de clave principal, las columnas de clave de marca de tiempo no pueden contener valores NULL.
En el ejemplo siguiente, el DataFrame user_features_df contiene las columnas siguientes: user_id, ts, purchases_30d y is_free_trial_active.
0.14.0 y versiones posteriores
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)
0.13.1 y versiones anteriores
fs = FeatureStoreClient()
fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)
databricks-feature-store 0.13.1
- Mejoras y correcciones de errores pequeños.
databricks-feature-store 0.13.0
- La
mlflow-skinnyversión mínima necesaria es 2.4.0. - Se produce un error al crear un conjunto de entrenamiento si el elemento DataFrame proporcionado no contiene todas las claves de búsqueda necesarias.
- Al registrar un modelo que usa tablas de características en el catálogo de Unity, se registra automáticamente una firma de MLflow con el modelo.
databricks-feature-store 0.12.0
- Ahora puede eliminar una tienda en línea mediante la API
drop_online_table.
databricks-feature-store 0.11.0
- En áreas de trabajo habilitadas para catálogos de Unity, ahora puede publicar tablas de características del área de trabajo y catálogo de Unity en tiendas en línea de Cosmos DB. Esto requiere Databricks Runtime 13.0 ML o posterior.
databricks-feature-store 0.10.0
- Mejoras y correcciones de errores pequeños.
databricks-feature-store 0.9.0
- Mejoras y correcciones de errores pequeños.
databricks-feature-store 0.8.0
- Mejoras y correcciones de errores pequeños.
databricks-feature-store 0.7.1
- Agregue
flaskcomo una dependencia para corregir el problema de dependencia que falta al puntuar modelos conscore_batch.
databricks-feature-store 0.7.0
- Mejoras y correcciones de errores pequeños.
databricks-feature-store 0.6.1
- Versión pública inicial del cliente de Feature Store de Databricks en PyPI.