Comparteix via


Notas de la versión de Databricks feature engineering y legacy Workspace Feature Store

En esta página se enumeran las versiones del cliente de Databricks Feature Engineering en el cliente del catálogo de Unity y el cliente del Almacén de características del área de trabajo de Databricks. Ambos clientes están disponibles en PyPI: databricks-feature-engineering y databricks-feature-store.

Las bibliotecas se usan para:

  • Crear, leer y escribir tablas de características.
  • Entrenar modelos en datos de atributos.
  • Publicar tablas de características en tiendas en línea para el servicio en tiempo real.

Para obtener documentación de uso, consulte Almacén de características de Databricks. Para obtener documentación sobre la API de Python, consulte API de Python.

El cliente de ingeniería de características en el catálogo de Unity funciona para características y tablas de características en el catálogo de Unity. El cliente del Almacén de características del área de trabajo funciona para características y tablas de características en el Almacén de características del área de trabajo. Ambos clientes están preinstalados en Databricks Runtime para Machine Learning. También se pueden ejecutar en Databricks Runtime después de instalar databricks-feature-engineering desde PyPI (pip install databricks-feature-engineering). Ambos clientes se pueden usar localmente o en entornos de CI/CD solo para pruebas unitarias.

Para ver una tabla que muestra la compatibilidad de versiones de cliente con Databricks Runtime y las versiones de Databricks Runtime ML, consulte Matriz de compatibilidad de la ingeniería de características. Las versiones anteriores del cliente de Databricks Workspace Feature Store están disponibles en PyPI como databricks-feature-store.

databricks-feature-engineering 0.12.1

  • Admite valores predeterminados para búsquedas de características.
  • Correcciones de errores y mejoras.

databricks-feature-engineering 0.11.0

  • Añadir compatibilidad con la versión 3.0 de mlflow.
  • Correcciones de errores y mejoras.

databricks-feature-engineering 0.10.2

  • Agregue compatibilidad con la versión mlflow 2.20.0 y posteriores.
  • Agregue compatibilidad con la numpy versión 2.x.
  • Correcciones de errores y mejoras.

databricks-feature-engineering 0.9.0

  • Compatibilidad con el uso prebuilt_env en score_batch invocaciones.
  • Características a un momento dado que combinan mejoras de rendimiento con Photon.
  • Correcciones de errores y mejoras.

databricks-feature-engineering 0.8.0

  • Soporte con el uso params de score_batchinvocación, que permite pasar parámetros adicionales al modelo para la inferencia.
  • Correcciones de errores y mejoras.

databricks-feature-engineering 0.7.0

databricks-feature-engineering 0.6.0

  • Ahora se admite la ejecución de combinaciones a un momento dado con Spark nativo, además de la compatibilidad existente con Tempo. Mil gracias a Semyon Sinchenko por sugerir la idea.
  • StructType ya se admite como tipo de datos de PySpark. StructType no se admite para el servicio en línea.
  • write_table ya admite la escritura en tablas que tengan habilitada la agrupación en clústeres líquidos.
  • Se cambió el nombre del parámetro timeseries_columns para create_table a timeseries_column. Los flujos de trabajo existentes pueden seguir usando el parámetro timeseries_columns.
  • score_batch ya admite el parámetro env_manager. Para obtener más información, consulte la documentación de MLflow.

databricks-feature-engineering 0.5.0

  • Nueva API update_feature_spec en databricks-feature-engineering que permite a los usuarios cambiar el propietario de un FeatureSpec en el catálogo de Unity.

databricks-feature-engineering 0.4.0

  • Mejoras y correcciones de errores pequeños.

databricks-feature-engineering 0.3.0

  • log_model ahora usa el nuevo paquete PyPI databricks-feature-lookup, que incluye mejoras de rendimiento para el servicio de modelo en línea.

databricks-feature-store 0.17.0

  • databricks-feature-store está en desuso. Todos los módulos existentes de este paquete están disponibles en databricks-feature-engineering en la versión 0.2.0 y posteriores. Para obtener más información, consulte API de Python.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering ahora contiene todos los módulos de databricks-feature-store. Para obtener más información, consulte API de Python.

databricks-feature-store 0.16.3

  • Corrige el error del tiempo de espera al usar AutoML con tablas de características.

databricks-feature-engineering 0.1.3

  • Pequeñas mejoras en UpgradeClient.

databricks-feature-store 0.16.2

  • Ahora puede crear puntos de conexión de característica y Function Serving. Para obtener más información, consulte Feature & Function Serving.

databricks-feature-store 0.16.1

  • Mejoras y correcciones de errores pequeños.

databricks-feature-engineering 0.1.2 & databricks-feature-store 0.16.0

  • Mejoras y correcciones de errores pequeños.
    • Se han corregido direcciones URL de linaje de trabajos incorrectas registradas con determinadas configuraciones del área de trabajo.

databricks-feature-engineering 0.1.1

  • Mejoras y correcciones de errores pequeños.

databricks-feature-engineering 0.1.0

  • Versión de disponibilidad general del cliente Python del catálogo de Unity en PyPI

databricks-feature-store 0.15.1

  • Mejoras y correcciones de errores pequeños.

databricks-feature-store versión 0.15.0

  • Ahora puede deducir y registrar automáticamente un ejemplo de entrada al registrar un modelo. Para ello, establezca infer_model_example en True cuando llame a log_model. El ejemplo se basa en los datos de entrenamiento especificados en el parámetro training_set.

databricks-feature-store 0.14.2

  • Corregir error en la publicación a Aurora MySQL desde MariaDB Connector/J >=2.7.5.

databricks-feature-store 0.14.1

  • Mejoras y correcciones de errores pequeños.

databricks-feature-store 0.14.0

A partir de la 0.14.0, es necesario especificar columnas de clave de marca de tiempo en el argumento primary_keys. Las claves de marca de tiempo forman parte de las "claves principales" que identifican de forma única cada fila de la tabla de características. Al igual que otras columnas de clave principal, las columnas de clave de marca de tiempo no pueden contener valores NULL.

En el ejemplo siguiente, el DataFrame user_features_df contiene las columnas siguientes: user_id, ts, purchases_30d y is_free_trial_active.

0.14.0 y versiones posteriores

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 y versiones anteriores

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • Mejoras y correcciones de errores pequeños.

databricks-feature-store 0.13.0

  • La mlflow-skinny versión mínima necesaria es 2.4.0.
  • Se produce un error al crear un conjunto de entrenamiento si el elemento DataFrame proporcionado no contiene todas las claves de búsqueda necesarias.
  • Al registrar un modelo que usa tablas de características en el catálogo de Unity, se registra automáticamente una firma de MLflow con el modelo.

databricks-feature-store 0.12.0

  • Ahora puede eliminar una tienda en línea mediante la API drop_online_table.

databricks-feature-store 0.11.0

  • En áreas de trabajo habilitadas para catálogos de Unity, ahora puede publicar tablas de características del área de trabajo y catálogo de Unity en tiendas en línea de Cosmos DB. Esto requiere Databricks Runtime 13.0 ML o posterior.

databricks-feature-store 0.10.0

  • Mejoras y correcciones de errores pequeños.

databricks-feature-store 0.9.0

  • Mejoras y correcciones de errores pequeños.

databricks-feature-store 0.8.0

  • Mejoras y correcciones de errores pequeños.

databricks-feature-store 0.7.1

  • Agregue flask como una dependencia para corregir el problema de dependencia que falta al puntuar modelos con score_batch.

databricks-feature-store 0.7.0

  • Mejoras y correcciones de errores pequeños.

databricks-feature-store 0.6.1

  • Versión pública inicial del cliente de Feature Store de Databricks en PyPI.