Compartir a través de


Uso de etiquetas para atribuir y realizar un seguimiento del uso

En este artículo se explica cómo usar etiquetas para atribuir el uso de computación a áreas de trabajo, equipos, proyectos o usuarios específicos para facilitar el seguimiento de costes y la elaboración de presupuestos.

Hay dos tipos de etiquetas:

  • Etiquetas predeterminadas: Databricks aplica automáticamente a los recursos implementados en la nube. Estos proporcionan metadatos básicos, como proveedor, identificador de clúster y creador.
  • Etiquetas personalizadas: etiquetas definidas por el usuario que puede agregar a recursos de proceso y cargas de trabajo sin servidor. Esto permite un seguimiento pormenorizados, informes y presupuestos.

Advertencia

Los datos de etiqueta se pueden replicar globalmente. No use nombres de etiqueta ni valores que puedan poner en peligro la seguridad de los recursos. Por ejemplo, no use nombres de etiqueta que contengan información personal o confidencial.

Etiquetas predeterminadas

Azure Databricks agrega automáticamente etiquetas predeterminadas para calcular los recursos que implementa en la cuenta en la nube. Estas etiquetas asignan el uso a Databricks y proporcionan información básica sobre el recurso, como su nombre, identificador y creador.

Las etiquetas predeterminadas se propagan automáticamente a informes detallados de análisis de costos a los que puede acceder en Azure Portal.

A continuación, encontrará un informe de detalles de la factura de análisis de costes en Azure Portal que detalla el coste por la etiqueta clusterid durante un período de un mes:

Análisis de costes mediante el id. de clúster

Valores y claves de etiqueta predeterminados

Azure Databricks agrega las siguientes etiquetas predeterminadas a los recursos de proceso:

Clave de etiqueta Valor
Vendor Valor constante: Databricks
ClusterId Identificador interno de Azure Databricks del clúster
ClusterName Nombre del clúster
Creator Nombre de usuario (dirección de correo electrónico) del usuario que creó el clúster
RunName Nombre del trabajo (solo se propaga en el proceso de trabajos). Si usa jobs API 2.0, esto equivale a run_name. En Jobs API 2.1, es task_key.
JobId Id. del trabajo (solo se propaga en el proceso de trabajos)

El proceso usado por la supervisión de Lakehouse incluye estas etiquetas adicionales:

Clave de etiqueta Valor
LakehouseMonitoring cierto
LakehouseMonitoringTableId Identificador de la tabla supervisada
LakehouseMonitoringWorkspaceId Identificador del área de trabajo donde se creó el monitor
LakehouseMonitoringMetastoreId Identificador de la tienda de metadatos donde existe la tabla supervisada

Azure Databricks agrega las siguientes etiquetas predeterminadas a los grupos y los recursos de proceso creados por los grupos.

Clave de etiqueta Valor
Vendor Valor constante: Databricks
DatabricksInstancePoolCreatorId Identificador interno de Azure Databricks del usuario que creó el grupo
DatabricksInstancePoolId Identificador interno de Azure Databricks del grupo

Etiquetas personalizadas

Las etiquetas personalizadas permiten atribuir el uso del proceso a equipos, proyectos o centros de costos específicos con más granularidad que las etiquetas predeterminadas. Los usuarios o administradores aplican estas etiquetas y se propagan tanto a los registros de uso de la cuenta como a los recursos en la nube aplicables. Estas etiquetas también se usan para crear y supervisar presupuestos en la cuenta de Azure Databricks.

Recursos compatibles para etiquetas personalizadas

Objeto Interfaz de etiquetado (UI) Interfaz de etiquetado (API)
Área de trabajo Azure Portal API de recursos de Azure
piscina UI de grupos en el área de trabajo de Azure Databricks API de grupo de instancia
Proceso de trabajo y de uso completo Interfaz de usuario de computación en el área de trabajo de Azure Databricks API de clústeres
Almacén de SQL UI de almacén de SQL en el área de trabajo de Azure Databricks API de almacenes

Las etiquetas personalizadas aparecen en minúsculas en los registros de GCE. Los caracteres se quitan si no son letras, números, barras bajas o guiones. Por ejemplo, My Key se convierte mykey en y My.Val se convierte en myval.

Advertencia

No asigne una etiqueta personalizada con la clave Name a un clúster. Cada clúster tiene una etiqueta Name con el valor establecido por Azure Databricks. Si cambia el valor asociado a la clave Name, Azure Databricks ya no puede realizar el seguimiento del clúster. Como consecuencia, es posible que el clúster no finalice después de quedarse inactivo y que siga incurriendo en costos de uso.

Etiquetado de cargas de trabajo de proceso sin servidor

Importante

Esta característica está en versión preliminar pública.

Para atribuir el uso de computación sin servidor a usuarios, grupos o proyectos, puede usar políticas de presupuesto para computación sin servidor. Cuando se asigna a un usuario una directiva de presupuesto sin servidor, su uso sin servidor se etiqueta automáticamente con las etiquetas personalizadas de su directiva. Las directivas de presupuesto sin servidor se pueden aplicar a cuadernos sin servidor, trabajos, canalizaciones y puntos de conexión para modelo de servicio.

Nota:

El uso de computación sin servidor se registra en la tabla de uso facturable del sistema de la cuenta. Los informes de uso de DBU anteriores no incluyen el uso sin servidor ni las etiquetas de directiva de presupuesto sin servidor.

Consulte Uso de atributo con directivas de presupuesto sin servidor.

Propagación de etiquetas

Azure Databricks agrega las etiquetas de área de trabajo, grupo y clúster y se propagan a las VM de Azure para los informes de análisis de costos. Pero las etiquetas de grupo y clúster se propagan de forma diferente entre sí.

Las etiquetas de área de trabajo y grupo se agregan y asignan como etiquetas de recursos de las VM de Azure que hospedan los grupos.

Las etiquetas de área de trabajo y clúster se agregan y asignan como etiquetas de recursos de las VM de Azure que hospedan los clústeres.

Cuando se crean clústeres a partir de grupos, solo las etiquetas de área de trabajo y las etiquetas de grupo se propagan a las VM. Con el fin de conservar el rendimiento de inicio del clúster del grupo, las etiquetas de clúster no se propagan.

Resolución de conflictos de etiquetas

Si una etiqueta de clúster, etiqueta de grupo o etiqueta de área de trabajo personalizada tiene el mismo nombre que una etiqueta de grupo o clúster predeterminada de Azure Databricks, a la etiqueta personalizada se la agrega el prefijo x_ cuando se propaga.

Por ejemplo, si un área de trabajo está etiquetada con vendor = Azure Databricks, esa etiqueta entra en conflicto con la etiqueta de clúster predeterminada vendor = Databricks. Por lo tanto, las etiquetas se propagarán como x_vendor = Azure Databricks y vendor = Databricks.

Advertencia

Las etiquetas personalizadas en conflicto agregadas a través de directivas de proceso no se resuelven, lo que provoca que el clúster o el grupo produzcan un error de configuración no válida. Asegúrese de que sus políticas de computación no incluyan nombres de etiqueta que entren en conflicto.

Aplicación de etiquetas

Para aplicar el uso de etiquetas personalizadas específicas, puede usar directivas de proceso. Consulte aplicación de etiquetas personalizadas. Para aplicar etiquetas personalizadas en cargas de trabajo de proceso sin servidor, use directivas de presupuesto sin servidor.

Limitaciones

  • Las etiquetas de área de trabajo personalizadas pueden tardar hasta una hora en propagarse a Azure Databricks después de cualquier cambio.
  • No se pueden asignar más de cincuenta etiquetas a un recurso de Azure. Si el recuento total de etiquetas agregadas supera este límite, las etiquetas con prefijo x_ se evalúan en orden alfabético y las que superan el límite se omiten. Si se omiten todas las etiquetas con prefijo x_ y el recuento es superior al límite, las etiquetas restantes se evalúan en orden alfabético y las que superan el límite se omiten.
  • Las claves y los valores de etiqueta solo pueden contener letras, espacios, números o los caracteres +, , -=._:, , . /@ Las etiquetas que contienen otros caracteres no son válidas.
  • Si cambia los nombres o valores de clave de etiqueta, estos cambios solo se aplican después del reinicio del clúster o la expansión del grupo.
  • Si las etiquetas personalizadas del clúster entran en conflicto con las etiquetas personalizadas de un grupo, no se puede crear el clúster.
  • Las etiquetas de área de trabajo recién agregadas no se propagan automáticamente a los recursos de proceso existentes. Para obtener nuevas etiquetas para propagar, abra la página de detalles del recurso de proceso, haga clic en Editar y, a continuación, en Confirmar y reiniciar.