Supervisión del uso mediante etiquetas

Para supervisar el costo y atribuir con precisión el uso de Azure Databricks a las unidades de negocio y los equipos de la organización (por ejemplo, para contracargos), puede etiquetar áreas de trabajo (grupos de recursos), y recursos de proceso. Estas etiquetas se propagan a informes de análisis de costos detallados a los que puede acceder en Azure Portal.

A continuación, encontrará un informe de detalles de la factura de análisis de costes en Azure Portal que detalla el coste por la etiqueta clusterid durante un período de un mes:

Análisis de costes mediante el id. de clúster

Objetos y recursos etiquetados

Object Interfaz de etiquetado (UI) Interfaz de etiquetado (API)
Área de trabajo Azure Portal API de recursos de Azure
grupo UI de grupos en el área de trabajo de Azure Databricks API de grupo de instancia
Proceso de trabajo y de uso completo UI de proceso en el área de trabajo de Azure Databricks API de clústeres
Almacén de SQL UI de almacén de SQL en el área de trabajo de Azure Databricks API de almacenes

Advertencia

No asigne una etiqueta personalizada con la clave Name a un clúster. Cada clúster tiene una etiqueta Name con el valor establecido por Azure Databricks. Si cambia el valor asociado a la clave Name, Azure Databricks ya no puede realizar el seguimiento del clúster. Como consecuencia, es posible que el clúster no finalice después de quedarse inactivo y que siga incurriendo en costos de uso.

Etiquetas predeterminadas

Azure Databricks agrega las siguientes etiquetas predeterminadas al proceso de uso completo:

Clave de etiqueta Valor
Vendor Valor constante: Databricks
ClusterId Identificador interno de Azure Databricks del clúster
ClusterName Nombre del clúster
Creator Nombre de usuario (dirección de correo electrónico) del usuario que creó el clúster

En los clústeres de trabajo, Azure Databricks también aplica las siguientes etiquetas predeterminadas:

Clave de etiqueta Valor
RunName Nombre del trabajo
JobId Id. del trabajo

Azure Databricks agrega las siguientes etiquetas predeterminadas a todos los grupos:

Clave de etiqueta Valor
Vendor Valor constante: Databricks
DatabricksInstancePoolCreatorId Identificador interno de Azure Databricks del usuario que creó el grupo
DatabricksInstancePoolId Identificador interno de Azure Databricks del grupo

En el proceso que usa Lakehouse Monitoring, Azure Databricks también aplica las siguientes etiquetas:

Clave de etiqueta Valor
LakehouseMonitoring true
LakehouseMonitoringTableId Identificador de la tabla supervisada
LakehouseMonitoringWorkspaceId Identificador del área de trabajo donde se creó el monitor
LakehouseMonitoringMetastoreId Identificador de la tienda de metadatos donde existe la tabla supervisada

Propagación de etiquetas

Azure Databricks agrega las etiquetas de área de trabajo, grupo y clúster y se propagan a las VM de Azure para los informes de análisis de costos. Pero las etiquetas de grupo y clúster se propagan de forma diferente entre sí.

Jerarquía de etiquetado de objetos de Databricks

Las etiquetas de área de trabajo y grupo se agregan y asignan como etiquetas de recursos de las VM de Azure que hospedan los grupos.

Las etiquetas de área de trabajo y clúster se agregan y asignan como etiquetas de recursos de las VM de Azure que hospedan los clústeres.

Cuando se crean clústeres a partir de grupos, solo las etiquetas de área de trabajo y las etiquetas de grupo se propagan a las VM. Con el fin de conservar el rendimiento de inicio del clúster del grupo, las etiquetas de clúster no se propagan.

Resolución de conflictos de etiquetas

Si una etiqueta de clúster, etiqueta de grupo o etiqueta de área de trabajo personalizada tiene el mismo nombre que una etiqueta de grupo o clúster predeterminada de Azure Databricks, a la etiqueta personalizada se la agrega el prefijo x_ cuando se propaga.

Por ejemplo, si un área de trabajo está etiquetada con vendor = Azure Databricks, esa etiqueta entra en conflicto con la etiqueta de clúster predeterminada vendor = Databricks. Por lo tanto, las etiquetas se propagarán como x_vendor = Azure Databricks y vendor = Databricks.

Limitaciones

  • Las etiquetas de área de trabajo personalizadas pueden tardar hasta una hora en propagarse a Azure Databricks después de cualquier cambio.
  • No se pueden asignar más de cincuenta etiquetas a un recurso de Azure. Si el recuento total de etiquetas agregadas supera este límite, las etiquetas con prefijo x_ se evalúan en orden alfabético y las que superan el límite se omiten. Si se omiten todas las etiquetas con prefijo x_ y el recuento es superior al límite, las etiquetas restantes se evalúan en orden alfabético y las que superan el límite se omiten.
  • Los valores y las claves de etiqueta solo pueden contener caracteres del conjunto ISO 8859-1 (latin1). Las etiquetas que contienen otros caracteres se omiten.
  • Si cambia los nombres o valores de clave de etiqueta, estos cambios solo se aplican después del reinicio del clúster o la expansión del grupo.
  • Si las etiquetas personalizadas del clúster entran en conflicto con las etiquetas personalizadas de un grupo, el clúster no se puede crear.

Aplicación de etiquetas con directivas

Puede aplicar etiquetas en clústeres mediante directivas de proceso. Para obtener más información, consulte Aplicación de etiquetas personalizadas.