Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se explica cómo usar etiquetas para atribuir el uso de computación a áreas de trabajo, equipos, proyectos o usuarios específicos para facilitar el seguimiento de costes y la elaboración de presupuestos.
Hay dos tipos de etiquetas:
- Etiquetas predeterminadas: Databricks aplica automáticamente a los recursos implementados en la nube. Estos proporcionan metadatos básicos, como proveedor, identificador de clúster y creador.
- Etiquetas personalizadas: etiquetas definidas por el usuario que puede agregar a recursos de proceso y cargas de trabajo sin servidor. Esto permite un seguimiento pormenorizados, informes y presupuestos.
Advertencia
Los datos de etiqueta se pueden replicar globalmente. No use nombres de etiqueta ni valores que puedan poner en peligro la seguridad de los recursos. Por ejemplo, no use nombres de etiqueta que contengan información personal o confidencial.
Etiquetas predeterminadas
Azure Databricks agrega automáticamente etiquetas predeterminadas para calcular los recursos que implementa en la cuenta en la nube. Estas etiquetas asignan el uso a Databricks y proporcionan información básica sobre el recurso, como su nombre, identificador y creador.
Las etiquetas predeterminadas se propagan automáticamente a informes detallados de análisis de costos a los que puede acceder en Azure Portal.
A continuación, encontrará un informe de detalles de la factura de análisis de costes en Azure Portal que detalla el coste por la etiqueta clusterid
durante un período de un mes:
Valores y claves de etiqueta predeterminados
Azure Databricks agrega las siguientes etiquetas predeterminadas a los recursos de proceso:
Clave de etiqueta | Valor |
---|---|
Vendor |
Valor constante: Databricks |
ClusterId |
Identificador interno de Azure Databricks del clúster |
ClusterName |
Nombre del clúster |
Creator |
Nombre de usuario (dirección de correo electrónico) del usuario que creó el clúster |
RunName |
Nombre del trabajo (solo se propaga en el proceso de trabajos). Si usa jobs API 2.0, esto equivale a run_name . En Jobs API 2.1, es task_key . |
JobId |
Id. del trabajo (solo se propaga en el proceso de trabajos) |
El proceso usado por la supervisión de Lakehouse incluye estas etiquetas adicionales:
Clave de etiqueta | Valor |
---|---|
LakehouseMonitoring |
cierto |
LakehouseMonitoringTableId |
Identificador de la tabla supervisada |
LakehouseMonitoringWorkspaceId |
Identificador del área de trabajo donde se creó el monitor |
LakehouseMonitoringMetastoreId |
Identificador de la tienda de metadatos donde existe la tabla supervisada |
Azure Databricks agrega las siguientes etiquetas predeterminadas a los grupos y los recursos de proceso creados por los grupos.
Clave de etiqueta | Valor |
---|---|
Vendor |
Valor constante: Databricks |
DatabricksInstancePoolCreatorId |
Identificador interno de Azure Databricks del usuario que creó el grupo |
DatabricksInstancePoolId |
Identificador interno de Azure Databricks del grupo |
Etiquetas personalizadas
Las etiquetas personalizadas permiten atribuir el uso del proceso a equipos, proyectos o centros de costos específicos con más granularidad que las etiquetas predeterminadas. Los usuarios o administradores aplican estas etiquetas y se propagan tanto a los registros de uso de la cuenta como a los recursos en la nube aplicables. Estas etiquetas también se usan para crear y supervisar presupuestos en la cuenta de Azure Databricks.
Recursos compatibles para etiquetas personalizadas
Objeto | Interfaz de etiquetado (UI) | Interfaz de etiquetado (API) |
---|---|---|
Área de trabajo | Azure Portal | API de recursos de Azure |
piscina | UI de grupos en el área de trabajo de Azure Databricks | API de grupo de instancia |
Proceso de trabajo y de uso completo | Interfaz de usuario de computación en el área de trabajo de Azure Databricks | API de clústeres |
Almacén de SQL | UI de almacén de SQL en el área de trabajo de Azure Databricks | API de almacenes |
Las etiquetas personalizadas aparecen en minúsculas en los registros de GCE. Los caracteres se quitan si no son letras, números, barras bajas o guiones. Por ejemplo, My Key
se convierte mykey
en y My.Val
se convierte en myval
.
Advertencia
No asigne una etiqueta personalizada con la clave Name
a un clúster. Cada clúster tiene una etiqueta Name
con el valor establecido por Azure Databricks. Si cambia el valor asociado a la clave Name
, Azure Databricks ya no puede realizar el seguimiento del clúster. Como consecuencia, es posible que el clúster no finalice después de quedarse inactivo y que siga incurriendo en costos de uso.
Etiquetado de cargas de trabajo de proceso sin servidor
Importante
Esta característica está en versión preliminar pública.
Para atribuir el uso de computación sin servidor a usuarios, grupos o proyectos, puede usar políticas de presupuesto para computación sin servidor. Cuando se asigna a un usuario una directiva de presupuesto sin servidor, su uso sin servidor se etiqueta automáticamente con las etiquetas personalizadas de su directiva. Las directivas de presupuesto sin servidor se pueden aplicar a cuadernos sin servidor, trabajos, canalizaciones y puntos de conexión para modelo de servicio.
Nota:
El uso de computación sin servidor se registra en la tabla de uso facturable del sistema de la cuenta. Los informes de uso de DBU anteriores no incluyen el uso sin servidor ni las etiquetas de directiva de presupuesto sin servidor.
Consulte Uso de atributo con directivas de presupuesto sin servidor.
Propagación de etiquetas
Azure Databricks agrega las etiquetas de área de trabajo, grupo y clúster y se propagan a las VM de Azure para los informes de análisis de costos. Pero las etiquetas de grupo y clúster se propagan de forma diferente entre sí.
Las etiquetas de área de trabajo y grupo se agregan y asignan como etiquetas de recursos de las VM de Azure que hospedan los grupos.
Las etiquetas de área de trabajo y clúster se agregan y asignan como etiquetas de recursos de las VM de Azure que hospedan los clústeres.
Cuando se crean clústeres a partir de grupos, solo las etiquetas de área de trabajo y las etiquetas de grupo se propagan a las VM. Con el fin de conservar el rendimiento de inicio del clúster del grupo, las etiquetas de clúster no se propagan.
Resolución de conflictos de etiquetas
Si una etiqueta de clúster, etiqueta de grupo o etiqueta de área de trabajo personalizada tiene el mismo nombre que una etiqueta de grupo o clúster predeterminada de Azure Databricks, a la etiqueta personalizada se la agrega el prefijo x_
cuando se propaga.
Por ejemplo, si un área de trabajo está etiquetada con vendor = Azure Databricks
, esa etiqueta entra en conflicto con la etiqueta de clúster predeterminada vendor = Databricks
. Por lo tanto, las etiquetas se propagarán como x_vendor = Azure Databricks
y vendor = Databricks
.
Advertencia
Las etiquetas personalizadas en conflicto agregadas a través de directivas de proceso no se resuelven, lo que provoca que el clúster o el grupo produzcan un error de configuración no válida. Asegúrese de que sus políticas de computación no incluyan nombres de etiqueta que entren en conflicto.
Aplicación de etiquetas
Para aplicar el uso de etiquetas personalizadas específicas, puede usar directivas de proceso. Consulte aplicación de etiquetas personalizadas. Para aplicar etiquetas personalizadas en cargas de trabajo de proceso sin servidor, use directivas de presupuesto sin servidor.
Limitaciones
- Las etiquetas de área de trabajo personalizadas pueden tardar hasta una hora en propagarse a Azure Databricks después de cualquier cambio.
- No se pueden asignar más de cincuenta etiquetas a un recurso de Azure. Si el recuento total de etiquetas agregadas supera este límite, las etiquetas con prefijo
x_
se evalúan en orden alfabético y las que superan el límite se omiten. Si se omiten todas las etiquetas con prefijox_
y el recuento es superior al límite, las etiquetas restantes se evalúan en orden alfabético y las que superan el límite se omiten. - Las claves y los valores de etiqueta solo pueden contener letras, espacios, números o los caracteres
+
, ,-
=
.
_
:
, , ./
@
Las etiquetas que contienen otros caracteres no son válidas. - Si cambia los nombres o valores de clave de etiqueta, estos cambios solo se aplican después del reinicio del clúster o la expansión del grupo.
- Si las etiquetas personalizadas del clúster entran en conflicto con las etiquetas personalizadas de un grupo, no se puede crear el clúster.
- Las etiquetas de área de trabajo recién agregadas no se propagan automáticamente a los recursos de proceso existentes. Para obtener nuevas etiquetas para propagar, abra la página de detalles del recurso de proceso, haga clic en Editar y, a continuación, en Confirmar y reiniciar.