Monitorar o uso empregando marcas

Para monitorar o custo e atribuir com precisão o uso do Azure Databricks às unidades de negócios e às equipes da sua organização (para estornos, por exemplo), você pode marcar workspaces (grupos de recursos) e recursos de computação. Essas marcas são propagadas para relatórios detalhados de análise de custo que você pode acessar no portal do Azure.

Este é um relatório de detalhes da fatura de análise de custo no portal do Azure que detalha o custo por marca clusterid em um período de um mês:

Análise de custo por ID de cluster

Objetos e recursos marcados

Objeto Interface do usuário de marcação Interface de marcação (API)
Workspace Portal do Azure API de Recursos do Azure
pool Interface do usuário de pools no workspace do Azure Databricks API do Pool de Instâncias
Computação de trabalho e para todos os fins Interface do usuário de computação no workspace do Azure Databricks API de Clusters
SQL warehouse Interface do usuário do SQL warehouse no workspace do Azure Databricks API de warehouses

Aviso

Não atribua uma marca personalizada com a chave Name a um cluster. Cada cluster tem uma marca Name cujo valor é definido pelo Azure Databricks. Se você alterar o valor associado à chave Name, o cluster não poderá mais ser acompanhado pelo Azure Databricks. Como consequência, o cluster pode não ser encerrado depois de ficar ocioso e continuará a incorrer em custos de uso.

Marcas padrão

O Azure Databricks adiciona as seguintes marcas padrão à computação para todas as finalidades:

Chave de marca Valor
Vendor Valor constante: Databricks
ClusterId ID interna do Azure Databricks do cluster
ClusterName Nome do cluster
Creator Nome de usuário (endereço de email) do usuário que criou o cluster

Em clusters de trabalho, o Azure Databricks também aplica as seguintes marcas padrão:

Chave de marca Valor
RunName Nome do trabalho
JobId ID do Trabalho

O Azure Databricks adiciona as seguintes marcas padrão a todos os pools:

Chave de marca Valor
Vendor Valor constante: Databricks
DatabricksInstancePoolCreatorId ID interna do Azure Databricks do usuário que criou o pool
DatabricksInstancePoolId ID interna do Azure Databricks do pool

Na computação usada pelo Lakehouse Monitoring, o Azure Databricks também aplica as seguintes marcas:

Chave de marca Valor
LakehouseMonitoring true
LakehouseMonitoringTableId ID da tabela monitorada
LakehouseMonitoringWorkspaceId ID do workspace em que o monitor foi criado
LakehouseMonitoringMetastoreId ID do metastore em que a tabela monitorada existe

Propagação de marcas

As marcas de workspace, pool e cluster são agregadas pelo Azure Databricks e propagadas para VMs do Azure para relatórios de análise de custo. Mas as marcas do pool e do cluster são propagadas de forma diferente.

Hierarquia de marcação de objetos do Databricks

As marcas de pool e workspace são agregadas e atribuídas como marcas de recurso das VMs do Azure que hospedam os pools.

As marcas de cluster e workspace são agregadas e atribuídas como marcas de recurso das VMs do Azure que hospedam os clusters.

Quando os clusters são criados com base nos pools, somente as marcas de workspace e as marcas de pool são propagadas para as VMs. As marcas de cluster não são propagadas para preservar o desempenho de inicialização do cluster de pool.

Resolução de conflitos de marcas

Se uma marca personalizada de cluster, de pool ou de workspace tiver o mesmo nome de uma marca padrão de cluster ou de pool do Azure Databricks, a marca personalizada será prefixada com um x_ quando for propagada.

Por exemplo, se um workspace for marcado com vendor = Azure Databricks, essa marca estará em conflito com a marca de cluster padrão vendor = Databricks. Portanto, as marcas serão propagadas como x_vendor = Azure Databricks e vendor = Databricks.

Limitações

  • Pode levar até uma hora para que as marcas de workspace personalizadas sejam propagadas para o Azure Databricks após qualquer alteração.
  • No máximo, 50 marcas podem ser atribuídas a um recurso do Azure. Se a contagem geral de marcas agregadas exceder esse limite, as marcas prefixadas com x_ serão avaliadas em ordem alfabética e aquelas que excederem o limite serão ignoradas. Se todas as marcas prefixadas com x_ forem ignoradas e a contagem estiver acima do limite, as marcas restantes serão avaliadas em ordem alfabética e aquelas que excederem o limite serão ignoradas.
  • As chaves de marca e os valores só podem conter caracteres do conjunto ISO 8859-1 (latin1). As marcas que contêm outros caracteres são ignoradas.
  • Se você alterar os nomes ou os valores de chave de marca, essas alterações serão aplicadas somente após a reinicialização do cluster ou a expansão do pool.
  • Se as marcas personalizadas do cluster entrarem em conflito com as marcas personalizadas de um pool, o cluster não poderá ser criado.

Imposição de marca com políticas

Você pode impor marcas em recursos de computação usando políticas de computação. Para obter mais informações, confira Imposição de marca personalizada.