Monitorização da referência de dados de aprendizagem automática do Azure

Conheça os dados e recursos recolhidos pelo Azure Monitor a partir do seu espaço de trabalho Azure Machine Learning. Consulte monitorar a azure machine learning para obter detalhes sobre a recolha e análise de dados de monitorização.

Métricas

Esta secção lista todas as métricas da plataforma recolhidas automaticamente para a Azure Machine Learning. O fornecedor de recursos para estas métricas é o Microsoft.MachineLearningServices/workspaces.

Modelação

Metric Unidade Descrição
Registo modelo Conseguiu de palavras Número de registos modelo que sucederam neste espaço de trabalho
Registo modelo falhado de palavras Número de modelo registos que falharam neste espaço de trabalho
Implementação de modelos iniciado de palavras Número de modelo implementações iniciadas neste espaço de trabalho
Implementação de modelos conseguiu de palavras Número de modelo implementações que conseguiram neste espaço de trabalho
Implementação de modelo falhou de palavras Número de modelo implementações que falharam neste espaço de trabalho

Quota

A informação sobre quotas é apenas para o cálculo Azure Machine Learning.

Metric Unidade Descrição
Nómada Total de palavras Número de nós totais. Este total inclui alguns dos nóns ativos, nóns ociosos, nóns inutilizáveis, nóns preempted, leaving nodes
Nóns ativos de palavras Número de nós ativos. Os nós que estão ativamente a gerir um trabalho.
Nódoas Ociosas de palavras Número de nós ociosos. Os nós inativos são os nós que não estão a gerir nenhum emprego, mas que podem aceitar um novo emprego se estiverem disponíveis.
Nódes Inutilizáveis de palavras Número de nós inutilizáveis. Os nós inutilizáveis não estão funcionais devido a algum problema irresolúvel. Azure vai reciclar estes nós.
Nómadas Preempted de palavras Número de nós preempted. Estes nós são os nós de baixa prioridade que são retirados da piscina de nós disponíveis.
Deixando os nóns de palavras Número de nós de saída. Deixar os nós são os nós que acabaram de processar um trabalho e vão para o estado de Idle.
Núcleos Totais de palavras Número de núcleos totais
Núcleos Ativos de palavras Número de núcleos ativos
Núcleos Ociosos de palavras Número de núcleos ociosos
Núcleos inutilizáveis de palavras Número de núcleos inutilizáveis
Núcleos Preempted de palavras Número de núcleos pré-empidos
Deixando Os Núcleos de palavras Número de núcleos de saída
Percentagem de Utilização de Cots de palavras Por cento das quotas utilizadas

Recurso

Metric Unidade Descrição
CpuUtilização de palavras Percentagem de utilização num nó CPU. A utilização é reportada em intervalos de um minuto.
GpuUtilização de palavras Percentagem de utilização num nó GPU. A utilização é reportada em intervalos de um minuto.
GpuMemoryUtilization de palavras Percentagem de utilização da memória num nó GPU. A utilização é reportada em intervalos de um minuto.
GpuEnergyJoules de palavras Energia de intervalo em Joules num nó GPU. A energia é reportada em intervalos de um minuto.

Executar

A informação sobre o treino corre para o espaço de trabalho.

Metric Unidade Descrição
Corridas canceladas de palavras Número de corridas canceladas para este espaço de trabalho. O conde é atualizado quando uma execução é cancelada com sucesso.
Cancelar execuções solicitadas de palavras Número de execuções onde foi pedido cancelamento para este espaço de trabalho. A contagem é atualizada quando o pedido de cancelamento foi recebido para uma execução.
Execuções Concluídas de palavras Número de runs concluídas com sucesso para este espaço de trabalho. A contagem é atualizada quando uma execução tiver sido concluída e a saída tiver sido recolhida.
Corridas falhadas de palavras O número de corridas falhou neste espaço de trabalho. O conde é atualizado quando uma corrida falha.
Finalização de Corridas de palavras Número de corridas inseridas no estado finalizado para este espaço de trabalho. A contagem é atualizada quando uma execução tiver terminado, mas a recolha de saída ainda em andamento.
Não respondendo corre de palavras Número de corridas que não respondem a este espaço de trabalho. A contagem é atualizada quando uma execução entra no estado de Não Responder.
Não começou as corridas de palavras Número de runs em Estado Não Iniciado para este espaço de trabalho. O conde é atualizado quando um pedido é recebido para criar uma execução, mas a informação de execução ainda não foi povoada.
Preparação de Corridas de palavras Número de corridas que se preparam para este espaço de trabalho. A contagem é atualizada quando uma execução entra em estado de preparação enquanto o ambiente de funcionação está a ser preparado.
Corridas de Provisionamento de palavras Número de corridas que estão a provisão para este espaço de trabalho. A contagem é atualizada quando uma corrida está à espera da criação ou provisão do alvo do cálculo.
Corridas em Fila de palavras Número de corridas que estão na fila para este espaço de trabalho. O conde é atualizado quando uma corrida é em fila no alvo do cálculo. Pode ocorrer quando se espera que os nós computatados necessários estejam prontos.
Corridas iniciadas de palavras Número de corridas a correr para este espaço de trabalho. A contagem é atualizada quando a execução começa a funcionar com os recursos necessários.
Execuções ini 'Starting' de palavras Número de corridas iniciadas para este espaço de trabalho. O Conde é atualizado após pedido para criar informações de execução e execução, como o Run ID, foi povoado
Erros de palavras Número de erros de execução neste espaço de trabalho. A contagem é atualizada sempre que o run encontra um erro.
Avisos de palavras Número de avisos de execução neste espaço de trabalho. A contagem é atualizada sempre que uma corrida encontra um aviso.

Dimensões métricas

Para obter mais informações sobre as dimensões métricas, consulte métricas multidimensionais.

A Azure Machine Learning tem as seguintes dimensões associadas às suas métricas.

Dimensão Descrição
Nome do Cluster O nome do recurso de cluster compute. Disponível para todas as métricas de quota.
Nome da família VM O nome da família VM usado pelo aglomerado. Disponível para percentagem de utilização de cots.
Prioridade Vm A prioridade do VM. Disponível para percentagem de utilização de cots.
CreatedTime Disponível apenas para CpuUtilization e GpuUtilization.
DeviceId ID do dispositivo (GPU). Disponível apenas para GpuUtilization.
NodeId Identificação do nó criado onde o trabalho está a funcionar. Disponível apenas para CpuUtilization e GpuUtilization.
RunId Identificação da corrida/trabalho. Disponível apenas para CpuUtilization e GpuUtilization.
ComputeType O tipo de cálculo que a corrida usou. Apenas disponível para execuções concluídas, corridas falhadas e execuções iniciadas.
PipelineStepType O tipo de PipelineStep usado na corrida. Apenas disponível para execuções concluídas, corridas falhadas e execuções iniciadas.
PublishedPipelineId A identificação do oleoduto publicado usado na corrida. Apenas disponível para execuções concluídas, corridas falhadas e execuções iniciadas.
RunType O tipo de corrida. Apenas disponível para execuções concluídas, corridas falhadas e execuções iniciadas.

Os valores válidos para a dimensão RunType são:

Valor Descrição
Experimentação Não oleoduto funciona.
PipelineRun Uma corrida de gasoduto, que é o pai de um StepRun.
StepRun Uma corrida para um passo de oleoduto.
ReusedStepRun Uma corrida para um passo de oleoduto que reutiliza uma corrida anterior.

Registo de atividades

A tabela que se segue lista as operações relacionadas com a Azure Machine Learning que podem ser criadas no registo de Atividades.

Operação Descrição
Cria ou atualiza um espaço de trabalho machine learning Um espaço de trabalho foi criado ou atualizado
CheckComputeNameAvailability Verifique se um nome de computação já está em uso
Cria ou atualiza os recursos computacional Um recurso compute foi criado ou atualizado
Elimina os recursos de computação Um recurso computacional foi eliminado
Listar segredos Na operação listado segredos para um espaço de trabalho machine learning

Registos do recurso

Esta secção lista os tipos de registos de recursos que pode recolher para o espaço de trabalho Azure Machine Learning.

Fornecedor e Tipo de Recursos: Microsoft.MachineLearningServices/workspace.

Categoria Nome a Apresentar
AmlComputeClusterEvent AmlComputeClusterEvent
AmlComputeClusterNodeEvent (preterido) AmlComputeClusterNodeEvent
AmlComputeCpuGpuUtilization AmlComputeCpuGpuUtilization
AmlComputeJobEvent AmlComputeJobEvent
AmlRunStatusChangedEvent AmlRunStatusChangedEvent
ModelsChangeEvent ModelsChangeEvent
ModelsReadEvent ModelsReadEvent
ModelsActionEvent ModelsActionEvent
ImplementaçãoReadEvent ImplementaçãoReadEvent
ImplantaçãoEventaCI ImplantaçãoEventaCI
DeploymenteventAKS DeploymenteventAKS
InferencingOperationAKS InferencingOperationAKS
InferencingOperationACI InferencingOperationACI
EnvironmentChangeEvent EnvironmentChangeEvent
EnvironmentReadEvent EnvironmentReadEvent
DataLabelChangeEvent DataLabelChangeEvent
DataLabelReadEvent DataLabelReadEvent
ComputeInstanceEvent ComputeInstanceEvent
DataStoreChangeEvent DataStoreChangeEvent
DataStoreReadEvent DataStoreReadEvent
DataSetChangeEvent DataSetChangeEvent
DataSetReadEvent DataSetReadEvent
PipelineChangeEvent PipelineChangeEvent
PipelineReadEvent PipelineReadEvent
RunEvent RunEvent
RunReadEvent RunReadEvent

Esquemas

Os seguintes esquemas estão em uso pela Azure Machine Learning

Tabela AmlComputeJobEvent

Propriedade Descrição
TimeGenerated Tempo em que a entrada de registo foi gerada
OperationName Nome da operação associada ao evento de registo
Categoria Nome do evento de registo
JobId ID do Trabalho submetido
Experimentid ID da Experiência
Nome de experiência Nome da Experiência
CustomerSubscriptionId Subscrição Onde Experimente e Job como apresentados
Espaço de trabalhoName Nome do espaço de trabalho de aprendizagem automática
ClusterName Nome do Cluster
Estado de Provisionamento Estado da submissão do Emprego
ResourceGroupName Nome do grupo de recursos
Nome de emprego Nome do Trabalho
ClusterId ID do cluster
EventType Tipo de evento job. Por exemplo, JobSubmitted, JobRunning, JobFailed, JobSucceeded.
ExecutionState Estado do trabalho (a Corrida). Por exemplo, Queded, Running, Succeeded, Failed
ErrorDetails Detalhes do erro de trabalho
CriaçãoApiVersão Versão Api usada para criar o trabalho
ClusterResourceGroupName Nome do grupo de recursos do cluster
TFWorkerCount Conde dos trabalhadores da TF
TFParameterServerCount Conde do servidor de parâmetros TF
Tipo de ferramenta Tipo de ferramenta utilizada
RunInContainer Bandeira descrevendo se o trabalho deve ser executado dentro de um recipiente
JobErrorMessage mensagem detalhada de erro de trabalho
NodeId ID do nó criado onde o trabalho está em execução

Tabela AmlComputeClusterEvent

Propriedade Descrição
TimeGenerated Tempo em que a entrada de registo foi gerada
OperationName Nome da operação associada ao evento de registo
Categoria Nome do evento de registo
Estado de Provisionamento Estado de provisionamento do cluster
ClusterName Nome do cluster
ClusterType Tipo do cluster
CreatedBy Utilizador que criou o cluster
CoreCount Contagem dos núcleos no aglomerado
VmSize Tamanho Vm do cluster
VmPriority Prioridade dos nós criados dentro de um cluster Dedicado/LowPriority
Escalatype Tipo de conjunto de escala manual/automóvel
IniciaisNodeCount Contagem inicial de nó do cluster
MínimoNodeCount Contagem mínima de nó do cluster
Máxima NodeCount Contagem máxima do nó do cluster
NodeDeallocationOption Como o nó deve ser transatado
Publisher Editor do tipo de cluster
Oferta Oferta com a qual o cluster é criado
Sku Sku do nó/VM criado dentro do cluster
Versão Versão da imagem utilizada enquanto o nó/VM é criado
SubnetId Subnetida do cluster
Estado de Atribuição Estado de atribuição de clusters
CurrentNodeCount Contagem atual do nó do cluster
TargetNodeCount Contagem de nós de destino do cluster enquanto escala para cima/para baixo
EventType Tipo de evento durante a criação de cluster.
NodeIdleTimeSecondsBeforeScaleDown Tempo de marcha lenta em segundos antes do cluster ser reduzido
PreemptedNodeCount Contagem de nódoa preventiva do cluster
IsResizeGrow Bandeira indicando que o cluster está a aumentar
VmFamilyName Nome da família VM dos nóns que podem ser criados dentro do cluster
LeavingNodeCount Deixando a contagem de nó do aglomerado
UnusableNodeCount Contagem de nó inutilizável do cluster
IdleNodeCount Contagem de nó ocioso do cluster
RunningNodeCount Contagem de nó de execução do cluster
Preparação NodeCount Preparação da contagem de nó do cluster
QuotaAllocada Quota atribuída ao cluster
QuotaUtilizado Quota utilizada do cluster
Tempo de Transferência do Estado de Atribuição Tempo de transição de um estado para outro
ClusterErrorCodes Código de erro recebido durante a criação ou dimensionamento do cluster
CriaçãoApiVersão Versão Api usada durante a criação do cluster

Quadro AmlComputeClusterNodeEvent

Propriedade Descrição
TimeGenerated Tempo em que a entrada de registo foi gerada
OperationName Nome da operação associada ao evento de registo
Categoria Nome do evento de registo
ClusterName Nome do cluster
NodeId ID do nó de cluster criado
VmSize Tamanho Vm do nó
VmFamilyName Família Vm a que o nó pertence
VmPriority Prioridade do nó criado Dedicado/LowPriority
Publisher Editor da imagem vm. Por exemplo, microsoft-dsvm
Oferta Oferta associada à criação de VM
Sku Sku do Nó/VM criado
Versão Versão da imagem utilizada enquanto o nó/VM é criado
ClusterCreationTime Tempo em que o cluster foi criado
Redimensionstar Tempo em que a escala de cluster para cima/para baixo começou
RedimensionarEndTime Tempo em que a escala de cluster para cima/para baixo terminou
Horário de NodeAllocation Tempo em que o nó foi atribuído
NodeBootTime Tempo em que nó foi arrancado
StartTaskStartTime Tempo em que a tarefa foi atribuída a um nó e começou
StartTaskEndTime Tempo em que a tarefa atribuída a um nó terminou
TotalE2ETimeInSegundos O nó de tempo total estava ativo

Nota

A partir de fevereiro de 2022, a tabela AmlComputeClusterNodeEvent será depreciada. Recomendamos que utilize a tabela AmlComputeClusterEvent.

Tabela AmlComputeInstanceEvent

Propriedade Descrição
Tipo Nome do evento log, AmlComputeInstanceEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
ResultType O estado do evento. Valores típicos incluem Iniciado, Em Progresso, Bem Sucedido, Falhado, Ativo e Resolvido.
CorrelationId Um GUID usado para agrupar um conjunto de eventos relacionados, quando aplicável.
OperationName O nome da operação associada à entrada de registo
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
Nome AmlComputeInstance "O nome da instância computacional associada à entrada de registo.

Tabela AmlDataLabelEvent

Propriedade Descrição
Tipo Nome do evento de registo, AmlDataLabelEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
ResultType O estado do evento. Valores típicos incluem Iniciado, Em Progresso, Bem Sucedido, Falhado, Ativo e Resolvido.
CorrelationId Um GUID usado para agrupar um conjunto de eventos relacionados, quando aplicável.
OperationName O nome da operação associada à entrada de registo
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
AmlProjectId O identificador único do projeto AzureML.
Nome AmlProjectName O nome do projeto AzureML.
AmlLabelNames Os nomes da classe de etiqueta que são criados para o projeto.
AmlDataStoreName O nome da loja de dados onde os dados do projeto são armazenados.

Tabela AmlDataSetEvent

Propriedade Descrição
Tipo Nome do evento de registo, AmlDataSetEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
ResultType O estado do evento. Valores típicos incluem Iniciado, Em Progresso, Bem Sucedido, Falhado, Ativo e Resolvido.
AmlWorkspaceId Um GUIA e ID único do espaço de trabalho AzureML.
OperationName O nome da operação associada à entrada de registo
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
AmlDatasetId O ID do Conjunto de Dados AzureML.
Nome AmlDataset O nome do Conjunto de Dados AzureML.

Tabela AmlDataStoreEvent

Propriedade Descrição
Tipo Nome do evento de registo, AmlDataStoreEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
ResultType O estado do evento. Valores típicos incluem Iniciado, Em Progresso, Bem Sucedido, Falhado, Ativo e Resolvido.
AmlWorkspaceId Um GUIA e ID único do espaço de trabalho AzureML.
OperationName O nome da operação associada à entrada de registo
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
Nome AmlDatastore O nome da Loja de Dados AzureML.

AmlDeploymentEvent

Propriedade Descrição
Tipo Nome do evento log, AmlDeploymentEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
ResultType O estado do evento. Valores típicos incluem Iniciado, Em Progresso, Bem Sucedido, Falhado, Ativo e Resolvido.
OperationName O nome da operação associada à entrada de registo
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
Nome AmlService O nome do Serviço AzureML.

AmlInferencingEvent

Propriedade Descrição
Tipo Nome do evento de log, AmlInferencingEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
ResultType O estado do evento. Valores típicos incluem Iniciado, Em Progresso, Bem Sucedido, Falhado, Ativo e Resolvido.
OperationName O nome da operação associada à entrada de registo
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
Nome AmlService O nome do Serviço AzureML.

Tabela AmlModelsEvent

Propriedade Descrição
Tipo Nome do evento de registo, AmlModelsEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
ResultType O estado do evento. Valores típicos incluem Iniciado, Em Progresso, Bem Sucedido, Falhado, Ativo e Resolvido.
OperationName O nome da operação associada à entrada de registo
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
ResultSignature O código de estado HTTP do evento. Os valores típicos incluem 200, 201, 202 etc.
Nome AmlModel O nome do Modelo AzureML.

Tabela AmlPipelineEvent

Propriedade Descrição
Tipo Nome do evento log, AmlPipelineEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
ResultType O estado do evento. Valores típicos incluem Iniciado, Em Progresso, Bem Sucedido, Falhado, Ativo e Resolvido.
AmlWorkspaceId Um GUIA e ID único do espaço de trabalho AzureML.
AmlWorkspaceId O nome do espaço de trabalho AzureML.
OperationName O nome da operação associada à entrada de registo
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
AmlModuleId Um GUIA e ID único do módulo.
Nome AmlModel O nome do Modelo AzureML.
AmlPipelineId A identificação do gasoduto AzureML.
AmlParentPipelineId A ID do gasoduto AzureML do progenitor (no caso da clonagem).
AmlPipelineDraftId A identificação do projeto de gasoduto AzureML.
Nome AmlPipelineDraft O nome do projeto do gasoduto AzureML.
AmlPipelineEndpointId A identificação do ponto final do gasoduto AzureML.
Nome AmlPipelineEndpointName O nome do ponto final do gasoduto AzureML.

Tabela AmlRunEvent

Propriedade Descrição
Tipo Nome do evento de log, AmlRunEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
ResultType O estado do evento. Valores típicos incluem Iniciado, Em Progresso, Bem Sucedido, Falhado, Ativo e Resolvido.
OperationName O nome da operação associada à entrada de registo
AmlWorkspaceId Um GUIA e ID único do espaço de trabalho AzureML.
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
RunId A identificação única da corrida.

Tabela AmlEnvironmentEvent

Propriedade Descrição
Tipo Nome do evento de registo, AmlEnvironmentEvent
TimeGenerated Tempo (UTC) quando a entrada de registo foi gerada
Level O nível de gravidade do evento. Deve ser um dos Informativos, Aviso, Erro ou Crítico.
OperationName O nome da operação associada à entrada de registo
Identidade A identidade do utilizador ou aplicação que efetuou a operação.
AadTenantId A identificação do inquilino da AAD foi submetida.
Nome AmlEnvironment O nome da configuração ambiental AzureML.
AmlEnvironmentVersion O nome da versão de configuração ambiental AzureML.

Ver também