Personalización de la recopilación de métricas de OpenTelemetry para máquinas virtuales en Azure Monitor (versión preliminar)

Al habilitar la experiencia basada en métricas para supervisar las máquinas virtuales de Azure, se recopila un conjunto predeterminado de métricas. Puede personalizar la recopilación para incluir métricas adicionales, como el rendimiento por proceso, el uso del disco lógico, el uso del sistema de archivos y otras métricas específicas de la carga de trabajo modificando la regla de recopilación de datos.

Los detalles para la creación del DCR se proporcionan en Recopilación de datos del cliente de máquina virtual con Azure Monitor. En este artículo se proporcionan detalles adicionales para el tipo de origen de datos OpenTelemetry Performance Counters.

Nota:

Para trabajar directamente con la definición de DCR o para implementar con otros métodos como plantillas de ARM, consulte Ejemplos de reglas de recopilación de datos (DCR) en Azure Monitor.

Costo

El conjunto predeterminado de métricas de OpenTelemetry se recopila sin costo alguno. Hay un costo adicional para recopilar métricas de OTel adicionales más allá del conjunto predeterminado. Consulte Precios de Azure Monitor para más información sobre los precios.

Prerrequisitos

Identificación de la regla de recopilación de datos (DCR)

Para identificar la regla de recopilación de datos asociada a la máquina virtual, abra Reglas de recopilación de datos en el menú Supervisión del portal de Azure. Seleccione la pestaña Recursos y busque la máquina virtual.

Captura de pantalla de la pestaña Recursos del elemento de menú Reglas de recopilación de datos.

Haga clic en el número de la columna Reglas de recopilación de datos para enumerar las DCR asociadas a la máquina virtual. El DCR de OTel tendrá un nombre con el formato MSVMOtel-<region>-<name>. Haga clic en el DCR para abrirlo.

Captura de pantalla de las DCR asociadas al recurso seleccionado.

Configuración del origen de datos

En la pestaña Orígenes de datos de DCR, haga clic en el origen de datos OpenTelemetry Performance Counters . Seleccione entre un conjunto predefinido de objetos que se van a recopilar y su frecuencia de muestreo. Cuanto menor sea la frecuencia de muestreo, más frecuentemente se recopila el valor.

Captura de pantalla que muestra el formulario de Azure Portal para seleccionar contadores de rendimiento básicos de OpenTelemetry en una regla de recopilación de datos.

Seleccione Personalizado para obtener una selección más granular de contadores de rendimiento de OpenTelemetry.

Captura de pantalla que muestra el formulario de Azure Portal para seleccionar contadores de rendimiento de OpenTelemetry personalizados en una regla de recopilación de datos.

Comprobación de la recopilación de datos

Para comprobar que se recopilan los contadores de rendimiento de OpenTelemetry, defina el ámbito de una consulta en el área de trabajo de Azure Monitor y compruebe que los datos se devuelven para las métricas seleccionadas.

Captura de pantalla que muestra los registros devueltos desde un AMW.

Si en el área de trabajo se ha activado el modo de acceso de recurso-contexto, también puede comprobar que la misma consulta funciona según lo previsto cuando se limita a la propia máquina virtual; para ello, vaya a la sección Métricas de máquina virtual. Elija el menú desplegable Añadir con el editor o el menú desplegable Ver métricas de AMW en el editor en Métrica Espacios de nombre.

Captura de pantalla donde se ve cómo desplazarse por el editor de AMW PromQL en la sección Métricas de máquina virtual.

Ambos puntos de entrada deben dar lugar a un editor de PromQL con una consulta con ámbito al recurso de máquina virtual ahora, donde la misma consulta funcionará como antes, pero sin necesidad de filtrar por la dimensión microsoft.resourceid de la máquina virtual.

Captura de pantalla que muestra los registros devueltos desde una máquina virtual, almacenados en un AMW.

Captura de pantalla que muestra la consulta con ámbito de máquina virtual en lugar de AMW.

Referencia de métricas

En las tablas siguientes se enumeran las métricas de OpenTelemetry disponibles para las máquinas virtuales.

Métricas predeterminadas

Las métricas de la tabla siguiente se recopilan de forma predeterminada y sin costo adicional.

Nombre de la métrica Descripción
system.uptime Hora desde el último reinicio (en segundos)
system.cpu.time Tiempo total de CPU consumido (usuario + sistema + inactivo), en segundos
system.memory.usage Memoria en uso (bytes)
system.network.io Bytes transmitidos/recibidos
system.network.dropped Paquetes descartados
system.network.errors Errores de red
system.disk.io E/S de disco (bytes leídos y escritos)
system.disk.operations Operaciones de disco (recuentos de lectura y escritura)
system.filesystem.usage Uso del sistema de archivos en bytes
system.disk.tiempo_operación Promedio de tiempo de operación de disco

Métricas adicionales

Las métricas de la tabla siguiente se pueden recopilar modificando la regla de recopilación de datos para la máquina virtual, como se ha descrito anteriormente. Hay un costo adicional para recopilar estas métricas.

Nombre de la métrica Descripción
system.cpu.utilization % de uso de CPU
system.cpu.logical.count Número de procesadores lógicos
system.cpu.physical.count Número de CPU físicas
sistema.cpu.frecuencia Frecuencia de CPU
system.cpu.promedio_de_carga.1m (promedio de carga de CPU del sistema en 1 minuto) Promedio de carga del sistema (1 minuto)
system.cpu.load_average.5m Promedio de carga del sistema (5 minutos)
system.cpu.load_average.15m Promedio de carga del sistema (15 minutos)
system.memory.utilization % de memoria usada
sistema.memoria.límite Límite total de memoria
system.memory.page_size Tamaño de página (bytes)
system.linux.memory.available Memoria disponible
system.linux.memory.dirty Páginas de memoria sucias
system.paging.faults Errores de página
system.paging.operations Operaciones de paginación (lecturas y escrituras)
system.paging.usage Uso de paginación/intercambio (bytes)
system.paging.utilization % de paginación/cambio usado
system.disk.io_time Tiempo dedicado a realizar E/S
system.disk.merged Número de operaciones combinadas
sistema.disco.operaciones_pendientes Operaciones de E/S pendientes
system.disk.weighted_io_time Tiempo de E/S ponderado (tiene en cuenta la profundidad de la cola)
system.filesystem.utilization % de uso del sistema de archivos
system.filesystem.inodes.usage Uso de inodos
sistema.red.paquetes Paquetes transmitidos/recibidos
sistema.red.conexiones Conexiones de red activas
system.network.conntrack.count Entradas actuales de la tabla conntrack
system.network.conntrack.max Tamaño máximo de la tabla conntrack
process.uptime Tiempo de actividad del proceso
process.cpu.time Tiempo de CPU consumido por proceso
process.cpu.utilization Uso de CPU % por proceso
process.memory.usage Uso de memoria (RSS)
process.memory.virtual Uso de memoria virtual
process.memory.utilization Porcentaje de uso de memoria
process.disk.io E/S de disco (bytes por proceso)
process.disk.operations Operaciones de disco por proceso
process.paging.faults Errores de página de proceso
process.open_file_descriptors Abrir descriptores de archivo
process.threads Número de subprocesos
process.handles Identificadores en uso (Windows)
cambios_de_contexto_del_proceso Modificadores de contexto
process.signals_pending Señales pendientes
system.processes.count Número total de procesos
system.processes.created Procesos creados

Para obtener una referencia completa con tipos, unidades, dimensiones y otros metadatos, consulte Referencia de métricas de OpenTelemetry.

Pasos siguientes