Detección inteligente: anomalías de rendimiento

Artículo
04/01/2024

Nota

Puede mirar sus recursos de Application Insight a la detección inteligente basada en alertas (versión preliminar). La migración crea reglas de alerta para los distintos módulos de detección inteligente. Una vez creadas, puede administrar y configurar dichas reglas como cualquier otra regla de Azure Monitor. También puede configurar grupos de acciones para estas reglas, lo que habilita varios métodos para realizar acciones o desencadenar notificaciones en nuevas detecciones.

Para obtener más información sobre el proceso de migración, consulte Migración de la detección inteligente a alertas.

Application Insights analiza automáticamente el rendimiento de su aplicación web y puede advertirle de los posibles problemas.

Esta característica no requiere ninguna configuración especial, tan solo ajustar los parámetros de la aplicación para Application Insights para el idioma admitido. Se activará cuando la aplicación genere suficientes datos de telemetría.

¿Cuándo recibiría una notificación de detección inteligente?

Application Insights ha detectado que el rendimiento de la aplicación se ha degradado en una de estas maneras:

Degradación del tiempo de respuesta: la aplicación ha comenzado a responder a las solicitudes de una forma más lenta de lo habitual. El cambio podría haber sido rápido, por ejemplo, porque hubo una regresión en la implementación más reciente. También podría haber sido gradual, probablemente debido a una fuga de memoria.
Degradación de la duración de la dependencia: la aplicación realiza llamadas a una API de REST, una base de datos u otra dependencia. La dependencia responde de una forma más lenta de lo habitual.
Patrón de rendimiento lento: la aplicación parece tener un problema de rendimiento que está afectando solo a algunas solicitudes. Por ejemplo, las páginas se cargan mucho más lentamente en un tipo de explorador que en otros, o las solicitudes se atienden de una forma más lenta desde un servidor concreto. En la actualidad, nuestros algoritmos examinan tiempos de carga de página, tiempos de respuesta de solicitud y tiempos de respuesta de dependencia.

Para establecer una línea base de rendimiento normal, la detección inteligente requiere que se recopile un volumen de telemetría suficiente durante al menos ocho días. Después de que la aplicación se haya estado ejecutando durante ese periodo, se generará una notificación cuando se produzcan anomalías significativas.

Entonces, ¿mi aplicación tiene un problema?

No, una notificación no significa que la aplicación tenga un problema. Simplemente es una sugerencia sobre algo que puede que desee examinar con más detenimiento.

¿Cómo puedo corregirlo?

Las notificaciones incluyen información de diagnóstico. Este es un ejemplo:

Evaluación de errores. La notificación muestra el número de usuarios u operaciones afectado. Esta información puede ayudarle a asignar una prioridad al problema.
Ámbito. ¿Está el problema afectando a todo el tráfico o solo a algunas páginas? ¿Está limitado a ubicaciones o exploradores determinados? Esta información puede obtenerse de la notificación.
Diagnóstico. A menudo, la información de diagnóstico de la notificación sugiere cuál es la naturaleza del problema. Por ejemplo, si el tiempo de respuesta se ralentiza cuando la tasa de solicitudes es alta, esto podría indicar que el servidor o las dependencias están por encima de su capacidad.

En caso contrario, abra el panel Rendimiento de Application Insights. Ahí encontrará datos de Profiler. Si se producen excepciones, también puede probar el Depurador de instantáneas.

Configuración de notificaciones de correo electrónico

Las notificaciones de detección inteligente están habilitadas de forma predeterminada. Se envían a los usuarios que tienen el acceso Lector de supervisión y Colaborador de supervisión a la suscripción en la que reside el recurso de Application Insights. Para cambiar la notificación predeterminada, haga clic en la opción Configurar de la notificación por correo electrónico, o bien abra la configuración de detección inteligente en Application Insights.

Puede deshabilitar la notificación predeterminada y reemplazarla por una lista especificada de correos electrónicos.

Los mensajes de correo electrónico sobre las anomalías de rendimiento de detección inteligente están limitados a un correo electrónico al día por recurso de Application Insights. El mensaje de correo electrónico solo se enviará si se ha detectado, como mínimo, un problema nuevo ese día. No obtendrá repeticiones de ningún mensaje.

Preguntas más frecuentes

¿El personal de Microsoft mira mis datos?
- No. El servicio es completamente automático. Solo obtendrá las notificaciones. Sus datos son privados.
¿Analiza todos los datos recopilados por Application Insights?
- Actualmente, analizamos el tiempo de respuesta de la solicitud, el tiempo de respuesta de dependencia y el tiempo de carga de la página. En un futuro analizaremos otras métricas.
¿En qué tipos de aplicación funciona la detección?
- Estas degradaciones se detectan en cualquier aplicación que generan los datos de telemetría. Si instaló Application Insights en su aplicación web, el seguimiento de las solicitudes y las dependencias se realiza automáticamente. En el caso de los servicios back-end u otras aplicaciones, si insertó llamadas a TrackRequest() o TrackDependency, la detección inteligente funcionará de la misma manera.
¿Puedo crear mis propias reglas de detección de anomalías o personalizar las existentes?
- Aún no, pero puede realizar lo siguiente:
  - Configurar alertas que le indiquen cuándo una métrica cruza un umbral.
  - Exportar telemetría a una base de datos o a PowerBI para poder realizar un análisis usted mismo.
¿Con qué frecuencia se lleva a cabo el análisis?
- Ejecutamos el análisis diariamente en la telemetría del día anterior (día completo en la zona horaria UTC).
¿Sustituye esto a las alertas de métricas?
- No. No nos comprometemos a detectar cada comportamiento que el usuario podría anómalo.
Si no tomo ninguna medida como respuesta a una notificación, ¿recibiré un aviso?
- No, obtendrá un mensaje sobre cada problema solo una vez. Si el problema persiste, se actualizará en el panel de la fuente de detección inteligente.
Perdí el mensaje de correo electrónico. ¿Dónde puedo encontrar las notificaciones en el portal?
- En la información general de Application Insights de su aplicación, haga clic en el icono Detección inteligente. Allí encontrará todas las notificaciones de los 90 últimos días.

¿Cómo puedo mejorar el rendimiento?

Las respuestas lentas y los errores se encuentran entre los principales motivos de frustración entre los usuarios de los sitios web, como bien sabrá por su propia experiencia. Por lo tanto, es importante que trate los problemas.

Evaluación de errores

En primer lugar, ¿es realmente importante? Si una página siempre tarda en cargarse, pero solo un 1 % de los usuarios del sitio accede a ella, es posible que tenga cosas más importantes de las que ocuparse. En cambio, si solo un 1 % de los usuarios la abren, pero aun así produce excepciones cada vez, puede que merezca la pena investigar el problema.

Use como guía general la declaración de impacto, como los usuarios afectados o el porcentaje de tráfico. Tenga en cuenta que es posible que no refleje todo lo que está sucediendo. Recopile otras pruebas para confirmar.

Tenga en cuenta los parámetros del problema. Si es dependiente de la ubicación, configure pruebas de disponibilidad que incluyan la región, ya que puede que haya problemas de red en esa área.

Diagnostico de cargas de página lentas

¿Dónde está el problema? ¿El servidor tarda en responder, la página es demasiado larga o el explorador necesita demasiado trabajo para mostrarla?

Abra el panel de métricas del navegador. La visualización segmentada del tiempo de carga de página del explorador muestra en qué se va el tiempo.

Si el tiempo de solicitud de envío es alto, puede deberse a que el servidor responde con lentitud o a que la solicitud es un envío con una gran cantidad de datos. Mire las métricas de rendimiento para investigar los tiempos de respuesta.
Configure el seguimiento de dependencias para ver si la lentitud se debe a los servicios externos o a la base de datos.
Si predomina la Recepción de respuesta, la página y sus elementos dependientes (JavaScript, CSS, imágenes y demás, excluidos los datos cargados de forma asincrónica) son largos. Configure una prueba de disponibilidad, y asegúrese de establecer la opción de cargar los elementos dependientes. Cuando obtenga algunos resultados, abra el detalle de un resultado y expándalo para ver los tiempos de carga de los distintos archivos.
Un Tiempo de procesamiento del cliente alto sugiere que los scripts se ejecutan con lentitud. Si el motivo no es obvio, considere la posibilidad de agregar algún código de control de tiempo y enviar las horas en llamadas de trackMetric.

Mejora de páginas lentas

Hay un sitio web completo de consejos sobre cómo mejorar las respuestas del servidor y los tiempos de carga de página, por lo que no intentaremos repetirlo aquí todo otra vez. Estas son algunas sugerencias que probablemente ya conozca, pero que pueden ayudarle a pensar en soluciones:

Lentitud debida a archivos de gran tamaño: cargue los scripts y otras partes de forma asincrónica. Use la agrupación de scripts. Divida la página principal en widgets que cargan sus datos por separado. No envíe simples HTML antiguos para tablas de gran tamaño: use un script para solicitar los datos como JSON u otro formato compacto y luego rellene la tabla en su lugar. Existen excelentes marcos para ayudarle con todas tareas. (También se incluyen los scripts grandes, por supuesto).
Ralentización de las dependencias de servidor: tenga en cuenta las ubicaciones geográficas de los componentes. Por ejemplo, si usa Azure, asegúrese de que el servidor web y la base de datos se encuentran en la misma región. ¿Es posible que consultas las consultas recuperen más información de la que necesitan? ¿Podría ayudar el almacenamiento en caché o el procesamiento por lotes?
Problemas de capacidad: eche una ojeada a las métricas de servidor de tiempos de respuesta y recuentos de solicitudes. Si los tiempos de respuesta presentan picos desproporcionados en recuentos de solicitud, es probable que se está tirando en exceso de los servidores.

Degradación del tiempo de respuesta del servidor

La notificación de degradación del tiempo de respuesta indica lo siguiente:

El tiempo de respuesta en comparación con el tiempo de respuesta normal de esta operación.
El número de usuarios afectados.
El tiempo promedio de respuesta y el tiempo de respuesta del percentil 90 de esta operación en el día de la detección, y siete días antes.
El número de solicitudes de esta operación en el día de la detección y siete días antes.
La correlación entre la degradación en esta operación y las degradaciones en las dependencias relacionadas.
Los vínculos para ayudarlo a diagnosticar el problema:
- Los seguimientos de Profiler pueden ayudarle a ver en qué se ha invertido el tiempo de la operación. El vínculo está disponible si existen ejemplos de seguimiento de Profiler para la operación.
- Los informes de rendimiento del Explorador de métrica, donde puede segmentar y desglosar los filtros o intervalos de tiempo de esta operación.
- Busque esta llamada ver las propiedades de llamadas específicas.
- Informes de error: si el número > 1, significa que hubo errores en esta operación que pueden haber contribuido a la degradación del rendimiento.

Degradación de la duración de la dependencia

Las aplicaciones modernas suelen adoptar enfoques de diseño de microservicios, lo que en muchos casos depende en gran medida de servicios externos. Por ejemplo, si la aplicación se basa en una plataforma de datos o en un proveedor de servicios críticos, como los servicios de Azure AI.

Ejemplo de degradación de la dependencia:

Observe que le indica:

La duración en comparación con el tiempo de respuesta normal de esta operación
El número de usuarios afectados.
La duración media y la duración del percentil 90 de esta dependencia en el día de la detección, y siete días antes.
El número de llamadas de dependencia en el día de la detección y siete días antes.
Los vínculos para ayudarlo a diagnosticar el problema:
- Informes de rendimiento del Explorador de métrica de esta dependencia.
- Busque estas llamadas de dependencia para ver las propiedades de llamadas.
- Informes de error: si el número > 1, significa que hubo errores de llamadas de dependencia durante el período de detección que podrían haber contribuido a la degradación de la duración.
- Abra Análisis con las consultas que calculan el número y la duración de esta dependencia.

Detección inteligente de los patrones de rendimiento lento

Application Insights busca los problemas de rendimiento que podrían afectar solo a algunos de sus usuarios, o bien exclusivamente a sus usuarios en algunos casos. Por ejemplo, si una página se carga más lentamente en tipos de explorador específicos en comparación con otros, o un servidor determinado controla las solicitudes más lentamente que otros servidores. También puede detectar problemas asociados con combinaciones de propiedades, como los clientes de una zona geográfica que usan un determinado sistema operativo y experimentan cargas lentas de página.

Anomalías como estas son difíciles de detectar con tan solo inspeccionar los datos, pero son más comunes de lo que parece. A menudo, solo se muestran cuando se quejan los clientes. Para entonces, ya es demasiado tarde: los usuarios afectados ya se han pasado a sus competidores.

En la actualidad, nuestros algoritmos examinan tiempos de carga de página, tiempos de respuesta de solicitud en el servidor y tiempos de respuesta de dependencia.

No tiene que establecer ningún umbral o regla de configuración. El aprendizaje automático y los algoritmos de minería de datos se usan para detectar patrones anormales.

Cuándo muestra la hora en que se detectó el problema.
Qué describe el problema detectado y las características del conjunto de eventos que se han encontrado, que muestran el comportamiento del problema.
La tabla compara el conjunto de bajo rendimiento con el comportamiento medio del resto de eventos.

Haga clic en los vínculos para abrir el Explorador de métricas a fin de ver los informes relevantes, filtrados por la hora y las propiedades del conjunto de rendimiento lento.

Modifique los filtros y el intervalo de tiempo para explorar la telemetría.

Pasos siguientes

Estas herramientas de diagnóstico lo ayudarán a inspeccionar los datos de telemetría de su aplicación:

La detección inteligente es automática. Pero ¿quizás le gustaría configurar algunas alertas más?

Compartir vía