Los errores basados en agente se insertan en Azure Virtual Machines o en instancias de conjunto de escalado de máquinas virtuales instalando el agente de Chaos Studio. Busque las opciones de error directo del servicio para estos recursos en las tablas Máquina virtual y Conjunto de escalado de máquinas virtuales.
Pérdida o interrupción del proceso (por zona de disponibilidad)
Acciones de orquestación
Estas acciones son bloques de creación para construir experimentos efectivos. Úselas en combinación con otros errores, como ejecutar una prueba de carga mientras se cierran instancias de proceso en paralelo en una zona.
Bloquea el tráfico de red para el intervalo de puertos y el bloque de red especificados. Se debe proporcionar al menos una matriz destinationFilter o inboundDestinationFilter.
Requisitos previos
Windows: el agente debe ejecutarse como administrador, lo que sucede de forma predeterminada si se instala como una extensión de máquina virtual.
Linux: el paquete tc (Control de tráfico) se usa para errores de red. Si aún no está instalado, el agente intenta instalarlo automáticamente desde el administrador de paquetes predeterminado.
Urn
urn:csci:microsoft:agent:networkDisconnect/1.1
Tipo de error
Continuo:
Parámetros (clave, valor)
destinationFilters
Matriz JSON delimitada de filtros de paquetes que definen los paquetes salientes que se van a destinar. Máximo de 16.
inboundDestinationFilters
Matriz JSON delimitada de filtros de paquetes que definen los paquetes entrantes que se van a destinar. Máximo de 16.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Los parámetros destinationFilters e inboundDestinationFilters usan la siguiente matriz de filtros de paquetes.
Propiedad
Valor
address
Dirección IP que indica el inicio del intervalo IP.
subnetMask
Máscara de subred para el intervalo de direcciones IP.
portLow
(Opcional) Número de puerto del inicio del intervalo de puertos.
portHigh
(Opcional) Número de puerto del final del intervalo de puertos.
Actualmente, los errores de red basados en agente solo admiten direcciones IPv4.
El error de desconexión de red solo afecta a las nuevas conexiones. Las conexiones activas existentes siguen persistiendo. Puede reiniciar el servicio o el proceso para forzar la interrupción de las conexiones.
Cuando se ejecuta en Windows, el error de desconexión de red solo funciona actualmente con paquetes TCP o UDP.
Cuando se ejecuta en Linux, este error solo puede afectar al tráfico saliente, nunca al entrante. El error puede afectar tanto al tráfico entrante como al saliente en entornos de Windows (a través de los inboundDestinationFilters parámetros y destinationFilters).
Desconexión de red (mediante firewall)
Propiedad
Valor
Nombre de la prestación
NetworkDisconnectViaFirewall-1.0
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows
Descripción
Aplica una regla de firewall de Windows para bloquear el tráfico saliente para el intervalo de puertos y el bloque de red especificados.
Requisitos previos
El agente debe ejecutarse como administrador. Si el agente se instala como una extensión de máquina virtual, se ejecuta como administrador de manera predeterminada.
Matriz JSON delimitada de filtros de paquetes que define los paquetes salientes que se deben dirigir para la inyección de errores.
address
Dirección IP que indica el inicio del intervalo IP.
subnetMask
Máscara de subred para el intervalo de direcciones IP.
portLow
(Opcional) Número de puerto del inicio del intervalo de puertos.
portHigh
(Opcional) Número de puerto del final del intervalo de puertos.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Actualmente, los errores de red basados en agente solo admiten direcciones IPv4.
Este error solo afecta actualmente a las nuevas conexiones. Las conexiones activas existentes no se ven afectadas. Puede reiniciar el servicio o el proceso para forzar la interrupción de las conexiones.
Por el momento, este fallo solo afecta al tráfico de salida.
Latencia de red
Propiedad
Valor
Nombre de la prestación
NetworkLatency-1.1
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows y Linux (solo tráfico saliente)
Descripción
Aumenta la latencia de red para un intervalo de puertos y un bloque de red especificados. Se debe proporcionar al menos una matriz destinationFilter o inboundDestinationFilter.
Requisitos previos
Windows: el agente debe ejecutarse como administrador, lo que sucede de forma predeterminada si se instala como una extensión de máquina virtual.
Linux: el paquete tc (Control de tráfico) se usa para errores de red. Si aún no está instalado, el agente intenta instalarlo automáticamente desde el administrador de paquetes predeterminado.
Urn
urn:csci:microsoft:agent:networkLatency/1.1
Tipo de error
Continuo:
Parámetros (clave, valor)
latencyInMilliseconds
Cantidad de latencia que se va a aplicar en milisegundos.
destinationFilters
Matriz JSON delimitada de filtros de paquetes que definen los paquetes salientes que se van a destinar. Máximo de 16.
inboundDestinationFilters
Matriz JSON delimitada de filtros de paquetes que definen los paquetes entrantes que se van a destinar. Máximo de 16.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Los parámetros destinationFilters e inboundDestinationFilters usan la siguiente matriz de filtros de paquetes.
Propiedad
Valor
address
Dirección IP que indica el inicio del intervalo IP.
subnetMask
Máscara de subred para el intervalo de direcciones IP.
portLow
(Opcional) Número de puerto del inicio del intervalo de puertos.
portHigh
(Opcional) Número de puerto del final del intervalo de puertos.
Actualmente, los errores de red basados en agente solo admiten direcciones IPv4.
Cuando se ejecuta en Linux, el error de latencia de red solo puede afectar al tráfico saliente, nunca al entrante. El error puede afectar tanto al tráfico entrante como al saliente en entornos de Windows (a través de los inboundDestinationFilters parámetros y destinationFilters).
Cuando se ejecuta en Windows, el error de latencia de red solo funciona actualmente con paquetes TCP o UDP.
Este error solo afecta actualmente a las nuevas conexiones. Las conexiones activas existentes no se ven afectadas. Puede reiniciar el servicio o el proceso para forzar la interrupción de las conexiones.
Pérdida de paquetes de red
Propiedad
Valor
Nombre de la prestación
NetworkPacketLoss-1.0
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows y Linux (solo tráfico saliente)
Descripción
Introduce la pérdida de paquetes para el tráfico saliente a una velocidad especificada, entre 0,0 (sin paquetes perdidos) y 1,0 (todos los paquetes perdidos). Esto puede ayudar a simular escenarios como problemas de congestión de red o hardware de red.
Requisitos previos
Windows: el agente debe ejecutarse como administrador, lo que sucede de forma predeterminada si se instala como una extensión de máquina virtual.
Linux: el paquete tc (Control de tráfico) se usa para errores de red. Si aún no está instalado, el agente intenta instalarlo automáticamente desde el administrador de paquetes predeterminado.
Urn
urn:csci:microsoft:agent:networkPacketLoss/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
packetLossRate
Velocidad a la que se perderán los paquetes que coincidan con los filtros de destino, que va de 0,0 a 1,0.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
destinationFilters
Matriz JSON delimitada de filtros de paquetes (parámetros que se indican a continuación) que definen los paquetes salientes que se destinan a la inyección de errores. Máximo de tres.
address
Dirección IP que indica el inicio del intervalo IP.
subnetMask
Máscara de subred para el intervalo de direcciones IP.
portLow
(Opcional) Número de puerto del inicio del intervalo de puertos.
portHigh
(Opcional) Número de puerto del final del intervalo de puertos.
Actualmente, los errores de red basados en agente solo admiten direcciones IPv4.
Cuando se ejecuta en Windows, el error de pérdida de paquete de red solo funciona actualmente con paquetes TCP o UDP.
Cuando se ejecuta en Linux, este error solo puede afectar al tráfico saliente, nunca al entrante. El error puede afectar tanto al tráfico entrante como al saliente en entornos de Windows (a través de los inboundDestinationFilters parámetros y destinationFilters).
Este error solo afecta actualmente a las nuevas conexiones. Las conexiones activas existentes no se ven afectadas. Puede reiniciar el servicio o el proceso para forzar la interrupción de las conexiones.
Aislamiento de red
Propiedad
Valor
Nombre de la prestación
NetworkIsolation-1.0
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows, Linux (solo salida)
Descripción
Para aislar completamente la máquina virtual de las conexiones de red, quite todos los paquetes entrantes (en Windows) y salientes (en Windows y Linux) basados en IP durante la duración especificada. Al final de la duración, se volverán a habilitar las conexiones de red. Dado que el agente depende del tráfico de red, esta acción no se puede cancelar y se ejecutará durante la duración especificada.
Requisitos previos
Windows: el agente debe ejecutarse como administrador, lo que sucede de forma predeterminada si se instala como una extensión de máquina virtual.
Linux: el paquete tc (Control de tráfico) se usa para errores de red. Si aún no está instalado, el agente intenta instalarlo automáticamente desde el administrador de paquetes predeterminado.
Urn
urn:csci:microsoft:agent:networkIsolation/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme, opcional en caso contrario. Obtenga más información sobre los id. de instancia.
Dado que el agente depende del tráfico de red, esta acción no se puede cancelar y se ejecutará durante la duración especificada. Úselo con precaución.
Este error solo afecta actualmente a las nuevas conexiones. Las conexiones activas existentes no se ven afectadas. Puede reiniciar el servicio o el proceso para forzar la interrupción de las conexiones.
Cuando se ejecuta en Linux, este error solo puede afectar al tráfico saliente, nunca al entrante. El error puede afectar tanto al tráfico entrante como al saliente en entornos de Windows.
Error de DNS
Propiedad
Valor
Nombre de la prestación
DnsFailure-1.0
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows
Descripción
Sustituye las respuestas de una solicitud de búsqueda DNS por un código de error especificado. Las solicitudes de búsqueda DNS que se sustituyen deben:
Originarse desde la máquina virtual.
Coincidir con los parámetros de error definidos.
A las búsquedas DNS que no realiza el cliente DNS de Windows no les afectará este error.
Requisitos previos
Ninguno.
Urn
urn:csci:microsoft:agent:dnsFailure/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
hosts
Matriz JSON delimitada de nombres de host para los que se producirá un error en la solicitud de búsqueda DNS.
Esta propiedad acepta caracteres comodín (*), pero solo para el primer subdominio de una dirección y solo se aplica al subdominio para el que se especifican. Por ejemplo:
Se admite *.microsoft.com.
No se admite subdomain.*.microsoft.
*.microsoft.com no tendrá en cuenta varios subdominios en una dirección, como subdomain1.subdomain2.microsoft.com.
dnsFailureReturnCode
Código de error DNS que se va a devolver al cliente para el error de búsqueda (FormErr, ServFail, NXDomain, NotImp, Refused, XDomain, YXRRSet, NXRRSet, NotAuth, NotZone). Para obtener más información sobre los códigos de retorno DNS, consulte el sitio web de IANA.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
El error de DNS requiere Windows 2019 RS5 o posterior.
La caché DNS se omite durante la duración del error para los nombres de host definidos en el error.
Presión de CPU
Propiedad
Valor
Nombre de la prestación
CPUPressure-1.0
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows, Linux
Descripción
Agregue presión de CPU hasta el valor especificado en la máquina virtual donde se inserta este error durante la acción de error. La presión artificial de la CPU se elimina al final de la duración o si se cancela el experimento. En Windows, el contador de rendimiento % de utilidad del procesador se usa al principio del error para determinar el porcentaje de CPU actual, que se resta del elemento pressureLevel definido en el error para que % de utilidad del procesador alcance aproximadamente el elemento pressureLevel definido en los parámetros de error.
Requisitos previos
Linux: debe instalarse la utilidad stress-ng. Esto sucede automáticamente como parte de la instalación del agente mediante el administrador de paquetes predeterminado en varios sistemas operativos, incluyendo los basados en Debian (como Ubuntu), Red Hat Enterprise Linux y OpenSUSE. Para otras distribuciones, incluido Azure Linux, debe instalar stress-ng manualmente. Para obtener más información, consulte el repositorio de proyectos ascendentes.
Windows: ninguno.
Urn
urn:csci:microsoft:agent:cpuPressure/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
pressureLevel
Entero entre 1 y 95 que indica cuánto presión de CPU (%) se aplica a la máquina virtual en términos de % de uso de CPU
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Es posible que el efecto de estrés no finalice correctamente si AzureChaosAgent se termina inesperadamente.
Presión de memoria física
Propiedad
Valor
Nombre de la prestación
PhysicalMemoryPressure-1.0
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows, Linux
Descripción
Agrega presión de memoria física, hasta el valor especificado, en la máquina virtual donde se inserta este error durante la acción de error. La presión de memoria física artificial se elimina al final de la duración o si se cancela el experimento.
Requisitos previos
Linux: debe instalarse la utilidad stress-ng. Esto sucede automáticamente como parte de la instalación del agente mediante el administrador de paquetes predeterminado en varios sistemas operativos, incluyendo los basados en Debian (como Ubuntu), Red Hat Enterprise Linux y OpenSUSE. Para otras distribuciones, incluido Azure Linux, debe instalar stress-ng manualmente. Para obtener más información, consulte el repositorio de proyectos ascendentes.
Entero entre 1 y 95 que indica la cantidad de presión de memoria física (%) que se aplica a la máquina virtual.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Actualmente, el agente de Windows no reduce la presión de memoria cuando otras aplicaciones aumentan su uso de memoria. Si el uso general de memoria supera el 100 %, el agente de Windows podría bloquearse.
Presión de memoria virtual
Propiedad
Valor
Nombre de la prestación
VirtualMemoryPressure-1.0
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows
Descripción
Agrega presión de memoria virtual, hasta el valor especificado, en la máquina virtual donde se inserta este error durante la acción de error. La presión de memoria virtual artificial se elimina al final de la duración o si se cancela el experimento.
Entero entre 1 y 95 que indica la cantidad de presión de memoria física (%) que se aplica a la máquina virtual.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Usa la utilidad diskspd para agregar presión de disco a una máquina virtual. De forma predeterminada, se agrega presión al disco principal o al disco especificado con el parámetro targetTempDirectory. Este error tiene cinco modos de ejecución diferentes. La presión del disco artificial se elimina al final de la duración o si se cancela el experimento.
Requisitos previos
Ninguno.
Urn
urn:csci:microsoft:agent:diskIOPressure/1.1
Tipo de error
Continuo:
Parámetros (clave, valor)
pressureMode
Modo preestablecido de presión de disco que se agrega al almacenamiento principal de la máquina virtual. Debe ser uno de los PressureModes de la tabla siguiente.
targetTempDirectory
(Opcional) Directorio que se va a usar para aplicar presión al disco. Por ejemplo, D:/Temp. Si el parámetro no está incluido, se agregará presión al disco principal.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Usa stress-ng para aplicar presión al disco. Se generan uno o varios procesos de trabajo que realizan procesos de E/S con archivos temporales. De forma predeterminada, se agrega presión al disco principal o al disco especificado con el parámetro targetTempDirectory. Para obtener información sobre cómo se aplica la presión, consulte el artículo stress-ng.
Requisitos previos
Linux: debe instalarse la utilidad stress-ng. Esto sucede automáticamente como parte de la instalación del agente mediante el administrador de paquetes predeterminado en varios sistemas operativos, incluyendo los basados en Debian (como Ubuntu), Red Hat Enterprise Linux y OpenSUSE. Para otras distribuciones, incluido Azure Linux, debe instalar stress-ng manualmente. Para obtener más información, consulte el repositorio de proyectos ascendentes.
Urn
urn:csci:microsoft:agent:linuxDiskIOPressure/1.1
Tipo de error
Continuo:
Parámetros (clave, valor)
workerCount
Número de procesos de trabajo que se ejecutarán. Establecer workerCount en 0 genera tantos procesos de trabajo como número de procesadores haya.
fileSizePerWorker
Tamaño del archivo temporal con el que un trabajo realiza operaciones de E/S. Entero más una unidad en bytes (b), kilobytes (k), megabytes (m) o gigabytes (g) (por ejemplo, 4m para 4 megabytes y 256g para 256 gigabytes).
blockSize
Tamaño de bloque que se usará para las operaciones de E/S de disco, superiores a 1 byte e inferiores a 4 megabytes (el valor máximo es 4095k). Entero más una unidad en bytes, kilobytes o megabytes (por ejemplo, 512k para 512 kilobytes).
targetTempDirectory
(Opcional) Directorio que se va a usar para aplicar presión al disco. Por ejemplo, /tmp/. Si el parámetro no está incluido, se agregará presión al disco principal.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Ejemplo de JSON
Estos valores de ejemplo produjeron aproximadamente un 100 % de presión de disco cuando se probaron en una máquina virtual Standard_D2s_v3 con LRS SSD prémium. Un fileSizePerWorker grande y un blockSize más pequeño ayudan a que el disco se esfuerce por completo.
Detiene un servicio de Windows o un servicio con sistema Linux durante el error. Lo reinicia al final de la duración o si se cancela el experimento.
Requisitos previos
Ninguno.
Urn
urn:csci:microsoft:agent:stopService/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
serviceName
Nombre del servicio de Windows o del servicio con sistema Linux que desea detener.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Windows: no se admiten nombres para mostrar para los servicios. Use sc.exe query en el símbolo del sistema para explorar los nombres de servicio.
Linux: no se admiten otros tipos de servicio aparte de systemd, como sysvinit.
Proceso de terminación
Propiedad
Valor
Nombre de la prestación
KillProcess-1.0
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows, Linux
Descripción
Termina todas las instancias en ejecución de un proceso que coincide con el nombre del proceso enviado en los parámetros de error. Dentro de la duración establecida para la acción de error, un proceso se termina de forma repetitiva en función del valor del intervalo de eliminación especificado. Este es un error destructivo donde el administrador del sistema tendrá que recuperar manualmente el proceso si la recuperación automática está configurada para el proceso. Tenga en cuenta que se producirá un error cuando se use en un proceso de nombre vacío, cuando se use con un intervalo no especificado o cuando no podamos encontrar el nombre del proceso de destino que queremos eliminar.
Requisitos previos
Ninguno.
Urn
urn:csci:microsoft:agent:killProcess/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
processName
Nombre de un proceso que se va a terminar continuamente (sin el .exe). No es necesario ejecutar el proceso cuando el error comienza a ejecutarse.
killIntervalInMilliseconds
Cantidad de tiempo que espera el error entre intentos sucesivos de eliminación en milisegundos.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Pausa (suspende) los procesos especificados durante la duración especificada. Si hay varios procesos con el mismo nombre, este error suspende todos esos procesos. Dentro de la duración del error, los procesos se pausan repetidamente en el intervalo especificado. Al final de la duración o si se cancela el experimento, los procesos se reanudarán.
Requisitos previos
Ninguno.
Urn
urn:csci:microsoft:agent:pauseProcess/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
processNames
Matriz JSON delimitada de nombres de proceso que definen qué procesos se van a pausar. Máximo de 4. El nombre del proceso puede incluir opcionalmente la extensión ".exe".
pauseIntervalInMilliseconds
Cantidad de tiempo que el error espera entre intentos sucesivos de pausa, en milisegundos.
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Actualmente, se puede enumerar un máximo de 4 nombres de proceso en el parámetro processNames.
Cambio de hora
Propiedad
Valor
Nombre de la prestación
TimeChange-1.0
Tipo de destino
Microsoft-Agent
Tipos de sistema operativo admitidos
Windows
Descripción
Cambia la hora del sistema de la máquina virtual y la restablece al final del experimento o si este se cancela.
Requisitos previos
Ninguno.
Urn
urn:csci:microsoft:agent:timeChange/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
dateTime
Una cadena DateTime en formato ISO8601. Si faltan valores YYYY-MM-DD, el valor predeterminado es el día actual cuando se ejecuta el experimento. Si faltan valores hh:mm:ss, el valor predeterminado es 12:00:00 AM. Si se proporciona un año de 2 dígitos (YY), se convierte en un año de 4 dígitos (YYYY) basado en el siglo actual. Si falta la zona horaria <Z>, el desplazamiento predeterminado es la zona horaria local. <Z> debe incluir siempre un símbolo de signo (negativo o positivo).
virtualMachineScaleSetInstances
Matriz de id. de instancia al aplicar este error a un conjunto de escalado de máquinas virtuales. Necesario para los conjuntos de escalado de máquinas virtuales en modo de orquestación uniforme. Obtenga más información sobre los id. de instancia.
Ejecuta cualquier comando stress-ng pasando argumentos directamente a stress-ng. Resulta útil cuando uno de los errores predefinidos para stress-ng no satisface sus necesidades.
Requisitos previos
Linux: debe instalarse la utilidad stress-ng. Esto sucede automáticamente como parte de la instalación del agente mediante el administrador de paquetes predeterminado en varios sistemas operativos, incluyendo los basados en Debian (como Ubuntu), Red Hat Enterprise Linux y OpenSUSE. Para otras distribuciones, incluido Azure Linux, debe instalar stress-ng manualmente. Para obtener más información, consulte el repositorio de proyectos ascendentes.
Urn
urn:csci:microsoft:agent:stressNg/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
stressNgArguments
Uno o varios argumentos que se pasarán al proceso stress-ng. Para obtener información sobre los posibles argumentos de stress-ng, consulte el artículo stress-ng. NOTA: NO incluya el argumento "-t" porque provocará un error. La longitud del experimento se define directamente en la interfaz de usuario del experimento del caos de Azure, NO en stressNgArguments.
Detiene las aplicaciones de App Service de destino y, a continuación, las reinicia al final de la duración del error. Esto se aplica a los recursos del tipo "Microsoft.Web/sites", incluidos App Service, API Apps, Mobile Apps y Azure Functions.
Deshabilita el servicio de escalado automático. Cuando la escalabilidad automática está deshabilitada, recursos como los conjuntos de escalado de máquinas virtuales, aplicaciones web, Service Bus y mucho más no se agregan ni se quitan automáticamente en función de la carga de la aplicación.
Requisitos previos
El recurso autoScalesetting que está habilitado en el recurso debe incorporarse a Chaos Studio.
Tipos de sistema operativo del grupo de nodos admitidos
Linux
Descripción
Hace que un error de red disponible a través de Chaos Mesh se ejecute en el clúster de Azure Kubernetes Service (AKS). Resulta útil para volver a crear incidentes de AKS resultantes de interrupciones de red, retrasos, duplicaciones, pérdidas y daños.
Especificación de Chaos Mesh con formato JSON que usa el tipo NetworkChaos. Puede usar un convertidor de YAML a JSON como Convertir YAML a JSON para convertir el YAML de Chaos Mesh a JSON y minificarlo. Use comillas simples dentro del JSON o escape las comillas con un carácter de barra diagonal inversa. Incluya solo el YAML en la propiedad jsonSpec. No incluya información como metadatos o el tipo. La especificación de la duración dentro de jsonSpec no es necesaria, pero se usará si está disponible.
Tipos de sistema operativo del grupo de nodos admitidos
Linux
Descripción
Provoca un error de pod disponible a través de Chaos Mesh para ejecutarse en el clúster de AKS. Resulta útil para volver a crear incidentes de AKS que son el resultado de errores de pod o problemas de contenedor.
Especificación de Chaos Mesh con formato JSON que usa el tipo podChaos. Puede usar un convertidor de YAML a JSON como Convertir YAML a JSON para convertir el YAML de Chaos Mesh a JSON y minificarlo. Use comillas simples dentro del JSON o escape las comillas con un carácter de barra diagonal inversa. Incluya solo el YAML en la propiedad jsonSpec. No incluya información como metadatos o el tipo. La especificación de la duración dentro de jsonSpec no es necesaria, pero se usará si está disponible.
Tipos de sistema operativo del grupo de nodos admitidos
Linux
Descripción
Provoca un error de esfuerzo disponible a través de Chaos Mesh para ejecutarse en el clúster de AKS. Resulta útil para volver a crear incidentes de AKS debido a las sobrecargas en una colección de pods, por ejemplo, debido a un consumo elevado de CPU o memoria.
Especificación de Chaos Mesh con formato JSON que usa el tipo StressChaos. Puede usar un convertidor de YAML a JSON como Convertir YAML a JSON para convertir el YAML de Chaos Mesh a JSON y minificarlo. Use comillas simples dentro del JSON o escape las comillas con un carácter de barra diagonal inversa. Incluya solo el YAML en la propiedad jsonSpec. No incluya información como metadatos o el tipo. La especificación de la duración dentro de jsonSpec no es necesaria, pero se usará si está disponible.
Tipos de sistema operativo del grupo de nodos admitidos
Linux
Descripción
Provoca un error de E/S disponible a través de Chaos Mesh para ejecutarse en el clúster de AKS. Resulta útil para volver a crear incidentes de AKS debido a retrasos de E/S y errores de lectura y escritura cuando se usan llamadas del sistema de E/S, como open, read o write.
Especificación de Chaos Mesh con formato JSON que usa el tipo IOChaos. Puede usar un convertidor de YAML a JSON como Convertir YAML a JSON para convertir el YAML de Chaos Mesh a JSON y minificarlo. Use comillas simples dentro del JSON o escape las comillas con un carácter de barra diagonal inversa. Incluya solo el YAML en la propiedad jsonSpec. No incluya información como metadatos o el tipo. La especificación de la duración dentro de jsonSpec no es necesaria, pero se usará si está disponible.
Tipos de sistema operativo del grupo de nodos admitidos
Linux
Descripción
Provoca un cambio en el reloj del sistema en el clúster de AKS mediante Chaos Mesh. Resulta útil para volver a crear incidentes de AKS que se deban a sistemas distribuidos que no están sincronizados, lógica de año bisiesto o segundo intercalar ausente o incorrecta, etc.
Especificación de Chaos Mesh con formato JSON que usa el tipo TimeChaos. Puede usar un convertidor de YAML a JSON como Convertir YAML a JSON para convertir el YAML de Chaos Mesh a JSON y minificarlo. Use comillas simples dentro del JSON o escape las comillas con un carácter de barra diagonal inversa. Incluya solo el YAML en la propiedad jsonSpec. No incluya información como metadatos o el tipo. La especificación de la duración dentro de jsonSpec no es necesaria, pero se usará si está disponible.
Tipos de sistema operativo del grupo de nodos admitidos
Linux
Descripción
Provoca un error de kernel disponible a través de Chaos Mesh para ejecutarse en el clúster de AKS. Resulta útil para volver a crear incidentes de AKS debidos a errores de nivel de kernel de Linux, como un error de montaje o falta de asignación de memoria.
Especificación de Chaos Mesh con formato JSON que usa el tipo KernelChaos. Puede usar un convertidor de YAML a JSON como Convertir YAML a JSON para convertir el YAML de Chaos Mesh a JSON y minificarlo. Use comillas simples dentro del JSON o escape las comillas con un carácter de barra diagonal inversa. Incluya solo el YAML en la propiedad jsonSpec. No incluya información como metadatos o el tipo. La especificación de la duración dentro de jsonSpec no es necesaria, pero se usará si está disponible.
Tipos de sistema operativo del grupo de nodos admitidos
Linux
Descripción
Provoca un error de HTTP disponible a través de Chaos Mesh para ejecutarse en el clúster de AKS. Resulta útil para volver a crear incidentes debidos a errores de procesamiento de solicitudes y respuestas HTTP, como respuestas retrasadas o incorrectas.
Especificación de Chaos Mesh con formato JSON que usa el tipo HTTPChaos. Puede usar un convertidor de YAML a JSON como Convertir YAML a JSON para convertir el YAML de Chaos Mesh a JSON y minificarlo. Use comillas simples dentro del JSON o escape las comillas con un carácter de barra diagonal inversa. Incluya solo el YAML en la propiedad jsonSpec. No incluya información como metadatos o el tipo. La especificación de la duración dentro de jsonSpec no es necesaria, pero se usará si está disponible.
Tipos de sistema operativo del grupo de nodos admitidos
Linux
Descripción
Provoca un error de DNS disponible a través de Chaos Mesh para ejecutarse en el clúster de AKS. Resulta útil para volver a crear incidentes debido a errores de DNS.
Especificación de Chaos Mesh con formato JSON que usa el tipo DNSChaos. Puede usar un convertidor de YAML a JSON como Convertir YAML a JSON para convertir el YAML de Chaos Mesh a JSON y minificarlo. Use comillas simples dentro del JSON o escape las comillas con un carácter de barra diagonal inversa. Incluya solo el YAML en la propiedad jsonSpec. No incluya información como metadatos o el tipo. La especificación de la duración dentro de jsonSpec no es necesaria, pero se usará si está disponible.
El error de reinicio hace que un reinicio forzado simule mejor un evento de interrupción, lo cual significa que existe la posibilidad de que se produzca una pérdida de datos.
El error de reinicio es un tipo de error discreto. A diferencia de los errores continuos, es una acción única y no tiene ninguna duración.
Conmutación por error de Cosmos DB
Propiedad
Valor
Nombre de la prestación
Failover-1.0
Tipo de destino
Microsoft-CosmosDB
Descripción
Hace que una cuenta de Azure Cosmos DB con una sola región de escritura conmute por error a una región de lectura especificada para simular una interrupción de la región de escritura.
Requisitos previos
Ninguno.
Urn
urn:csci:microsoft:cosmosDB:failover/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
readRegion
La región de lectura que se debe promover a la región de escritura durante la conmutación por error; por ejemplo, East US 2.
Establece centros de eventos individuales en el estado deseado dentro de un espacio de nombres de Azure Event Hubs. Es posible afectar a nombres específicos del centro de eventos o usar “*” para afectar a todo el espacio de nombres. Esto puede ayudar a probar la infraestructura de mensajería para escenarios de mantenimiento o error. Se trata de un error discreto, por lo que la entidad no se devolverá automáticamente al estado inicial.
Estado deseado del centro de eventos de destino. Los estados posibles son Active, Disabled y SendDisabled.
eventHubs
Lista separada por comas de los nombres del centro de eventos dentro del espacio de nombres de destino. Use "*" para que afecte a todas las entidades del espacio de nombres.
Bloquea todo el acceso de red a un almacén de claves modificando temporalmente las reglas de red del almacén de claves. Esta acción impide que una aplicación dependiente del almacén de claves acceda a secretos, claves o certificados. Si el almacén de claves permite el acceso a todas las redes, esta configuración solo se cambia para permitir el acceso desde redes seleccionadas. No hay ninguna red virtual en la lista de permitidos al principio del error. Se permite el acceso a todas las redes al final de la duración del error. Si el almacén de claves está establecido para permitir solo el acceso desde redes seleccionadas, las redes virtuales de la lista de permitidos se quitan al principio del error. Se restauran al final de la duración del error.
Requisitos previos
El almacén de claves de destino no puede tener ninguna regla de firewall y no debe establecerse para permitir que los servicios de Azure omitan el firewall. Si el almacén de claves de destino está establecida para permitir solo el acceso desde redes seleccionadas, debe haber al menos una regla de red virtual. El almacén de claves no puede estar en modo de recuperación.
Mediante el uso de propiedades de certificado, el error deshabilita el certificado durante una duración específica (proporcionada por el usuario). Habilita el certificado después de esta duración del error.
Genera una nueva versión de certificado y una huella digital mediante la biblioteca cliente de certificados de Key Vault. El certificado de trabajo actual se actualiza a esta versión. La versión del certificado no se revierte después de la duración del error.
Las directivas de certificado (por ejemplo, el período de validez del certificado, el tipo de certificado, el tamaño de clave o el tipo de clave) se actualizan en función de la entrada del usuario y se revierten después de la duración del error.
Nombre del certificado de Azure Key Vault en el que se ejecuta el error.
version
Versión del certificado que se debe actualizar. Si no se especifica, se actualizará la versión más reciente.
enabled
booleano. Valor que indica si la nueva versión del certificado está habilitada.
validityInMonths
Período de validez del certificado en meses.
certificateTransparency
Indica si el certificado se debe publicar en la lista de transparencia del certificado al crearse.
certificateType
Tipo de certificado.
contentType
Tipo de contenido del certificado. Por ejemplo, es Pkcs12 cuando el certificado contiene bytes PFX sin procesar o Pem cuando contiene bytes codificados en PEM ASCII. Pkcs12 es el valor predeterminado asumido.
keySize
Tamaño de la clave RSA: 2048, 3072 o 4096.
exportable
booleano. Valor que indica si la clave de certificado se puede exportar desde el almacén o el almacén de certificados seguro.
reuseKey
booleano. Valor que indica si se debe reutilizar la clave de certificado cuando se gira el certificado.
keyType
Tipo de clave de respaldo generada cuando se emiten nuevos certificados, como RSA o EC.
Habilita la manipulación o creación de reglas en un grupo de seguridad de red (NSG) de Azure existente o en un conjunto de grupos de seguridad de red de Azure, suponiendo que la definición de regla sea aplicable en todos los grupos de seguridad. Útil para:
Simular una interrupción de una dependencia/no dependencia descendente o entre regiones.
Simular un evento que se espera que desencadene una lógica para forzar una conmutación por error de servicio.
Simular un evento que se espera que desencadene una acción desde un servicio de supervisión o administración de estado.
Usarla como alternativa para bloquear o permitir el tráfico de red en el que no se puede implementar el agente de Chaos.
Un nombre único para la regla de seguridad que se crea. Se producirá un error si ya existe otra regla en NSG con el mismo nombre. Debe comenzar con una letra o número. Debe finalizar en una letra, un número o un carácter de subrayado. Solo puede contener letras, números, caracteres de subrayado, puntos o guiones.
protocolo
Protocolo para la regla de seguridad. Debe ser Cualquiera, TCP, UDP o ICMP.
sourceAddresses
Cadena que representa una matriz delimitada por JSON de direcciones IP con formato CIDR. También puede ser un nombre de etiqueta de servicio para una regla de entrada; por ejemplo, AppService. También se puede usar un asterisco * para establecer correspondencia entre todas las IP de origen.
destinationAddresses
Cadena que representa una matriz delimitada por JSON de direcciones IP con formato CIDR. También puede ser un nombre de etiqueta de servicio para una regla de salida; por ejemplo, AppService. También se puede usar un asterisco * para establecer correspondencia entre todas las IP de destino.
action
Tipo de acceso del grupo de seguridad. Debe ser Permitir o Denegar.
destinationPortRanges
Cadena que representa una matriz delimitada por JSON de puertos únicos o intervalos de puertos, como 80 o 1024-65535.
sourcePortRanges
Cadena que representa una matriz delimitada por JSON de puertos únicos o intervalos de puertos, como 80 o 1024-65535.
priority
Escriba un valor de 100 a 4096 que sea único para todas las reglas de seguridad del NSG. Se producirá un error si ya existe otra regla en NSG con la misma prioridad.
direction
Dirección del tráfico afectado por la regla de seguridad. Debe ser Entrante o Saliente.
El error solo se puede aplicar a un grupo de seguridad de red existente.
Cuando se aplica una regla de NSG destinada a denegar el tráfico, las conexiones existentes no se dividirán hasta que hayan estado inactivas durante 4 minutos. Una solución alternativa consiste en agregar otra rama en el mismo paso que usa un error que hará que las conexiones existentes se interrumpan cuando se aplica el error de NSG. Por ejemplo, eliminar el proceso, detener temporalmente el servicio o reiniciar la máquina virtual provocará el restablecimiento de las conexiones.
Las reglas se aplican al principio de la acción. Los cambios externos en la regla durante la duración de la acción provocan un error en el experimento.
No se admite la creación o modificación de reglas del grupo de seguridad de aplicaciones.
Los valores de prioridad deben ser únicos en cada NSG de destino. Si se intenta crear una nueva regla que tenga el mismo valor de prioridad que otra, se producirá un error en el experimento.
La regla de seguridad de NSG versión 1.1 error admite un parámetro flushConnection adicional. Esta funcionalidad tiene un problema conocido activo: si flushConnection está habilitado, el error puede provocar un error "FlushingNetworkSecurityGroupConnectionIsNotEnabled". Para evitar este error temporalmente, deshabilite el parámetro flushConnection o use la versión de la regla de seguridad de NSG 1.0 error.
Service Bus: Cambiar el estado de la cola
Propiedad
Valor
Nombre de la prestación
ChangeQueueState-1.0
Tipo de destino
Microsoft-ServiceBus
Descripción
Establece las entidades Queue dentro de un espacio de nombres de Service Bus en el estado deseado. Puede afectar a nombres de entidad específicos o puede usar "*" para afectarlos a todos. Esto puede ayudar a probar la infraestructura de mensajería para escenarios de mantenimiento o error. Se trata de un error discreto, por lo que la entidad no se devolverá automáticamente al estado inicial.
Requisitos previos
Un espacio de nombres de Service Bus con al menos una entidad Queue.
Estado deseado para las colas de destino. Los estados posibles son Active, Disabled, SendDisabled y ReceiveDisabled.
queues
Lista separada por comas de los nombres de cola dentro del espacio de nombres de destino. Use "*" para afectar a todas las colas del espacio de nombres.
Se puede pasar un máximo de 1000 entidades de cola a este error.
Service Bus: Cambiar el estado de la suscripción
Propiedad
Valor
Nombre de la prestación
ChangeSubscriptionState-1.0
Tipo de destino
Microsoft-ServiceBus
Descripción
Establece las entidades Subscription dentro de un espacio de nombres de Service Bus y Topic en el estado deseado. Puede afectar a nombres de entidad específicos o puede usar "*" para afectarlos a todos. Esto puede ayudar a probar la infraestructura de mensajería para escenarios de mantenimiento o error. Se trata de un error discreto, por lo que la entidad no se devolverá automáticamente al estado inicial.
Estado deseado para las suscripciones de destino. Los estados posibles son Activo y Deshabilitado.
topic
El tema primario que contiene una o varias suscripciones que se van a afectar.
subscriptions
Lista separada por comas de los nombres de suscripción dentro del espacio de nombres de destino. Use "*" para afectar a todas las suscripciones del espacio de nombres.
Se puede pasar un máximo de 1000 entidades Subscription a este error.
Service Bus: Cambiar el estado del tema
Propiedad
Valor
Nombre de la prestación
ChangeTopicState-1.0
Tipo de destino
Microsoft-ServiceBus
Descripción
Establece las entidades Topic especificadas dentro de un espacio de nombres de Service Bus en el estado deseado. Puede afectar a nombres de entidad específicos o puede usar "*" para afectarlos a todos. Esto puede ayudar a probar la infraestructura de mensajería para escenarios de mantenimiento o error. Se trata de un error discreto, por lo que la entidad no se devolverá automáticamente al estado inicial.
Requisitos previos
Un espacio de nombres de Service Bus con al menos una entidad Topic.
Estado deseado para los temas de destino. Los estados posibles son Activo y Deshabilitado.
topics
Lista separada por comas de los nombres de tema dentro del espacio de nombres de destino. Use "*" para afectar a todos los temas del espacio de nombres.
Se puede pasar un máximo de 1000 entidades Topic a este error.
Reimplementación de máquinas virtuales
Propiedad
Valor
Nombre de la prestación
Redeploy-1.0
Tipo de destino
Microsoft-VirtualMachine
Descripción
Vuelve a implementar una máquina virtual al apagarla, moverla a un nuevo nodo de la infraestructura de Azure y volver a encenderla. Esto ayuda a validar la resistencia de la carga de trabajo a los eventos de mantenimiento.
La operación de reimplementación de la máquina virtual se limita en un intervalo de 10 horas. Si se produce un error en el experimento con un error "Demasiadas solicitudes de reimplementación", espere 10 horas para reintentar el experimento.
Apagado de la máquina virtual
Propiedad
Valor
Nombre de la prestación
Shutdown-1.0
Tipo de destino
Microsoft-VirtualMachine
Tipos de sistema operativo admitidos
Windows y Linux.
Descripción
Apaga una máquina virtual mientras dure el error. La reinicia al final del experimento o si este se cancela. solo se admiten VM de Azure Resource Manager.
Requisitos previos
Ninguno.
Urn
urn:csci:microsoft:virtualMachine:shutdown/1.0
Tipo de error
Continuo:
Parámetros (clave, valor)
abruptShutdown
(Opcional) Valor booleano que indica si la máquina virtual debe apagarse correcta o repentinamente (de forma destructiva).
Apagado del conjunto de escalado de máquinas virtuales
Este error tiene dos versiones disponibles que puede usar: versión 1.0 y versión 2.0. La principal diferencia es que la versión 2.0 permite filtrar por zonas de disponibilidad, solo cerrando instancias dentro de una zona o zonas especificadas.
Apagado del conjunto de escalado de máquinas virtuales versión 1.0
Propiedad
Valor
Nombre de la prestación
Versión 1.0
Tipo de destino
Microsoft-VirtualMachineScaleSet
Tipos de sistema operativo admitidos
Windows y Linux.
Descripción
Apaga o elimina una instancia del conjunto de escalado de máquinas virtuales durante el error y reinicia la máquina virtual al final de la duración del error o si se cancela el experimento.
(Opcional) Booleano que indica si la instancia del conjunto de escalado de máquinas virtuales debe apagarse correcta o repentinamente (de forma destructiva).
instances
Cadena que es una matriz delimitada de identificadores de instancia del conjunto de escalado de máquinas virtuales a los que se aplica el error.
Apagado del conjunto de escalado de máquinas virtuales versión 2.0
Propiedad
Valor
Nombre de la prestación
Shutdown-2.0
Tipo de destino
Microsoft-VirtualMachineScaleSet
Tipos de sistema operativo admitidos
Windows y Linux.
Descripción
Apaga o elimina una instancia del conjunto de escalado de máquinas virtuales durante el error. Reinicia la máquina virtual al final de la duración del error o si se cancela el experimento. Admite los destinos dinámicos.
(Opcional) Disponible a partir de la versión 2.0. Se usa para filtrar la lista de destinos de un selector. Actualmente admite el filtrado en una lista de zonas. El filtro solo se aplica a los recursos del conjunto de escalado de máquinas virtuales dentro de una zona:
Si no se especifica ningún filtro, este error cierra todas las instancias del conjunto de escalado de máquinas virtuales.
El experimento tiene como destino todas las instancias del conjunto de escalado de máquinas virtuales en las zonas especificadas.
Si un filtro no da como resultado ningún destino, se produce un error en el experimento.
Parámetros (clave, valor)
abruptShutdown
(Opcional) Booleano que indica si la instancia del conjunto de escalado de máquinas virtuales debe apagarse correcta o repentinamente (de forma destructiva).
Fragmentos de código JSON de ejemplo de la versión 2.0
Los fragmentos de código siguientes muestran cómo configurar tanto el filtrado dinámico como el error de apagado 2.0.
Actualmente, solo se admiten conjuntos de escalado de máquinas virtuales configurados con el modo de orquestación Uniforme. Si el conjunto de escalado de máquinas virtuales usa la orquestación flexible, puede usar el error de apagado de la máquina virtual de Azure Resource Manager para apagar las instancias seleccionadas.
Detalles: acciones de orquestación
Delay
Propiedad
Valor
Proveedor de errores
N/D
Tipos de sistema operativo admitidos
N/D
Descripción
Agrega un retraso de tiempo antes, entre o después de otras acciones de un experimento. Esto no es un error y se usa para sincronizar acciones dentro de un experimento. Use esta acción para esperar a que aparezca el impacto de un error en un servicio o espere a que se complete una actividad fuera del experimento. Por ejemplo, el experimento podría esperar a que se produzca el ensayo automático antes de insertar otro error.
Requisitos previos
N/D
Urn
urn:csci:microsoft:chaosStudio:timedDelay/1.0
Duration
Duración del retraso en formato ISO 8601 (por ejemplo, PT10M).
Azure HPC es una capacidad en la nube creada a propósito para la carga de trabajo de IA y de HPC, mediante procesadores de vanguardia e interconexión InfiniBand de clase HPC, con el fin de ofrecer el mejor rendimiento, escalabilidad y valor de la aplicación. Azure HPC permite a los usuarios desbloquear la innovación, la productividad y la agilidad empresarial, mediante una gama de tecnologías de inteligencia artificial y de HPC de alta disponibilidad que se pueden asignar dinámicamente a medida que cambian