Monitoreo de Azure Dedicated HSM

El servicio Azure Dedicated HSM proporciona un dispositivo físico para un único uso del cliente con un control administrativo completo y responsabilidad de administración. El dispositivo disponible es un modelo A790 de Thales Luna 7 HSM. Microsoft no tiene acceso administrativo después de que un cliente lo aprovisione, más allá de la conexión del puerto serie físico como un rol de supervisión. Como resultado, los clientes son responsables de las actividades operativas típicas, incluida la supervisión completa y el análisis de registros.

Los clientes son totalmente responsables de las aplicaciones que usan los HSM y deben trabajar con Thales para obtener soporte técnico o asistencia de consultoría. Debido al alcance de la responsabilidad del cliente en la higiene operacional, no es posible que Microsoft ofrezca ningún tipo de garantía de alta disponibilidad para este servicio. Es responsabilidad del cliente asegurarse de que sus aplicaciones están configuradas correctamente para lograr una alta disponibilidad. Microsoft supervisa y mantiene el estado del dispositivo y la conectividad de red.

Supervisión de Microsoft

El dispositivo Thales Luna 7 HSM en uso tiene de forma predeterminada SNMP y puerto serie como opciones para supervisar el dispositivo. Microsoft ha utilizado la conexión de puerto serie como medio físico para conectarse al dispositivo y recuperar telemetría básica sobre la salud del dispositivo, incluyendo la temperatura y el estado de los componentes (como fuentes de alimentación y ventiladores).

Para ello, Microsoft usa un rol "monitor" no administrativo configurado en el dispositivo Thales. Este rol brinda la capacidad de recuperar la telemetría, pero no da acceso al dispositivo en cuanto a tareas administrativas ni permite de ninguna manera visualizar información criptográfica. Nuestros clientes pueden estar seguros de que su dispositivo es verdaderamente suyo para gestionar, administrar y utilizar en el almacenamiento confidencial de claves criptográficas. En caso de que cualquier cliente no esté satisfecho con este acceso mínimo para la supervisión básica del estado, tiene la opción de deshabilitar la cuenta de supervisión. La consecuencia obvia de esto es que Microsoft no tendrá información y, por tanto, no podrá proporcionar ninguna notificación proactiva de problemas de estado del dispositivo. En esta situación, el cliente es responsable del estado del dispositivo.

La propia función de supervisión está configurada para sondear el dispositivo cada 10 minutos para obtener datos de estado. Debido a la naturaleza propensa a errores de las comunicaciones en serie, solo después de que se generen varios indicadores de estado negativos durante un período de una hora, se generará una alerta. En última instancia, esta alerta provocaría una comunicación proactiva del cliente que notificaba el problema.

En función de la naturaleza del problema, se tomaría el curso adecuado de la acción para reducir el impacto y garantizar la corrección de bajo riesgo. Por ejemplo, un fallo de alimentación eléctrica es un procedimiento de intercambio en caliente sin ningún evento de manipulación resultante, por lo que se puede realizar con un bajo impacto y un riesgo mínimo para la operación. Otros procedimientos pueden requerir que un dispositivo sea desactivado y desaprovisionado para minimizar cualquier riesgo de seguridad para el cliente. En esta situación, un cliente aprovisionaría un dispositivo alternativo y se volvería a unir a un emparejamiento de alta disponibilidad, lo que provocaría la sincronización del dispositivo. La operación normal se reanudaría en un tiempo mínimo, con una interrupción mínima y un riesgo de seguridad más bajo.

Redundancia de fuente de alimentación

El dispositivo Thales Luna 7 HSM utiliza un diseño de unidad de alimentación dual (PSU) para redundancia. Cada PSU se conecta a una fuente de alimentación independiente, lo que permite que el dispositivo funcione normalmente si una PSU experimenta una breve interrupción.

Durante el mantenimiento programado de energía del centro de datos, las fuentes de alimentación se mantienen activas una a la vez mientras la otra fuente permanece activa, lo que garantiza la operación continua a través de la alimentación redundante. Es posible que vea mensajes transitorios relacionados con una única unidad de fuente de alimentación (PSU) en los registros de HSM, como:

Power supply 1 AC outage
Power supply 1 AC restored

Estos mensajes son comportamiento esperado y no indican un error de hardware: el dispositivo sigue funcionando normalmente en la PSU redundante.

Importante

No abra ninguna incidencia de soporte técnico ni solicite revisiones del hardware físico basadas en los mensajes de registro de una sola PSU. Microsoft supervisa el estado de PSU y soluciona proactivamente los errores de hardware reales. La intervención física innecesaria puede suponer un riesgo para la operación del dispositivo.

Si nuestra supervisión detecta un problema original de PSU o ventilador, Microsoft reemplaza el componente sin requerir la acción o notificación del cliente.

Supervisión de clientes

Una propuesta de valor del servicio Dedicated HSM es el control que obtiene el cliente del dispositivo, especialmente teniendo en cuenta que es un dispositivo entregado en la nube. Una consecuencia de este control es la responsabilidad de supervisar y administrar el estado del dispositivo. El dispositivo Thales Luna 7 HSM incluye instrucciones para la implementación de SNMP y Syslog. Se recomienda a los clientes del servicio HSM dedicado usar esto incluso cuando la cuenta de supervisión de Microsoft permanece activa y debe considerarla obligatoria si deshabilitan la cuenta de Microsoft Monitor. Cualquiera de las técnicas disponibles permitiría a un cliente identificar problemas y llamar al soporte técnico de Microsoft para iniciar el trabajo de corrección adecuado.

Pasos siguientes

Se recomienda que todos los conceptos clave del servicio, como la alta disponibilidad y la seguridad, por ejemplo, se entiendan bien antes de cualquier aprovisionamiento de dispositivos y diseño o implementación de aplicaciones. Temas de nivel de concepto adicionales: