Claves administradas por el cliente para Azure Machine Learning

Azure Machine Learning se basa en varios servicios de Azure. Aunque los datos almacenados se cifran mediante claves de cifrado que proporciona Microsoft, puede mejorar la seguridad si, además, proporciona sus propias claves (administradas por el cliente). Las claves que proporcione se almacenan en Azure Key Vault. Los datos se almacenan en un conjunto de recursos adicionales que administra en la suscripción de Azure.

Además de las claves administradas por el cliente, Azure Machine Learning también proporciona una marca hbi_workspace. Habilitar esta marca reduce la cantidad de datos que Microsoft recopila para fines de diagnóstico y permite el cifrado adicional en entornos administrados por Microsoft. Esta marca también habilita los comportamientos siguientes:

  • Inicia el cifrado del disco temporal local en el clúster de proceso de Azure Machine Learning si no ha creado ningún clúster anterior en esa suscripción. En caso contrario, debe generar una incidencia de soporte técnico para habilitar el cifrado del disco temporal de los clústeres de proceso.
  • Limpia el disco temporal local entre trabajos.
  • Pasa de forma segura las credenciales de la cuenta de almacenamiento, el registro de contenedor y la cuenta de Secure Shell (SSH) desde la capa de ejecución a los clústeres de proceso mediante el almacén de claves.

La marca hbi_workspace no afecta al cifrado en tránsito. Afecta solo al cifrado en reposo.

Requisitos previos

  • Suscripción a Azure.
  • Una instancia de Azure Key Vault. El almacén de claves contiene las claves para cifrar los servicios.

El almacén debe habilitar la eliminación temporal y la protección de purga. La identidad administrada de los servicios que ayuda a proteger mediante el uso de una clave administrada por el cliente debe tener los permisos siguientes en el almacén de claves:

  • Encapsular clave
  • Desencapsular clave
  • Obtener

Por ejemplo, la identidad administrada para Azure Cosmos DB tendría que tener esos permisos para el almacén de claves.

Limitaciones

  • Tras la creación del área de trabajo, la clave de cifrado administrada por el cliente para los recursos de los que depende el área de trabajo solo se puede actualizar a otra clave del recurso original de Azure Key Vault.
  • Los datos cifrados se almacenan en recursos en un grupo de recursos administrado por Microsoft en la suscripción. No puede crear estos recursos por adelantado ni transferirse la propiedad de estos. El ciclo de vida de los datos se administra indirectamente mediante las API de Azure Machine Learning a medida que crea objetos en el servicio Azure Machine Learning.
  • No se pueden eliminar los recursos administrados por Microsoft que usa para las claves administradas por el cliente sin eliminar también el área de trabajo.
  • No se puede cifrar el disco del sistema operativo del clúster de proceso mediante las claves administradas por el cliente. Debe usar claves administradas por Microsoft.

Advertencia

No elimine el grupo de recursos que contiene esta instancia de Azure Cosmos DB, ni ninguno de los recursos que se crean de forma automática en este grupo. Si tiene que eliminar el grupo de recursos o los servicios administrados por Microsoft en él incluidos, debe eliminar el área de trabajo de Azure Machine Learning que lo usa. Los recursos del grupo de recursos se eliminan cuando elimina el área de trabajo asociada.

Almacenamiento de metadatos del área de trabajo

Al traer su propia clave de cifrado, los metadatos del servicio se almacenan en recursos dedicados de la suscripción de Azure. Microsoft crea un grupo de recursos independiente en la suscripción para este fin: azureml-rg-workspacename_GUID. Solo Microsoft puede modificar los recursos de este grupo de recursos administrados.

Microsoft crea los siguientes recursos para almacenar metadatos para el área de trabajo:

Service Uso Datos de ejemplo
Azure Cosmos DB Almacena datos del historial de trabajos, metadatos de proceso, metadatos de recursos. Los datos pueden incluir nombre del trabajo, estado, número de secuencia y estado; nombre del clúster de proceso, número de núcleos y número de nodos; nombres y etiquetas del almacén de datos, y descripciones de recursos como modelos; y nombres de etiquetas de datos
Azure AI Search Almacena índices que ayudan a consultar el contenido de aprendizaje automático. Estos índices se basan en los datos almacenados en Azure Cosmos DB.
Azure Storage Almacena metadatos relacionados con los datos de canalizaciones de Azure Machine Learning. Los datos pueden incluir nombres de canalización de diseñador, diseño de canalización y propiedades de ejecución.

Desde la perspectiva de la administración del ciclo de vida de los datos, los datos de los recursos anteriores se crean y eliminan a medida que se crean y eliminan los objetos correspondientes en Azure Machine Learning.

El área de trabajo de Azure Machine Learning lee y escribe datos mediante su identidad administrada. A esta identidad se le concede acceso a los recursos mediante una asignación de roles (control de acceso basado en roles de Azure) en los recursos de datos. La clave de cifrado que proporciona se usa para cifrar los datos que se almacenan en recursos administrados por Microsoft. También se usa para crear índices para Búsqueda de Azure AI en tiempo de ejecución.

Los controles de conexión en red adicionales se configuran al crear un punto de conexión de vínculo privado en el área de trabajo para permitir la conectividad de entrada. Esta configuración incluye la creación de una conexión de punto de conexión de vínculo privado a la instancia de Azure Cosmos DB. El acceso a la red está restringido solo a los servicios de Microsoft de confianza.

Claves administradas por el cliente

Cuando no se usa una clave administrada por el cliente, Microsoft crea y administra estos recursos en una suscripción de Azure propiedad de Microsoft, y usa una clave administrada por Microsoft para cifrar los datos.

Cuando se usa una clave administrada por el cliente, los recursos se encuentran en la suscripción de Azure y se cifran con la clave. Aunque estos recursos existen en la suscripción, Microsoft los administra. Se crean y configuran automáticamente al crear el área de trabajo de Azure Machine Learning.

Estos recursos administrados por Microsoft se encuentran en un nuevo grupo de recursos de Azure que se crea en la suscripción. Este grupo de recursos es independiente del grupo de recursos del área de trabajo. Contiene los recursos administrados por Microsoft con los que se usa la clave. La fórmula para asignar un nombre al grupo de recursos es: <Azure Machine Learning workspace resource group name><GUID>.

Sugerencia

Las Unidades de solicitud de Azure Cosmos DB se escalan automáticamente según sea necesario.

Si el área de trabajo de Azure Machine Learning usa un punto de conexión privado, este grupo de recursos también contiene una instancia de Azure Virtual Network administrada por Microsoft. Esta red virtual ayuda a proteger la comunicación entre los servicios administrados y el área de trabajo. No puede proporcionar su propia red virtual para su uso con los recursos administrados por Microsoft. Tampoco puede modificar la red virtual. Por ejemplo, no puede cambiar el rango de direcciones IP que usa.

Importante

Si la suscripción no tiene suficiente cuota para estos servicios, se producirá un error.

Cuando usa una clave administrada por el cliente, los costos de la suscripción son mayores, ya que estos recursos están en su suscripción. Puede usar la calculadora de precios de Azure para calcular los costos.

Almacenamiento de datos de proceso

Azure Machine Learning usa recursos de proceso para entrenar e implementar modelos de Machine Learning. En la tabla siguiente, se describen las opciones de proceso y cómo cada una cifra los datos:

Proceso Cifrado
Azure Container Instances Los datos se cifran con una clave administrada por Microsoft o una clave administrada por el cliente.
Para obtener más información, consulte Cifrado de datos de implementación.
Azure Kubernetes Service Los datos se cifran mediante una clave administrada por Microsoft o una clave administrada por el cliente.
Para obtener más información, consulte Traiga sus propias claves con discos de Azure en Azure Kubernetes Service.
Instancia de proceso de Azure Machine Learning El disco temporal local se cifra si habilita la marca hbi_workspace para el área de trabajo.
Clúster de proceso de Azure Machine Learning El disco del sistema operativo se cifra en Azure Storage con claves administradas por Microsoft. El disco temporal se cifra si habilita la marca hbi_workspace para el área de trabajo.
Proceso Cifrado
Azure Kubernetes Service Los datos se cifran mediante una clave administrada por Microsoft o una clave administrada por el cliente.
Para obtener más información, consulte Traiga sus propias claves con discos de Azure en Azure Kubernetes Service.
Instancia de proceso de Azure Machine Learning El disco temporal local se cifra si habilita la marca hbi_workspace para el área de trabajo.
Clúster de proceso de Azure Machine Learning El disco del sistema operativo se cifra en Azure Storage con claves administradas por Microsoft. El disco temporal se cifra si habilita la marca hbi_workspace para el área de trabajo.

Clúster de proceso

Los clústeres de proceso tienen almacenamiento en disco del sistema operativo local y pueden montar datos de cuentas de almacenamiento en la suscripción durante un trabajo. Al montar datos desde su propia cuenta de almacenamiento en un trabajo, puede habilitar claves administradas por el cliente en esas cuentas de almacenamiento para el cifrado.

El disco del sistema operativo de cada nodo de proceso almacenado en Azure Storage siempre se cifra mediante claves administradas por Microsoft en las cuentas de almacenamiento de Azure Machine Learning, y no con claves administradas por el cliente. Este destino de proceso es efímero, por lo que los datos almacenados en el disco del sistema operativo se eliminan después de que el clúster se reduce verticalmente. Por lo general, los clústeres se reducen verticalmente cuando no hay trabajos en cola, el escalado automático está activado y el número mínimo de nodos se establece en cero. La máquina virtual subyacente se desaprovisiona y el disco del sistema operativo se elimina.

Azure Disk Encryption no se admite con el disco del sistema operativo. Cada máquina virtual tiene también un disco local temporal para las operaciones del sistema operativo. Si quiere, puede usar el disco para almacenar temporalmente los datos de entrenamiento. Si crea el área de trabajo con el parámetro hbi_workspace establecido en TRUE, el disco temporal se cifra. Este entorno es de corta duración (solo dura el tiempo del trabajo) y la compatibilidad con el cifrado se limita únicamente a las claves administradas por el sistema.

Instancia de proceso

El disco del sistema operativo de una instancia de proceso se cifra mediante claves administradas por Microsoft en las cuentas de almacenamiento de Azure Machine Learning. Si crea el área de trabajo con el parámetro hbi_workspace establecido en TRUE, el disco temporal local en la instancia de proceso se cifra con claves administradas por Microsoft. El cifrado de claves administradas por el cliente no se admite en los discos temporales y de sistema operativo.

Marca HBI_workspace

Solo puede establecer la marca hbi_workspace cuando se crea un área de trabajo. No se puede cambiar para un área de trabajo existente.

Al establecer esta marca en TRUE, puede aumentar la dificultad de solucionar problemas porque se envían menos datos de telemetría a Microsoft. Hay menos visibilidad sobre las tasas de éxito o los tipos de problemas. Es posible que Microsoft no pueda reaccionar de forma proactiva cuando esta marca esté establecida en TRUE.

Para habilitar la marca hbi_workspace al crear un área de trabajo de Azure Machine Learning, siga los pasos descritos en uno de los siguientes artículos:

Pasos siguientes