Chaves gerenciadas pelo cliente para o Azure Machine Learning

O Azure Machine Learning baseia-se em vários serviços do Azure. Embora os dados armazenados sejam criptografados por meio de chaves de criptografia fornecidas pela Microsoft, você pode aumentar a segurança fornecendo também suas próprias chaves (gerenciadas pelo cliente). As chaves fornecidas são armazenadas no Cofre da Chave do Azure. Seus dados são armazenados em um conjunto de recursos adicionais que você gerencia em sua assinatura do Azure.

Além das chaves gerenciadas pelo cliente, o Aprendizado de Máquina do Azure fornece um sinalizador de hbi_workspace. Habilitar esse sinalizador reduz a quantidade de dados que a Microsoft coleta para fins de diagnóstico e permite criptografia extra em ambientes gerenciados pela Microsoft. Esse sinalizador também permite os seguintes comportamentos:

  • Começa a criptografar o disco de trabalho local em seu cluster de computação do Azure Machine Learning, se você não criou nenhum cluster anterior nessa assinatura. Caso contrário, você precisará gerar um tíquete de suporte para habilitar a criptografia do disco de trabalho para seus clusters de computação.
  • Limpa o disco de trabalho local entre trabalhos.
  • Transmite com segurança credenciais para sua conta de armazenamento, registro de contêiner e conta Secure Shell (SSH) da camada de execução para seus clusters de computação usando seu cofre de chaves.

O hbi_workspace sinalizador não afeta a criptografia em trânsito. Afeta apenas a encriptação em repouso.

Pré-requisitos

  • Uma subscrição do Azure.
  • Uma instância do Azure Key Vault. O cofre de chaves contém as chaves para criptografar seus serviços.

O cofre de chaves deve habilitar a proteção contra exclusão suave e limpeza. A identidade gerenciada para os serviços que você ajuda a proteger usando uma chave gerenciada pelo cliente deve ter as seguintes permissões para o cofre de chaves:

  • Moldar Chave
  • Anular a Moldagem da Chave
  • Obtenção

Por exemplo, a identidade gerenciada do Azure Cosmos DB precisaria ter essas permissões para o cofre de chaves.

Limitações

  • Após a criação do espaço de trabalho, a chave de criptografia gerenciada pelo cliente para recursos dos quais o espaço de trabalho depende só pode ser atualizada para outra chave no recurso original do Cofre de Chaves do Azure.
  • Os dados criptografados são armazenados em recursos em um grupo de recursos gerenciado pela Microsoft em sua assinatura. Você não pode criar esses recursos antecipadamente ou transferir a propriedade deles para você. O ciclo de vida dos dados é gerenciado indiretamente por meio das APIs do Azure Machine Learning à medida que você cria objetos no serviço Azure Machine Learning.
  • Não é possível excluir recursos gerenciados pela Microsoft que você usa para chaves gerenciadas pelo cliente sem excluir também seu espaço de trabalho.
  • Não é possível criptografar o disco do sistema operacional do cluster de computação usando as chaves gerenciadas pelo cliente. Você deve usar chaves gerenciadas pela Microsoft.

Aviso

Não exclua o grupo de recursos que contém a instância do Azure Cosmos DB ou qualquer um dos recursos criados automaticamente nesse grupo. Se você precisar excluir o grupo de recursos ou os serviços gerenciados pela Microsoft nele, deverá excluir o espaço de trabalho do Azure Machine Learning que o usa. Os recursos do grupo de recursos são excluídos quando você exclui o espaço de trabalho associado.

Armazenamento de metadados do espaço de trabalho

Quando você traz sua própria chave de criptografia, os metadados do serviço são armazenados em recursos dedicados em sua assinatura do Azure. A Microsoft cria um grupo de recursos separado na sua subscrição para este efeito: azureml-rg-workspacename_GUID. Somente a Microsoft pode modificar os recursos neste grupo de recursos gerenciados.

A Microsoft cria os seguintes recursos para armazenar metadados para o seu espaço de trabalho:

Service Utilização Dados de exemplo
BD do Cosmos para o Azure Armazena dados do histórico de trabalhos, metadados de computação e metadados de ativos. Os dados podem incluir nome do trabalho, status, número de sequência e status; calcular nome do cluster, número de núcleos e número de nós; nomes e tags de armazenamento de dados e descrições em ativos, como modelos; e nomes de rótulos de dados.
Azure AI Search Armazena índices que ajudam a consultar seu conteúdo de aprendizado de máquina. Esses índices são criados sobre os dados armazenados no Azure Cosmos DB.
Armazenamento do Azure Armazena metadados relacionados aos dados de pipeline do Azure Machine Learning. Os dados podem incluir nomes de pipeline de designer, layout de pipeline e propriedades de execução.

Da perspetiva do gerenciamento do ciclo de vida dos dados, os dados nos recursos anteriores são criados e excluídos à medida que você cria e exclui objetos correspondentes no Aprendizado de Máquina do Azure.

Seu espaço de trabalho do Azure Machine Learning lê e grava dados usando sua identidade gerenciada. Essa identidade recebe acesso aos recursos por meio de uma atribuição de função (controle de acesso baseado em função do Azure) nos recursos de dados. A chave de criptografia fornecida é usada para criptografar dados armazenados em recursos gerenciados pela Microsoft. Ele também é usado para criar índices para o Azure AI Search em tempo de execução.

Controles de rede adicionais são configurados quando você cria um ponto de extremidade de link privado em seu espaço de trabalho para permitir a conectividade de entrada. Essa configuração inclui a criação de uma conexão de ponto de extremidade de link privado com a instância do Azure Cosmos DB. O acesso à rede é restrito apenas a serviços confiáveis da Microsoft.

Chaves geridas pelo cliente

Quando você não usa uma chave gerenciada pelo cliente, a Microsoft cria e gerencia recursos em uma assinatura do Azure de propriedade da Microsoft e usa uma chave gerenciada pela Microsoft para criptografar os dados.

Quando você usa uma chave gerenciada pelo cliente, os recursos estão em sua assinatura do Azure e criptografados com sua chave. Embora estes recursos existam na sua subscrição, a Microsoft gere-os. São criados e configurados automaticamente quando cria a área de trabalho do Azure Machine Learning.

Esses recursos gerenciados pela Microsoft estão localizados em um novo grupo de recursos do Azure criado em sua assinatura. Este grupo de recursos é separado do grupo de recursos para o seu espaço de trabalho. Ele contém os recursos gerenciados pela Microsoft com os quais sua chave é usada. A fórmula para nomear o grupo de recursos é: <Azure Machine Learning workspace resource group name><GUID>.

Gorjeta

As Unidades de Solicitação para o Azure Cosmos DB são dimensionadas automaticamente conforme necessário.

Se o seu espaço de trabalho do Azure Machine Learning usar um ponto de extremidade privado, esse grupo de recursos também conterá uma rede virtual do Azure gerenciada pela Microsoft. Essa rede virtual ajuda a proteger a comunicação entre os serviços gerenciados e o espaço de trabalho. Você não pode fornecer sua própria rede virtual para uso com os recursos gerenciados pela Microsoft. Também não é possível modificar a rede virtual. Por exemplo, você não pode alterar o intervalo de endereços IP que ele usa.

Importante

Se a sua subscrição não tiver quota suficiente para estes serviços, ocorrerá uma falha.

Quando você usa uma chave gerenciada pelo cliente, os custos da sua assinatura são mais altos porque esses recursos estão na sua assinatura. Para estimar o custo, use a calculadora de preços do Azure.

Armazenamento de dados computacionais

O Azure Machine Learning usa recursos de computação para treinar e implantar modelos de aprendizado de máquina. A tabela a seguir descreve as opções de computação e como cada uma criptografa dados:

Computação Encriptação
Azure Container Instances Os dados são criptografados com uma chave gerenciada pela Microsoft ou uma chave gerenciada pelo cliente.
Para obter mais informações, consulte Criptografar dados de implantação.
Azure Kubernetes Service Os dados são criptografados com uma chave gerenciada pela Microsoft ou uma chave gerenciada pelo cliente.
Para obter mais informações, consulte Trazer suas próprias chaves com discos do Azure no Serviço Kubernetes do Azure.
Instância de computação do Azure Machine Learning O disco de trabalho local será criptografado se você habilitar o sinalizador para o hbi_workspace espaço de trabalho.
Cluster de computação do Azure Machine Learning O disco do SO é encriptado no Armazenamento do Azure com chaves geridas pela Microsoft. O disco temporário será criptografado se você habilitar o sinalizador para o hbi_workspace espaço de trabalho.
Computação Encriptação
Azure Kubernetes Service Os dados são criptografados com uma chave gerenciada pela Microsoft ou uma chave gerenciada pelo cliente.
Para obter mais informações, consulte Trazer suas próprias chaves com discos do Azure no Serviço Kubernetes do Azure.
Instância de computação do Azure Machine Learning O disco de trabalho local será criptografado se você habilitar o sinalizador para o hbi_workspace espaço de trabalho.
Cluster de computação do Azure Machine Learning O disco do SO é encriptado no Armazenamento do Azure com chaves geridas pela Microsoft. O disco temporário será criptografado se você habilitar o sinalizador para o hbi_workspace espaço de trabalho.

Cluster de cálculo

Os clusters de computação têm armazenamento em disco do SO local e podem montar dados de contas de armazenamento na sua subscrição durante um trabalho. Ao montar dados de sua própria conta de armazenamento em um trabalho, você pode habilitar chaves gerenciadas pelo cliente nessas contas de armazenamento para criptografia.

O disco do SO para cada nó de computação armazenado no Armazenamento do Azure é sempre encriptado com chaves geridas pela Microsoft nas contas de armazenamento do Azure Machine Learning e não com chaves geridas pelo cliente. Esse destino de computação é efêmero, portanto, os dados armazenados no disco do sistema operacional são excluídos depois que o cluster é reduzido. Os clusters normalmente diminuem quando nenhum trabalho é enfileirado, o dimensionamento automático está ativado e a contagem mínima de nós é definida como zero. A máquina virtual subjacente é desprovisionada e o disco do sistema operacional é excluído.

O Azure Disk Encryption não tem suporte para o disco do sistema operacional. Cada máquina virtual também tem um disco temporário local para operações do sistema operacional. Se desejar, você pode usar o disco para preparar dados de treinamento. Se você criar o espaço de trabalho com o parâmetro definido como TRUE, o hbi_workspace disco temporário será criptografado. Este ambiente é de curta duração (apenas durante o seu trabalho) e o suporte de encriptação está limitado apenas a chaves geridas pelo sistema.

Instância de computação

O disco do SO para uma instância de computação é encriptado com chaves geridas pela Microsoft nas contas de armazenamento do Azure Machine Learning. Se você criar o espaço de trabalho com o hbi_workspace parâmetro definido como TRUE, o disco temporário local na instância de computação será criptografado com chaves gerenciadas pela Microsoft. A criptografia de chave gerenciada pelo cliente não é suportada para SO e discos temporários.

hbi_workspace bandeira

Você pode definir o sinalizador hbi_workspace somente quando criar um espaço de trabalho. Não é possível alterá-lo para um espaço de trabalho existente.

Quando você define esse sinalizador como TRUE, ele pode aumentar a dificuldade de solucionar problemas porque menos dados de telemetria são enviados para a Microsoft. Há menos visibilidade sobre taxas de sucesso ou tipos de problemas. A Microsoft pode não ser capaz de reagir de forma tão proativa quando esse sinalizador é TRUE.

Para habilitar o hbi_workspace sinalizador ao criar um espaço de trabalho do Azure Machine Learning, siga as etapas em um dos seguintes artigos:

Próximos passos