Chaves gerenciadas pelo cliente para Azure Machine Learning

Azure Machine Learning é criado com base em vários serviços do Azure. Embora os dados armazenados sejam criptografados usando chaves de criptografia fornecidas pela Microsoft, você pode aprimorar a segurança fornecendo também suas chaves (gerenciadas pelo cliente). As chaves fornecidas por você são armazenadas no Azure Key Vault. Seus dados são armazenados em um conjunto de recursos adicionais que são gerenciados dentro da sua assinatura do Azure.

Além das chaves gerenciadas pelo cliente, o Azure Machine Learning fornece um sinalizador hbi_workspace. O sinalizador controla a quantidade de dados coletados pela Microsoft para fins de diagnóstico e habilita a criptografia adicional em ambientes gerenciados da Microsoft. Esse sinalizador também habilita os seguintes comportamentos:

  • Inicia a criptografia do disco de rascunho local no seu cluster de cálculo do Azure Machine Learning, contanto que você não tenha criado nenhum cluster anterior nessa assinatura. De outro modo, você precisará gerar um tíquete de suporte para habilitar a criptografia do disco de rascunho dos seus clusters de computação.
  • Limpa o disco de rascunho local entre os trabalhos.
  • Transmite com segurança as credenciais para sua conta de armazenamento, o registro de contêiner e a conta SSH (Secure Shell) da camada de execução para seus clusters de computação usando seu cofre de chaves.

O sinalizador hbi_workspace não afeta a criptografia em trânsito. Ele afeta apenas a criptografia em repouso.

Pré-requisitos

  • Uma assinatura do Azure.
  • Uma instância do Azure Key Vault. O cofre de chaves contém as chaves usadas para criptografar seus serviços.

O cofre de chaves precisa habilitar a exclusão temporária e a proteção contra limpeza. A identidade gerenciada para os serviços protegidos por uma chave gerenciada pelo cliente precisa ter as seguintes permissões no cofre de chaves:

  • Encapsular chave
  • Decodificar Chave
  • Obter

Por exemplo, a identidade gerenciada do Azure Cosmos DB precisaria ter essas permissões para o cofre de chaves.

Limitações

  • Após a criação do workspace, a chave de criptografia gerenciada pelo cliente para os recursos dos quais o workspace depende só pode ser trocada por outra chave no recurso original do Azure Key Vault.
  • Os dados criptografados são armazenados em recursos que estão em um grupo de recursos gerenciado pela Microsoft na sua assinatura. Você não pode criar esses recursos com antecedência nem transferir a propriedade deles para si. O ciclo de vida de dados é gerenciado de maneira indireta por meio das APIs do Azure ML, conforme você cria objetos no serviço do Azure Machine Learning.
  • Você não pode excluir recursos gerenciados pela Microsoft usados ​​para chaves gerenciadas pelo cliente sem também excluir o workspace.
  • Você não pode criptografar o disco do sistema operacional do cluster de computação usando suas chaves gerenciadas pelo cliente. Você precisa usar chaves gerenciadas pela Microsoft.

Aviso

Não exclua o grupo de recursos que contém essa instância do Azure Cosmos DB nem os recursos criados automaticamente nele. Se você precisar excluir o grupo de recursos ou os serviços gerenciados pela Microsoft que estão nele, exclua o workspace do Azure Machine Learning que os usa. Os recursos do grupo de recursos são excluídos quando o workspace associado é excluído.

Armazenamento de metadados do workspace

Ao trazer sua própria chave de criptografia, os metadados do serviço são armazenados em recursos dedicados na sua assinatura do Azure. A Microsoft cria um grupo de recursos separado na sua assinatura para essa finalidade: azureml-rg-workspacename_GUID. Somente a Microsoft pode modificar os recursos nesse grupo de recursos gerenciado.

A Microsoft cria os seguintes recursos para armazenar metadados para o seu workspace:

Serviço Uso Dados de exemplo
Azure Cosmos DB Armazena dados do histórico de trabalhos, metadados de computação e metadados de ativos. Os dados podem incluir o nome do trabalho, status, número de sequência e status; nome do cluster de cálculo, número de núcleos e número de nós; nomes e marcas do armazenamento de dados, descrições em ativos como modelos e nomes de rótulo de dados.
IA do Azure Search Armazena índices que ajudam a consultar o conteúdo de machine learning. Esses índices são criados com base nos dados armazenados no Azure Cosmos DB.
Armazenamento do Azure Armazena metadados relacionados aos dados de pipeline do Azure Machine Learning. Os dados podem incluir nomes de pipeline do designer, layout de pipeline e propriedades de execução.

Do ponto de vista do gerenciamento do ciclo de vida dos dados, os dados nos recursos acima são criados e excluídos conforme você cria e exclui os objetos correspondentes no Azure Machine Learning.

Seu workspace do Azure Machine Learning lê e grava dados usando a respectiva identidade gerenciada. Essa identidade tem acesso aos recursos por meio de uma atribuição de função (controle de acesso baseado em função do Azure) nos recursos de dados. A chave de criptografia que você fornece é usada para criptografar dados armazenados em recursos gerenciados pela Microsoft. Ela também é usada para criar índices para a Pesquisa de IA do Azure em runtime.

Mais controles de rede são configurados quando você cria um ponto de extremidade de link privado em seu workspace para permitir a conectividade de entrada. Essa configuração inclui a criação de uma conexão de ponto de extremidade de link privado com a instância do Azure Cosmos DB. O acesso à rede é restrito apenas a serviços confiáveis da Microsoft.

Chaves gerenciadas pelo cliente

Quando você não usa uma chave gerenciada pelo cliente, a Microsoft cria e gerencia esses recursos em uma assinatura do Azure de propriedade da Microsoft e usa uma chave gerenciada pela Microsoft para criptografar os dados.

Quando você usa uma chave gerenciada pelo cliente, esses recursos estão em sua assinatura do Azure e criptografados com sua chave. Embora esses recursos existam em sua assinatura, a Microsoft os gerencia. Eles são criados e configurados automaticamente quando você cria seu Azure Machine Learning workspace.

Esses recursos gerenciados pela Microsoft estão localizados em um novo grupo de recursos do Azure criado em sua assinatura. Esse grupo de recursos é separado do grupo de recursos para seu workspace. Ele contém os recursos gerenciados pela Microsoft com os quais sua chave é usada. A fórmula para nomear o grupo de recursos é: <Azure Machine Learning workspace resource group name><GUID>.

Dica

As Unidades de solicitação para o Azure Cosmos DB são dimensionadas automaticamente conforme necessário.

Se o workspace do Azure Machine Learning usar um ponto de extremidade privado, esse grupo de recursos também conterá uma Rede Virtual do Azure gerenciada pela Microsoft. Essa rede virtual ajuda a proteger as comunicações entre os serviços gerenciados e o workspace. Você não pode fornecer sua rede virtual para uso com os recursos gerenciados pela Microsoft. Você também não pode modificar a rede virtual. Por exemplo, você não pode alterar o intervalo de endereços IP que ela usa.

Importante

Se sua assinatura não tiver cota suficiente para esses serviços, ocorrerá uma falha.

Ao usar uma chave gerenciada pelo cliente, os custos da sua assinatura serão maiores porque esses recursos estão em sua assinatura. Use a Calculadora de Preços do Azure para estimar os custos.

Armazenamento de dados de computação

O Azure Machine Learning usa recursos de computação para treinar e implantar modelos de machine learning. A tabela a seguir descreve as opções de computação e como cada uma delas criptografa os dados:

Computação Criptografia
Instâncias de Contêiner do Azure Os dados são criptografados com uma chave gerenciada pela Microsoft ou por uma chave gerenciada pelo cliente.
Para obter mais informações, consulte Criptografe dados de implantação.
Serviço de Kubernetes do Azure Os dados são criptografados com uma chave gerenciada pela Microsoft ou por uma chave gerenciada pelo cliente.
Para obter mais informações, consulte Traga suas chaves com discos do Azure no Serviço de Kubernetes do Azure.
Instância de computação do Azure Machine Learning O disco de rascunho local será criptografado se você habilitar o sinalizador hbi_workspace para o workspace.
Cluster de computação do Azure Machine Learning Disco do sistema operacional é criptografado no Azure Armazenamento com chaves gerenciadas pela Microsoft. O disco temporário é criptografado se você habilitar o sinalizador hbi_workspace para o workspace.
Computação Criptografia
Serviço de Kubernetes do Azure Os dados são criptografados com uma chave gerenciada pela Microsoft ou por uma chave gerenciada pelo cliente.
Para obter mais informações, consulte Traga suas chaves com discos do Azure no Serviço de Kubernetes do Azure.
Instância de computação do Azure Machine Learning O disco de rascunho local será criptografado se você habilitar o sinalizador hbi_workspace para o workspace.
Cluster de computação do Azure Machine Learning Disco do sistema operacional é criptografado no Azure Armazenamento com chaves gerenciadas pela Microsoft. O disco temporário é criptografado se você habilitar o sinalizador hbi_workspace para o workspace.

Cluster de computação

Os clusters de cálculo têm armazenamento em disco local do sistema operacional e podem montar dados de contas de armazenamento na sua assinatura durante um trabalho. Ao montar dados a partir da sua conta de armazenamento em um trabalho, você pode habilitar chaves gerenciadas pelo cliente nessas contas de armazenamento para criptografia.

O disco do sistema operacional de cada nó de computação armazenado no Armazenamento do Microsoft Azure é sempre criptografado com chaves gerenciadas pela Microsoft em contas de armazenamento do Azure Machine Learning, e não com chaves gerenciadas pelo cliente. Esse destino de computação é temporário e, portanto, os dados armazenados no disco do sistema operacional são excluídos após o cluster ser reduzido verticalmente. Geralmente, os clusters são reduzidos verticalmente quando não há trabalhos na fila, o dimensionamento automático está ativado e o número mínimo de nós está definido como zero. A máquina virtual subjacente é desprovisionada e o disco do sistema operacional é excluído.

Não há suporte para o Azure Disk Encryption do disco do SO. Cada máquina virtual também tem um disco temporário local para operações do SO. Caso deseje, você pode usar o disco para preparar os dados de treinamento. Se você criar o workspace com o parâmetro hbi_workspace definido como TRUE, o disco temporário será criptografado. Esse ambiente tem uma curta duração (durante o trabalho), e o suporte da criptografia é limitado apenas a chaves gerenciadas pelo sistema.

Instância de computação

O disco do SO para uma instância de computação é criptografado com chaves gerenciadas pela Microsoft em contas de armazenamento do Azure Machine Learning. Se o workspace foi criado com o parâmetro hbi_workspace definido como TRUE, o disco temporário local na instância de computação é criptografado com chaves gerenciadas da Microsoft. Não há suporte para criptografia de chave gerenciada pelo cliente em discos temporários e de SO.

Sinalizador hbi_workspace

Você poderá definir o sinalizador hbi_workspace somente quando criar um workspace. Ele não pode ser alterado para um workspace existente.

Quando esse sinalizador é definido como TRUE, ele pode aumentar a dificuldade de solucionar problemas porque menos dados de telemetria são enviados à Microsoft. Há menos visibilidade sobre taxas de sucesso ou tipos de problema. A Microsoft pode não conseguir reagir de forma proativa quando esse sinalizador é TRUE.

Para habilitar o sinalizador hbi_workspace ao criar o workspace do Azure Machine Learning, siga as etapas em um dos seguintes artigos:

Próximas etapas