Chaves gerenciadas pelo cliente para o Azure Machine Learning
O Azure Machine Learning baseia-se em vários serviços do Azure. Embora os dados armazenados sejam criptografados por meio de chaves de criptografia fornecidas pela Microsoft, você pode aumentar a segurança fornecendo também suas próprias chaves (gerenciadas pelo cliente). As chaves fornecidas são armazenadas no Cofre da Chave do Azure. Seus dados podem ser armazenados em um conjunto de outros recursos que você gerencia em sua assinatura do Azure ou (visualização) no lado do servidor em recursos gerenciados pela Microsoft.
Além das chaves gerenciadas pelo cliente (CMK), o Azure Machine Learning fornece um sinalizador de hbi_workspace. Habilitar esse sinalizador reduz a quantidade de dados que a Microsoft coleta para fins de diagnóstico e permite criptografia extra em ambientes gerenciados pela Microsoft. Esse sinalizador também permite os seguintes comportamentos:
- Começa a criptografar o disco de trabalho local em seu cluster de computação do Azure Machine Learning, se você não criou nenhum cluster anterior nessa assinatura. Caso contrário, você precisará gerar um tíquete de suporte para habilitar a criptografia do disco de trabalho para seus clusters de computação.
- Limpa o disco de trabalho local entre trabalhos.
- Transmite com segurança credenciais para sua conta de armazenamento, registro de contêiner e conta Secure Shell (SSH) da camada de execução para seus clusters de computação usando seu cofre de chaves.
O hbi_workspace
sinalizador não afeta a criptografia em trânsito. Afeta apenas a encriptação em repouso.
Pré-requisitos
- Uma subscrição do Azure.
- Uma instância do Azure Key Vault. O cofre de chaves contém as chaves para criptografar seus serviços.
O cofre de chaves deve habilitar a proteção contra exclusão suave e limpeza. A identidade gerenciada para os serviços que você ajuda a proteger usando uma chave gerenciada pelo cliente deve ter as seguintes permissões para o cofre de chaves:
- Moldar Chave
- Anular a Moldagem da Chave
- Obtenção
Por exemplo, a identidade gerenciada do Azure Cosmos DB precisaria ter essas permissões para o cofre de chaves.
Limitações
- Após a criação do espaço de trabalho, a chave de criptografia gerenciada pelo cliente para recursos dos quais o espaço de trabalho depende só pode ser atualizada para outra chave no recurso original do Cofre de Chaves do Azure.
- A menos que você esteja usando a visualização do lado do servidor, os dados criptografados são armazenados em recursos em um grupo de recursos gerenciado pela Microsoft em sua assinatura. Você não pode criar esses recursos antecipadamente ou transferir a propriedade deles para você. O ciclo de vida dos dados é gerenciado indiretamente por meio das APIs do Azure Machine Learning à medida que você cria objetos no serviço Azure Machine Learning.
- Não é possível excluir recursos gerenciados pela Microsoft que você usa para chaves gerenciadas pelo cliente sem excluir também seu espaço de trabalho.
- Não é possível criptografar o disco do sistema operacional do cluster de computação usando as chaves gerenciadas pelo cliente. Você deve usar chaves gerenciadas pela Microsoft.
Aviso
Não exclua o grupo de recursos que contém a instância do Azure Cosmos DB ou qualquer um dos recursos criados automaticamente nesse grupo. Se você precisar excluir o grupo de recursos ou os serviços gerenciados pela Microsoft nele, deverá excluir o espaço de trabalho do Azure Machine Learning que o usa. Os recursos do grupo de recursos são excluídos quando você exclui o espaço de trabalho associado.
Chaves geridas pelo cliente
Quando você não usa uma chave gerenciada pelo cliente, a Microsoft cria e gerencia recursos em uma assinatura do Azure de propriedade da Microsoft e usa uma chave gerenciada pela Microsoft para criptografar os dados.
Quando você usa uma chave gerenciada pelo cliente, os recursos estão em sua assinatura do Azure e criptografados com sua chave. Embora estes recursos existam na sua subscrição, a Microsoft gere-os. Esses recursos são criados e configurados automaticamente quando você cria seu espaço de trabalho do Azure Machine Learning.
Esses recursos gerenciados pela Microsoft estão localizados em um novo grupo de recursos do Azure criado em sua assinatura. Este grupo de recursos é separado do grupo de recursos para o seu espaço de trabalho. Ele contém os recursos gerenciados pela Microsoft com os quais sua chave é usada. A fórmula para nomear o grupo de recursos é: <Azure Machine Learning workspace resource group name><GUID>
.
Gorjeta
As Unidades de Solicitação para o Azure Cosmos DB são dimensionadas automaticamente conforme necessário.
Se o seu espaço de trabalho do Azure Machine Learning usar um ponto de extremidade privado, esse grupo de recursos também conterá uma rede virtual do Azure gerenciada pela Microsoft. Essa rede virtual ajuda a proteger a comunicação entre os serviços gerenciados e o espaço de trabalho. Você não pode fornecer sua própria rede virtual para uso com os recursos gerenciados pela Microsoft. Também não é possível modificar a rede virtual. Por exemplo, você não pode alterar o intervalo de endereços IP que ele usa.
Importante
Se a sua subscrição não tiver quota suficiente para estes serviços, ocorrerá uma falha.
Quando você usa uma chave gerenciada pelo cliente, os custos da sua assinatura são mais altos porque esses recursos estão na sua assinatura. Para estimar o custo, use a calculadora de preços do Azure.
Criptografia de dados em recursos de computação
O Azure Machine Learning usa recursos de computação para treinar e implantar modelos de aprendizado de máquina. A tabela a seguir descreve as opções de computação e como cada uma criptografa dados:
Computação | Encriptação |
---|---|
Azure Container Instances | Os dados são criptografados com uma chave gerenciada pela Microsoft ou uma chave gerenciada pelo cliente. Para obter mais informações, consulte Criptografar dados de implantação. |
Azure Kubernetes Service | Os dados são criptografados com uma chave gerenciada pela Microsoft ou uma chave gerenciada pelo cliente. Para obter mais informações, consulte Trazer suas próprias chaves com discos do Azure no Serviço Kubernetes do Azure. |
Instância de computação do Azure Machine Learning | O disco de trabalho local será criptografado se você habilitar o hbi_workspace sinalizador para o espaço de trabalho. |
Cluster de computação do Azure Machine Learning | O disco do SO é encriptado no Armazenamento do Azure com chaves geridas pela Microsoft. O disco temporário será criptografado se você habilitar o hbi_workspace sinalizador para o espaço de trabalho. |
Computação | Encriptação |
---|---|
Azure Kubernetes Service | Os dados são criptografados com uma chave gerenciada pela Microsoft ou uma chave gerenciada pelo cliente. Para obter mais informações, consulte Trazer suas próprias chaves com discos do Azure no Serviço Kubernetes do Azure. |
Instância de computação do Azure Machine Learning | O disco de trabalho local será criptografado se você habilitar o hbi_workspace sinalizador para o espaço de trabalho. |
Cluster de computação do Azure Machine Learning | O disco do SO é encriptado no Armazenamento do Azure com chaves geridas pela Microsoft. O disco temporário será criptografado se você habilitar o hbi_workspace sinalizador para o espaço de trabalho. |
Cluster de cálculo
Os clusters de computação têm armazenamento em disco do SO local e podem montar dados de contas de armazenamento na sua subscrição durante um trabalho. Ao montar dados de sua própria conta de armazenamento em um trabalho, você pode habilitar chaves gerenciadas pelo cliente nessas contas de armazenamento para criptografia.
O disco do SO para cada nó de computação é armazenado no Armazenamento do Azure e é sempre encriptado com chaves geridas pela Microsoft nas contas de armazenamento do Azure Machine Learning e não com chaves geridas pelo cliente. Esse destino de computação é efêmero, portanto, os dados armazenados no disco do sistema operacional são excluídos depois que o cluster é reduzido. Os clusters normalmente diminuem quando nenhum trabalho é enfileirado, o dimensionamento automático está ativado e a contagem mínima de nós é definida como zero. A máquina virtual subjacente é desprovisionada e o disco do sistema operacional é excluído.
O Azure Disk Encryption não tem suporte para o disco do sistema operacional. Cada máquina virtual também tem um disco temporário local para operações do sistema operacional. Se desejar, você pode usar o disco para preparar dados de treinamento. Se você criar o espaço de trabalho com o hbi_workspace
parâmetro definido como TRUE
, o disco temporário será criptografado. Este ambiente é de curta duração (apenas durante o seu trabalho) e o suporte de encriptação está limitado apenas a chaves geridas pelo sistema.
Instância de computação
O disco do SO para uma instância de computação é encriptado com chaves geridas pela Microsoft nas contas de armazenamento do Azure Machine Learning. Se você criar o espaço de trabalho com o hbi_workspace
parâmetro definido como TRUE
, o disco temporário local na instância de computação será criptografado com chaves gerenciadas pela Microsoft. A criptografia de chave gerenciada pelo cliente não é suportada para SO e discos temporários.
Armazenamento de metadados de espaço de trabalho criptografados
Quando você traz sua própria chave de criptografia, os metadados do serviço são armazenados em recursos dedicados em sua assinatura do Azure. A Microsoft cria um grupo de recursos separado na sua subscrição para este efeito: azureml-rg-workspacename_GUID. Somente a Microsoft pode modificar os recursos neste grupo de recursos gerenciados.
A Microsoft cria os seguintes recursos para armazenar metadados para o seu espaço de trabalho:
Serviço | Utilização | Dados de exemplo |
---|---|---|
Azure Cosmos DB | Armazena dados do histórico de trabalhos, metadados de computação e metadados de ativos. | Os dados podem incluir nome do trabalho, status, número de sequência e status; calcular nome do cluster, número de núcleos e número de nós; nomes e tags de armazenamento de dados e descrições em ativos, como modelos; e nomes de rótulos de dados. |
Pesquisa de IA do Azure | Armazena índices que ajudam a consultar seu conteúdo de aprendizado de máquina. | Esses índices são criados sobre os dados armazenados no Azure Cosmos DB. |
Armazenamento do Azure | Armazena metadados relacionados aos dados de pipeline do Azure Machine Learning. | Os dados podem incluir nomes de pipeline de designer, layout de pipeline e propriedades de execução. |
Da perspetiva do gerenciamento do ciclo de vida dos dados, os dados nos recursos anteriores são criados e excluídos à medida que você cria e exclui objetos correspondentes no Aprendizado de Máquina do Azure.
Seu espaço de trabalho do Azure Machine Learning lê e grava dados usando sua identidade gerenciada. Essa identidade recebe acesso aos recursos por meio de uma atribuição de função (controle de acesso baseado em função do Azure) nos recursos de dados. A chave de criptografia fornecida é usada para criptografar dados armazenados em recursos gerenciados pela Microsoft. No tempo de execução, a chave também é usada para criar índices para o Azure AI Search.
Controles de rede adicionais são configurados quando você cria um ponto de extremidade de link privado em seu espaço de trabalho para permitir a conectividade de entrada. Essa configuração inclui a criação de uma conexão de ponto de extremidade de link privado com a instância do Azure Cosmos DB. O acesso à rede é restrito apenas a serviços confiáveis da Microsoft.
(Pré-visualização) Criptografia de metadados do lado do serviço
Uma nova arquitetura para o espaço de trabalho de criptografia de chave gerenciado pelo cliente está disponível na visualização, reduzindo o custo em comparação com a arquitetura atual e reduzindo a probabilidade de conflitos de política do Azure. Neste novo modelo, os dados encriptados são armazenados no lado do serviço em recursos geridos pela Microsoft, em vez de na sua subscrição.
Os dados que anteriormente eram armazenados no Azure Cosmos DB em sua assinatura são armazenados em recursos gerenciados pela Microsoft multilocatários com criptografia no nível do documento usando sua chave de criptografia. Os índices de pesquisa que foram armazenados anteriormente no Azure AI Search em sua assinatura são armazenados em recursos gerenciados pela Microsoft que são provisionados dedicados para você por espaço de trabalho. O custo da instância de pesquisa de IA do Azure é cobrado no seu espaço de trabalho do Azure Machine Learning no Microsoft Cost Management.
Os metadados de pipelines que anteriormente eram armazenados em uma conta de armazenamento em um grupo de recursos gerenciados, agora são armazenados na conta de armazenamento em sua assinatura associada ao espaço de trabalho do Azure Machine Learning. Como esse recurso de Armazenamento do Azure é gerenciado separadamente em sua assinatura, você é responsável por definir as configurações de criptografia nele.
Para optar por essa visualização, defina o enableServiceSideCMKEncryption
em uma API REST ou em seu modelo Bicep ou Gerenciador de Recursos. Você também pode usar o portal do Azure. A disponibilidade da visualização varia de acordo com o tipo de espaço de trabalho:
Variante | Suportado |
---|---|
Predefinido | Sim |
Hub | Não |
Project | Não |
Nota
Durante essa visualização, não há suporte para recursos de rotação de chaves e rotulagem de dados. Atualmente, não há suporte para criptografia do lado do servidor em referência a um Cofre de Chaves do Azure para armazenar sua chave de criptografia que tenha o acesso à rede pública desabilitado.
Para obter um modelo que cria um espaço de trabalho com criptografia de metadados do lado do serviço, consulte https://github.com/azure/azure-quickstart-templates/tree/master/quickstarts/microsoft.machinelearningservices/machine-learning-workspace-cmk-service-side-encryption.
hbi_workspace bandeira
Você pode definir o sinalizador hbi_workspace
somente quando criar um espaço de trabalho. Não é possível alterá-lo para um espaço de trabalho existente.
Quando você define esse sinalizador como TRUE
, ele pode aumentar a dificuldade de solucionar problemas porque menos dados de telemetria são enviados para a Microsoft. Há menos visibilidade sobre taxas de sucesso ou tipos de problemas. A Microsoft pode não ser capaz de reagir de forma tão proativa quando esse sinalizador é TRUE
.
Para habilitar o hbi_workspace
sinalizador ao criar um espaço de trabalho do Azure Machine Learning, siga as etapas em um dos seguintes artigos:
- Criar e gerenciar um espaço de trabalho usando o portal do Azure ou o SDK do Python
- Criar e gerenciar um espaço de trabalho usando a CLI do Azure
- Criar um espaço de trabalho usando HashiCorp Terraform
- Criar um espaço de trabalho usando modelos do Azure Resource Manager