Ler em inglês

Partilhar via


Deteção e mascaramento de PII

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Sugestão

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Este artigo descreve um modelo de solução que você pode usar para detetar e mascarar dados PII em seu fluxo de dados com os serviços de IA do Azure.

Sobre este modelo de solução

Este modelo recupera um conjunto de dados da origem do Azure Data Lake Storage Gen2. Em seguida, um corpo de solicitação é criado com uma coluna derivada e uma transformação de chamada externa chama os serviços de IA do Azure e mascara PII antes de carregar para o coletor de destino.

O modelo contém uma atividade:

  • Fluxo de dados para detetar e mascarar dados PII

Este modelo define 3 parâmetros:

  • sourceFileSystem é o caminho da pasta onde os arquivos são lidos do armazenamento de origem. Você precisa substituir o valor padrão pelo seu próprio caminho de pasta.
  • sourceFilePath é o caminho da subpasta onde os arquivos são lidos do armazenamento de origem. Você precisa substituir o valor padrão pelo seu próprio caminho de subpasta.
  • sourceFileName é o nome do arquivo que você gostaria de transformar. Você precisa substituir o valor padrão pelo seu próprio nome de arquivo.

Pré-requisitos

  • URL e chave do ponto de extremidade do recurso dos serviços de IA do Azure (crie um novo recurso aqui)

Como usar este modelo de solução

  1. Vá para deteção e mascaramento de PII de modelo rolando pela galeria de modelos ou filtrando o modelo.

    Captura de tela da galeria de modelos com o modelo de deteção de PII selecionado.

  2. Use a lista suspensa para criar uma Nova conexão com seu armazenamento de armazenamento de origem ou escolha uma conexão existente. O armazenamento de armazenamento de origem é de onde você deseja ler os arquivos.

    Captura de ecrã da página de configuração do modelo onde pode criar uma nova ligação ou selecionar uma ligação existente à origem a partir de um menu pendente.

    Clicar em Novo exigirá que você crie uma nova conexão de serviço vinculado.

    Captura de tela da página de configuração do modelo com um submenu aberto para criar uma nova conexão de serviço vinculado a uma fonte de dados.

  3. Use a lista suspensa para criar uma Nova conexão com seu recurso de serviços de IA do Azure ou escolha uma conexão existente. Você precisará de uma URL de ponto de extremidade e uma chave de recurso para criar essa conexão.

    Captura de ecrã da página de configuração do modelo para criar uma nova ligação ou selecionar uma ligação existente aos serviços de IA do Azure a partir de um menu pendente.

    Clicar em Novo exigirá que você crie uma nova conexão de serviço vinculado. Certifique-se de inserir a URL do ponto de extremidade do recurso e a chave do recurso sob o cabeçalho de autenticação Ocp-Apim-Subscription-Key.

    Captura de ecrã da página de configuração do modelo com um submenu aberto para criar uma nova ligação de serviço ligado aos serviços de IA do Azure.

  4. Selecione Usar este modelo para criar o pipeline.

    Captura de tela do botão no canto inferior esquerdo para concluir a criação do pipeline.

  5. Você deve ver o seguinte pipeline:

    Captura de tela do modo de exibição de pipeline com uma atividade de fluxo de dados.

  6. Clicar na atividade de fluxo de dados mostrará o seguinte fluxo de dados:

    Captura de tela da exibição de fluxo de dados com uma fonte que leva a três transformações e, em seguida, a um coletor.

  7. Ative a depuração do fluxo de dados.

    Captura de tela do botão de depuração de fluxo de dados encontrado no banner superior da tela.

  8. Atualize os parâmetros nas configurações de depuração e salve.

    Captura de tela do botão Configurações de depuração no banner superior da tela à direita do botão de depuração.

    Captura de tela de onde atualizar parâmetros em Configurações de depuração em um painel no lado direito da tela.

  9. Visualize os resultados na Visualização de dados.

    Captura de ecrã da pré-visualização de dados de fluxo de dados na parte inferior do ecrã.

  10. Quando os resultados da visualização de dados estiverem conforme o esperado, atualize os Parâmetros.

    Captura de tela dos parâmetros de fluxo de dados na parte inferior da tela em Parâmetros.

  11. Retorne ao pipeline e selecione Depurar. Analise os resultados e publique.

    Captura de tela dos resultados que retornam depois que o pipeline é acionado.