O que é a deteção de Informações de Identificação Pessoal (PII) na Linguagem de IA do Azure?

A deteção de PII é uma das funcionalidades oferecidas pela Azure AI Language, uma coleção de algoritmos de aprendizagem automática e IA na nuvem para desenvolver aplicações inteligentes que envolvem linguagem escrita. O recurso de deteção de PII pode identificar, categorizar e redigir informações confidenciais em texto não estruturado. Por exemplo: números de telefone, endereços de e-mail e formas de identificação. O método para utilizar PII em conversas é diferente de outros casos de uso, e os artigos para esse uso são separados.

  • Os guias de início rápido são instruções de introdução para guiá-lo ao fazer solicitações ao serviço.
  • Os guias de instruções contêm instruções para usar o serviço de maneiras mais específicas ou personalizadas.
  • Os artigos conceituais fornecem explicações detalhadas sobre a funcionalidade e os recursos do serviço.

A PII tem duas formas:

Fluxo de trabalho típico

Para usar esse recurso, envie dados para análise e manipule a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem personalização adicional ao modelo usado em seus dados.

  1. Crie um recurso de Linguagem de IA do Azure, que concede acesso aos recursos oferecidos pela Linguagem de IA do Azure. Ele gera uma senha (chamada de chave) e uma URL de ponto de extremidade que você usa para autenticar solicitações de API.

  2. Crie uma solicitação usando a API REST ou a biblioteca de cliente para C#, Java, JavaScript e Python. Você também pode enviar chamadas assíncronas com uma solicitação em lote para combinar solicitações de API para vários recursos em uma única chamada.

  3. Envie o pedido contendo os seus dados de texto. Sua chave e ponto de extremidade são usados para autenticação.

  4. Transmita a resposta em fluxo ou armazene-a localmente.

Suporte nativo a documentos

Um documento nativo refere-se ao formato de arquivo usado para criar o documento original, como o Microsoft Word (docx) ou um arquivo de documento portátil (pdf). O suporte nativo a documentos elimina a necessidade de pré-processamento de texto antes de usar os recursos da Linguagem de IA do Azure. Atualmente, o suporte nativo a documentos está disponível para o recurso PiiEntityRecognition.

Atualmente , a PII suporta os seguintes formatos de documentos nativos:

Tipo de ficheiro Extensão de nome de ficheiro Description
Texto .txt Um documento de texto não formatado.
Adobe PDF .pdf Um documento formatado em arquivo de documento portátil.
Microsoft Word .docx Um arquivo de documento do Microsoft Word.

Para obter mais informações, consulteUsar documentos nativos para processamento de idiomas

Introdução à deteção de PII

Para usar a deteção de PII, envie texto para análise e manipule a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem personalização para o modelo usado em seus dados. Há duas maneiras de usar a deteção de PII:

Opção de desenvolvimento Description
Estúdio de linguagem O Language Studio é uma plataforma baseada na Web que permite que você tente vincular entidades com exemplos de texto sem uma conta do Azure e seus próprios dados quando você se inscreve. Para obter mais informações, consulte o site do Language Studio ou o início rápido do language studio.
API REST ou biblioteca de cliente (SDK do Azure) Integre a deteção de PII em seus aplicativos usando a API REST ou a biblioteca de cliente disponível em vários idiomas. Para obter mais informações, consulte o Guia de início rápido de deteção de PII.

Documentação de referência e exemplos de código

À medida que você usa esse recurso em seus aplicativos, consulte a seguinte documentação de referência e exemplos para o Azure AI Language:

Opção de desenvolvimento / linguagem Documentação de referência Exemplos
API REST Documentação da API REST
C# Documentação em C# Exemplos de C#
Java Documentação Java Amostras Java
JavaScript Documentação do JavaScript Exemplos de JavaScript
Python Documentação Python Amostras de Python

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usam, as pessoas afetadas por ela e o ambiente de implantação. Leia a nota de transparência para PII para saber mais sobre o uso e a implantação responsáveis de IA em seus sistemas. Para obter mais informações, consulte os seguintes artigos que podem estar em inglês:

Cenários de exemplo

  • Aplicar rótulos de sensibilidade - Por exemplo, com base nos resultados do serviço de PII, um rótulo de sensibilidade pública pode ser aplicado a documentos em que nenhuma entidade de PII é detetada. Para documentos em que endereços e números de telefone dos EUA são reconhecidos, uma etiqueta confidencial pode ser aplicada. Uma etiqueta altamente confidencial pode ser usada para documentos em que os números de roteamento bancário são reconhecidos.
  • Redigir algumas categorias de informações pessoais de documentos que obtêm maior circulação - Por exemplo, se os registros de contato do cliente estiverem acessíveis aos representantes de suporte da linha de frente, a empresa pode redigir as informações pessoais do cliente além de seu nome da versão do histórico do cliente para preservar a privacidade do cliente.
  • Redigir informações pessoais para reduzir o preconceito inconsciente - Por exemplo, durante o processo de revisão de currículo de uma empresa, eles podem bloquear nome, endereço e número de telefone para ajudar a reduzir o gênero inconsciente ou outros preconceitos.
  • Substitua informações pessoais em dados de origem por aprendizado de máquina para reduzir injustiças – Por exemplo, se você quiser remover nomes que possam revelar gênero ao treinar um modelo de aprendizado de máquina, poderá usar o serviço para identificá-los e substituí-los por espaços reservados genéricos para treinamento de modelo.
  • Remova informações pessoais da transcrição do call center – Por exemplo, se você quiser remover nomes ou outros dados de PII que acontecem entre o agente e o cliente em um cenário de call center. Você pode usar o serviço para identificá-los e removê-los.
  • Limpeza de dados para ciência de dados - PII pode ser usada para preparar os dados para que cientistas e engenheiros de dados possam usar esses dados para treinar seus modelos de aprendizado de máquina. Redigir os dados para garantir que os dados do cliente não sejam expostos.

Próximos passos

Há duas maneiras de começar a usar o recurso de vinculação de entidade:

  • Language Studio, que é uma plataforma baseada na Web que permite que você experimente vários recursos do serviço de linguagem sem precisar escrever código.
  • O artigo de início rápido para obter instruções sobre como fazer solicitações ao serviço usando a API REST e o SDK da biblioteca de cliente.