Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
A deteção de Informações de Identificação Pessoal (PII) da Linguagem do Azure AI é uma funcionalidade oferecida pela Linguagem de IA do Azure. O serviço de deteção de PII é uma API baseada em nuvem que utiliza algoritmos de aprendizado de máquina e IA para ajudá-lo a desenvolver aplicativos inteligentes com compreensão avançada de linguagem natural. A deteção de PII da Linguagem de IA do Azure utiliza o Reconhecimento de Entidade Nomeada (NER) para identificar e eliminar informações confidenciais dos dados de entrada. O serviço classifica os dados pessoais sensíveis em categorias predefinidas. Essas categorias incluem números de telefone, endereços de e-mail e documentos de identificação. Essa classificação ajuda a detetar e eliminar essas informações de forma eficiente.
Sugestão
Experimente a deteção de PII no portal do Azure AI Foundry. Lá, você pode utilizar um recurso do Language Studio atualmente existente ou criar um novo recurso do Azure AI Foundry.
Novidades
A API de visualização de deteção de PII de texto e PII conversacional (versão 2024-11-15-preview
) agora suporta a opção de mascarar entidades confidenciais detetadas com um rótulo além de apenas caracteres de redação. Os clientes podem especificar se o conteúdo de dados pessoais, como nomes e números de telefone, ou seja, "John Doe received a call from 424-878-9192"
está mascarado com um caractere de redação, ou seja, "******** received a call from ************"
, ou mascarado com um rótulo de entidade, ou seja, "[PERSON_1] received a call from [PHONENUMBER_1]"
. Mais informações sobre como especificar o estilo da política de redação para suas saídas podem ser encontradas em nossos guias de instruções.
Os modelos de deteção de PII conversacional (versão 2024-11-01-preview
e GA
) são atualizados para fornecer qualidade e precisão de IA aprimoradas. O tipo de entidade identificador numérico agora também inclui a Carteira de Motorista e o Identificador de Beneficiário do Medicare.
A partir de junho de 2024, agora fornecemos suporte de disponibilidade geral para o serviço de PII conversacional (somente em inglês). Os clientes agora podem redigir transcrições, bate-papos e outros textos escritos num estilo de conversação (ou seja, texto com um
s, ah
s, múltiplos intervenientes e a escrita das palavras para maior clareza) com maior confiança na qualidade da IA, suporte ao Azure SLA
, suporte ao ambiente de produção e segurança de nível empresarial em mente.
Capacidades
Atualmente, o suporte a PII está disponível para os seguintes recursos:
- Deteção de PII de texto geral para processamento de informações confidenciais (PII) e informações de integridade (PHI) em texto não estruturado em várias categorias predefinidas.
- Deteção de PII de conversação, um modelo especializado projetado para lidar com transcrições de fala e o tom informal e conversacional encontrado em registos de reuniões e chamadas.
- Deteção de PII de documento nativo para processamento de arquivos de documentos estruturados.
O Azure AI Language é um serviço baseado na nuvem que aplica recursos de Processamento de Linguagem Natural (NLP) para detetar categorias de informações pessoais (PII) em dados baseados em texto. Esta documentação contém os seguintes tipos:
- Guias de início rápido são instruções iniciais para guiá-lo a fazer solicitações ao serviço.
- Os guias de instruções contêm instruções para usar o serviço de maneiras mais específicas ou personalizadas.
Fluxo de trabalho típico
Para usar esse recurso, envie dados para análise e manipule a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem personalização adicional ao modelo usado em seus dados.
Crie um recurso de Linguagem de IA do Azure, que concede acesso aos recursos oferecidos pela Linguagem de IA do Azure. Ele gera uma senha (chamada de chave) e uma URL de ponto de extremidade que você usa para autenticar solicitações de API.
Crie uma solicitação usando a API REST ou a biblioteca de cliente para C#, Java, JavaScript e Python. Você também pode enviar chamadas assíncronas com uma solicitação em lote para combinar solicitações de API para vários recursos em uma única chamada.
Envie o pedido contendo os seus dados de texto. A sua chave e o endpoint são usados para autenticação.
Transmita a resposta em fluxo ou armazene-a localmente.
Principais características das PII de texto
O Azure AI Language oferece reconhecimento de entidade nomeada para identificar e categorizar informações em seu texto. O recurso deteta categorias de PII, incluindo nomes, organizações, endereços, números de telefone, números ou códigos de contas financeiras e números de identificação do governo. Um subconjunto dessas PII são informações de saúde protegidas (PHI). Ao especificar domain=phi em sua solicitação, somente as entidades PHI são retornadas.
Introdução à deteção de PII
Para usar a deteção de PII, envie texto para análise e manipule a saída da API em seu aplicativo. A análise é realizada tal como está, sem personalização para o modelo usado nos seus dados. Há duas maneiras de usar a deteção de PII:
Opção de desenvolvimento | Descrição |
---|---|
Azure AI Foundry | O Azure AI Foundry é uma plataforma baseada na Web que lhe permite utilizar a deteção de informações de identificação pessoal com exemplos de texto com os seus próprios dados quando se inscreve. Para obter mais informações, consulte o site do Azure AI Foundry ou a documentação do Azure AI Foundry. |
API REST ou biblioteca de cliente (SDK do Azure) | Integre a deteção de PII em seus aplicativos usando a API REST ou a biblioteca de cliente disponível em vários idiomas. Para obter mais informações, consulte o Guia rápido de deteção de PII. |
Documentação de referência e exemplos de código
À medida que você usa esse recurso em seus aplicativos, consulte a seguinte documentação de referência e exemplos para o Azure AI Language:
Opção de desenvolvimento / linguagem | Documentação de referência | Exemplos |
---|---|---|
API REST | Documentação da API REST | |
C# | Documentação em C# | Exemplos de C# |
Java | Documentação Java | Amostras Java |
Javascript | Documentação do JavaScript | Exemplos de JavaScript |
Python | Documentação Python | Amostras de Python |
Requisitos de entrada e limites de serviço
- O Text PII analisa o texto. Para obter mais informações, consulte Limites de dados e serviços no guia de instruções.
- A PII trabalha com várias linguagens escritas. Para obter mais informações, consulte suporte linguístico. Pode especificar em que idiomas suportados o seu texto de partida está escrito. Se você não especificar um idioma, o padrão de extração será o inglês. A API pode retornar deslocamentos na resposta para suportar diferentes codificações multilíngues e de emojis.
Inteligência Artificial responsável
Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usam, as pessoas afetadas por ela e o ambiente de implantação. Leia a nota de transparência para PII para saber mais sobre o uso e a implantação responsáveis de IA em seus sistemas. Para obter mais informações, consulte os seguintes artigos:
- Nota de transparência para a linguagem de IA do Azure
- Integração e utilização responsável
- Dados, privacidade e segurança
Cenários de exemplo
- Aplicar rótulos de sensibilidade - Por exemplo, com base nos resultados do serviço de PII, um rótulo de sensibilidade pública pode ser aplicado a documentos em que nenhuma entidade de PII é detetada. Para documentos em que endereços e números de telefone dos EUA são reconhecidos, uma etiqueta confidencial pode ser aplicada. Uma etiqueta altamente confidencial pode ser usada para documentos em que os números de roteamento bancário são reconhecidos.
- Remover algumas categorias de informações pessoais de documentos que tiverem uma divulgação mais ampla - Por exemplo, se os registos de contacto dos clientes estiverem acessíveis aos representantes de apoio de linha da frente, a empresa pode remover as informações pessoais do cliente, exceto pelo nome, da versão do histórico do cliente para preservar a sua privacidade.
- Redigir informações pessoais para reduzir preconceitos inconscientes - Por exemplo, durante o processo de revisão de currículo de uma empresa, eles podem bloquear nome, endereço e número de telefone para ajudar a reduzir o gênero inconsciente ou outros preconceitos.
- Substitua informações pessoais em dados de origem para aprendizagem automática a fim de reduzir a discriminação – Por exemplo, se pretender remover nomes que possam revelar género ao treinar um modelo de aprendizagem automática, poderá usar o serviço para identificá-los e substituí-los por marcadores genéricos para o treino do modelo.
- Remova informações pessoais da transcrição do call center – Por exemplo, se você quiser remover nomes ou outros dados de PII que acontecem entre o agente e o cliente em um cenário de call center. Você pode usar o serviço para identificá-los e removê-los.
- Limpeza de dados para a ciência de dados - PII pode ser usada para preparar os dados para que cientistas e engenheiros de dados possam usar esses dados para treinar seus modelos de aprendizagem automática. Redigir os dados para garantir que os dados do cliente não sejam expostos.
Próximos passos
Há duas maneiras de começar a usar o recurso de vinculação de entidade:
- O Azure AI Foundry é uma plataforma baseada na Web que permite usar vários recursos do serviço de linguagem sem precisar escrever código.
- O artigo de início rápido para obter instruções sobre como realizar solicitações para o serviço usando a API REST e o SDK da biblioteca de cliente.