Compartilhar via


O que é a detecção de PII do Azure Language?

Importante

A recurso de anonimização (substituição sintética) do recurso de detecção de Informações de Identificação Pessoal (PII) do Azure Language nas Foundry Tools está atualmente disponível em preview e é licenciada para você como parte da sua assinatura do Azure. Seu uso desse recurso está sujeito aos termos aplicáveis às visualizações , conforme descrito nos Termos de Uso Complementares para As Visualizações do Microsoft Azure e no Adendo de Proteção de Dados (DPA) de Produtos e Serviços da Microsoft.

A detecção de PII (Informações de Identificação Pessoal) do Azure Language in Foundry Tools é um recurso oferecido pelo Azure Language. O serviço de detecção de PII é uma API baseada em nuvem que utiliza o aprendizado de máquina e algoritmos de IA para ajudá-lo a desenvolver aplicativos inteligentes com compreensão avançada da linguagem natural. A detecção de PII da Linguagem do Azure usa o NER (Reconhecimento de Entidade Nomeada) para identificar e redigir informações confidenciais de dados de entrada. O serviço classifica dados pessoais confidenciais em categorias predefinidas. Essas categorias incluem números de telefone, endereços de email e documentos de identificação. Essa classificação ajuda a detectar e eliminar essas informações com eficiência.

Novidades

A versão 2025-11-15-preview apresenta os seguintes novos parâmetros de tarefa PII:

Capacidades

Atualmente, o suporte a PII está disponível para os seguintes recursos:

O Language é um serviço baseado em nuvem que aplica recursos de NLP (Processamento de Linguagem Natural) para detectar categorias de informações pessoais (PII) em dados baseados em texto. Esta documentação contém os seguintes tipos:

Fluxo de trabalho típico

Para usar esse recurso, você envia dados para análise e manipula a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem nenhuma personalização adicionada ao modelo usado nos seus dados.

  1. Crie um recurso de Azure Language no Foundry Tools, que concede acesso aos recursos oferecidos pelo Language. Gera uma senha (chamada "chave") e uma URL de ponto de extremidade que você usa para autenticar solicitações de API.

  2. Crie uma solicitação usando a API REST ou a biblioteca de cliente para C#, Java, JavaScript e Python. Você também pode enviar chamadas assíncronas com uma solicitação em lote para combinar solicitações de API para vários recursos em uma só chamada.

  3. Envie a solicitação que contém seus dados de texto. A chave e o ponto de extremidade são usados para autenticação.

  4. Transmita por streaming ou armazene a resposta localmente.

Principais recursos para PII de texto

A linguagem oferece o reconhecimento de entidade nomeada para identificar e categorizar informações em seu texto. O recurso detecta categorias de PII, incluindo nomes, organizações, endereços, números de telefone, números de conta financeira ou códigos e números de identificação do governo. Um subconjunto dessa PII é a informação de saúde protegida (PHI). Ao especificar domain=phi em sua solicitação, somente as entidades PHI são retornadas.

Introdução à detecção de PII

Para usar a detecção de PII, você envia um texto para análise e se encarrega do resultado da API no seu aplicativo. A análise é realizada no estado em que se encontra, sem nenhuma personalização para o modelo usado nos seus dados. Há duas maneiras de usar a detecção de PII:

Opção de desenvolvimento Descrição
Portal do Microsoft Foundry (novo) A Foundry (nova) é uma plataforma de IA baseada em nuvem que fornece acesso simplificado a modelos, agentes e ferramentas do Foundry por meio de projetos do Foundry.
Portal do Foundry (clássico) A Foundry (clássica) é uma plataforma baseada em nuvem que dá suporte a projetos baseados em hub e outros tipos de recursos. Ao se inscrever, você pode usar seus próprios dados para detectar informações de identificação pessoal em exemplos de texto.
API REST ou biblioteca de clientes (SDK do Azure) Integre a detecção de PII aos seus aplicativos usando a API REST, ou a biblioteca de clientes disponível em diversos idiomas.

Documentação de referência e exemplos de código

Ao usar esse recurso em seus aplicativos, consulte a seguinte documentação de referência e exemplos para o Azure Language in Foundry Tools:

Opção/idioma de desenvolvimento Documentação de referência Exemplos
API REST Documentação da API REST
C# Documentação do C# Exemplos de C#
Java Documentação do Java Exemplos de Java
JavaScript Documentação do JavaScript Exemplos de JavaScript
Python Documentação do Python Exemplos em Python

Requisitos de entrada e limites de serviço

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usam, que serão afetadas por ela e o ambiente em que foi implantada. Leia a nota de transparência sobre PII para saber mais sobre o uso responsável de IA e a implantação em seus sistemas. Para obter mais informações, confira os seguintes artigos:

Cenários de exemplo

  • Aplicar rótulos de confidencialidade – por exemplo, com base nos resultados do serviço PII, um rótulo de confidencialidade pública pode ser aplicado a documentos em que nenhuma entidade PII é detectada. Para documentos em que endereços e números de telefone dos EUA são reconhecidos, um rótulo confidencial pode ser aplicado. Um rótulo altamente confidencial pode ser usado para documentos em que os números de roteamento bancário são reconhecidos.
  • Rasurar algumas categorias de informações pessoais de documentos que obtêm circulação mais ampla — por exemplo, se os registros de contato do cliente estiverem acessíveis para representantes de atendimento da linha de frente, talvez a empresa queira rasurar da versão do histórico do cliente as informações pessoais, com exceção do nome, para preservar a privacidade do cliente.
  • Redigir informações pessoais para reduzir o viés inconsciente – por exemplo, durante o processo de revisão de currículos de uma empresa, elas podem bloquear nome, endereço e número de telefone para ajudar a reduzir o gênero inconsciente ou outros preconceitos.
  • Substitua informações pessoais nos dados de origem para aprendizado de máquina para reduzir a injustiça — por exemplo, se você quiser remover nomes que possam revelar gênero ao treinar um modelo de machine learning, você poderá usar o serviço para identificá-los e substituí-los por espaços reservados genéricos para treinamento de modelo.
  • Remover informações pessoais da transcrição do call center — por exemplo, se você quiser remover nomes ou outros dados PII que ocorrem entre o agente e o cliente em um cenário de call center. Você pode usar o serviço para identificá-los e removê-los.
  • Limpeza de dados para ciência de dados – o PII pode ser usado para preparar os dados para que cientistas de dados e engenheiros possam usar esses dados para treinar seus modelos de aprendizado de máquina. Redigir os dados para garantir que os dados do cliente não sejam expostos.

Próximas etapas

Há duas maneiras de começar a usar o recurso de vinculação de entidade:

  • A Foundry é uma plataforma baseada na Web que permite que você use vários recursos de linguagem sem a necessidade de escrever código.
  • O artigo de início rápido para obter instruções de como fazer solicitações para o serviço usando a API REST e o SDK da biblioteca de clientes.