Compartir a través de


¿Qué es la detección de información de identificación personal (PII) de Azure AI Language?

La detección de información de identificación personal (PII) de Azure AI Language es una característica que ofrece Azure AI Language. El servicio de detección de PII es una API basada en la nube que utiliza algoritmos de aprendizaje automático e inteligencia artificial para ayudarle a desarrollar aplicaciones inteligentes con conocimientos avanzados del lenguaje natural. La detección de PII de Azure AI Language usa el reconocimiento de entidades nombradas (NER) para identificar y ocultar información confidencial de los datos de entrada. El servicio clasifica los datos personales confidenciales en categorías predefinidas. Estas categorías incluyen números de teléfono, direcciones de correo electrónico y documentos de identificación. Esta clasificación ayuda a detectar y eliminar dicha información de forma eficaz.

Novedades

La API de detección de PII de texto y PII conversacional (versión 2024-11-15-preview) ahora admite la opción de enmascarar las entidades confidenciales detectadas con una etiqueta, en lugar de simplemente utilizar caracteres de redacción. Los clientes pueden especificar si el contenido de datos personales, como nombres y números de teléfono, es decir, "John Doe received a call from 424-878-9192", se enmascaran con un carácter de reacción, es decir, "******** received a call from ************", o enmascarados con una etiqueta de entidad, es decir, "[PERSON_1] received a call from [PHONENUMBER_1]". Puede encontrar más información sobre cómo especificar el estilo de política de redacción para los resultados en nuestras guías paso a paso.

Los modelos de detección de PII conversacionales (tanto la versión 2024-11-01-preview como GA) se actualizan para proporcionar una mayor calidad y precisión de la inteligencia artificial. El tipo de entidad de identificador numérico ahora también incluye la licencia de conducir y el Identificador beneficiario de Medicare.

A partir de junio de 2024, ofrecemos soporte de disponibilidad general para el servicio de información personal identificable de conversación (solo en inglés). Los clientes ahora pueden censurar transcripciones, chats y otro texto escrito en un estilo conversacional (es decir, texto con ums, ahs, varios hablantes y la ortografía de palabras para mayor claridad) con una mejor confianza en la calidad de la inteligencia artificial, el soporte técnico de Azure SLA y el entorno de producción, y la seguridad de nivel empresarial en mente.

Capacidades

Actualmente, la compatibilidad con PII está disponible para las siguientes funcionalidades:

Azure AI Language es un servicio basado en la nube que aplica características de procesamiento de lenguaje natural (NLP) para detectar categorías de información personal (PII) en datos basados en texto. Esta documentación contiene los siguientes tipos:

  • Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
  • Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

Flujo de trabajo típico

Para usar esta característica, envíe datos para su análisis y controle la salida de la API en la aplicación. El análisis se realiza tal cual, sin ninguna personalización agregada al modelo usado en los datos.

  1. Cree un recurso de Lenguaje de Azure AI que le conceda acceso a las características que ofrece Lenguaje de Azure AI. Genera una contraseña (denominada clave) y una dirección URL de punto de conexión que se usa para autenticar las solicitudes de API.

  2. Utilice la API REST o la biblioteca cliente para C#, Java, JavaScript y Python para crear una solicitud. También puede enviar llamadas asincrónicas con una solicitud por lotes para combinar las solicitudes de API de varias características en una sola llamada.

  3. Envíe la solicitud que contiene los datos de texto. La clave y el punto de conexión se usan para la autenticación.

  4. Transmita la respuesta en secuencias o almacénela localmente.

Características clave de DCP de texto

Azure AI Language ofrece reconocimiento de entidades con nombre para identificar y clasificar información dentro del texto. La característica detecta categorías de PII, incluidos nombres, organizaciones, direcciones, números de teléfono, números de cuenta financiera o códigos, y números de identificación gubernamentales. Un subconjunto de esta PII es información de salud protegida (PHI). Al especificar domain=phi en la solicitud, solo se devuelven las entidades PHI.

Introducción a la detección de PII

Para usar la detección de información de identificación personal (PII), debe enviar texto para su análisis y controlar la salida de la API en la aplicación. El análisis se realiza tal cual, sin personalización adicional al modelo usado en los datos. Hay dos maneras de usar la detección de PII:

Opción de desarrollo Descripción
Azure AI Foundry Azure AI Foundry es una plataforma basada en web que le permite usar la detección de información personal identificable utilizando ejemplos de texto y sus propios datos cuando se registra. Para más información, consulte el sitio web de Fundición de IA de Azure o la documentación de Fundición de IA de Azure.
API REST o biblioteca cliente (SDK de Azure) Integre la detección de PII en las aplicaciones mediante la API REST o la biblioteca cliente disponible en una variedad de lenguajes. Para más información, consulte la guía de inicio rápido de detección de PII.

Documentación de referencia y ejemplos de código

Al usar esta característica en las aplicaciones, consulte la siguiente documentación de referencia y ejemplos de Lenguaje de Azure AI:

Opción de desarrollo / idioma Documentación de referencia Ejemplos
API DE REST Documentación de la API REST
C# Documentación de C# Ejemplos de C#
Java Documentación de Java Ejemplos de Java
JavaScript Documentación de JavaScript Ejemplos de JavaScript
Pitón Documentación de Python Ejemplos de Python

Requisitos de entrada y límites de servicio

Inteligencia artificial responsable

Los sistemas de inteligencia artificial no solo incluyen la tecnología, sino también las personas que la usan, las que se ven afectadas por ella y el entorno en el que se implementan. Lea la nota de transparencia para DCP para obtener información sobre el uso responsable de la inteligencia artificial y la implementación en los sistemas. Para más información, consulte los siguientes artículos.

Escenarios de ejemplo

  • Aplicar etiquetas de confidencialidad: por ejemplo, en función de los resultados del servicio de detección de DCP, se puede aplicar una etiqueta de confidencialidad pública a los documentos en los que no se detecta ninguna entidad de DCP. En el caso de los documentos en los que se reconocen las direcciones y los números de teléfono de Estados Unidos, se podría aplicar una etiqueta de confidencialidad. Se pude usar una etiqueta de alta confidencialidad para los documentos en los que se reconocen números de ruta bancarios.
  • Censurar algunas categorías de información personal de los documentos con una circulación más amplia: por ejemplo, si los registros de contacto del cliente son accesibles para los representantes de soporte de primera línea, la empresa puede censurar la información personal del cliente además de su nombre en la versión del historial de clientes para preservar la privacidad del cliente.
  • Redacte información personal con el fin de reducir el sesgo inconsciente, por ejemplo, durante el proceso de revisión de currículum de una empresa, pueden bloquear el nombre, la dirección y el número de teléfono para ayudar a reducir el sesgo de género inconsciente u otros sesgos.
  • Reemplazar la información personal en los datos de origen para que el aprendizaje automático reduzca la inequidad: por ejemplo, si desea quitar nombres que podrían revelar el sexo al entrenar un modelo de aprendizaje automático, puede usar el servicio para identificarlos y reemplazarlos por marcadores de posición genéricos para el entrenamiento del modelo.
  • Quitar información personal de las transcripciones del centro de llamadas: por ejemplo, si desea quitar nombres u otra información de identificación personal que se produce entre el agente y el cliente en un escenario de centro de llamadas. Puede usar el servicio para identificarlos y quitarlos.
  • Limpieza de datos para la ciencia de datos: La información personal identificable (PII) se puede utilizar para preparar los datos, de modo que ingenieros y científicos de datos puedan emplearlos en el entrenamiento de modelos de aprendizaje automático. Redactar los datos para garantizar que los del cliente no resulten expuestos.

Pasos siguientes

Hay dos maneras de empezar a usar la característica de vinculación de entidades:

  • Fundición de IA de Azure es una plataforma basada en la Web que le permite utilizar varias características del servicio de Lenguaje sin necesidad de escribir código.
  • El artículo de inicio rápido para obtener instrucciones sobre cómo realizar solicitudes al servicio mediante la API de REST y el SDK de la biblioteca cliente.