Compartir vía


Procedimiento para detectar y censurar información de identificación personal (DCP) en conversaciones

La característica DCP conversacional puede evaluar las conversaciones para extraer información confidencial (DCP) en el contenido en varias categorías predefinidas y censurarlas. Esta API funciona tanto en texto transcrito (al que se hace referencia como transcripciones) como en chats. En el caso de las transcripciones, la API también habilita la redacción de los segmentos de audio, que contiene la información de DCP al proporcionar la información de tiempo de audio para esos segmentos de audio.

Determinación de cómo procesar los datos (opcional)

Especificación del modelo de detección de DCP

De manera predeterminada, esta característica usará el modelo de IA disponible más reciente en la entrada. También puede configurar las solicitudes de API para usar una versión del modelo específica.

Compatibilidad con idiomas

Para más información, consulte la página Compatibilidad con idiomas PII. Actualmente, el modelo de disponibilidad general de PII conversacional solo admite el idioma inglés. El modelo de versión preliminar y la API admiten los mismos idiomas de lista que los demás servicios de lenguaje.

Regiones admitidas

Actualmente, la API de PII conversacional admite todas las regiones de Azure compatibles con el servicio de lenguaje.

Envío de datos

Nota

Consulte el artículo sobre Language Studio si desea información sobre cómo dar formato al texto conversacional para enviarlo mediante Language Studio.

Puede enviar la entrada a la API como lista de elementos de conversación. El análisis se realiza tras la recepción de la solicitud. Dado que la API es asincrónica, puede haber un retraso entre el envío de una solicitud de API y la recepción de los resultados. Para obtener información sobre el tamaño y el número de solicitudes que puede enviar por minuto y segundo, consulte los límites de datos a continuación.

Cuando se usa esta característica asincrónica, los resultados de la API están disponibles durante 24 horas desde el momento en que se ingiere la solicitud y se indican en la respuesta. Después de este período de tiempo, los resultados se purgan y ya no están disponibles para la recuperación.

Al enviar datos a una DCP conversacional, puede enviar una conversación (chat o hablada) por solicitud.

La API intentará detectar las categorías de entidad definidas para una entrada de conversación determinada. Si desea especificar qué entidades se detectarán y devolverán, use el parámetro opcional piiCategories con las categorías de entidad adecuadas.

En el caso de las transcripciones habladas, las entidades detectadas se devolverán en el valor del parámetro redactionSource proporcionado. Actualmente, los valores admitidos para redactionSource son text, lexical, itn y maskedItn (que se corresponden con el formato display\displayText, lexical, itn y maskedItn de la API de REST de Conversión de voz en texto, respectivamente). Además, para la entrada de transcripción hablada, esta API también proporcionará información de control de tiempo de audio para facilitar la redacción de audio. Para usar la característica audioRedaction, use la marca opcional includeAudioRedaction con el valor true. La redacción de audio se realiza en función del formato de entrada léxico.

Nota

La PII de conversación ahora admite 40 000 caracteres como tamaño de documento.

Obtención de resultados de DCP

Cuando obtiene los resultados de la detección de DCP, puede transmitirlos a una aplicación, o bien guardar la salida en un archivo en el sistema local. La respuesta de la API contendrá entidades reconocidas, incluidas sus categorías y subcategorías, y las puntuaciones de confianza. También se devolverá la cadena de texto con las entidades de DCP censuradas.

Ejemplos

  1. Vaya a la página de información general del recurso en Azure Portal.

  2. En el menú de la izquierda, seleccione Claves y punto de conexión. Necesitará una de las claves y el punto de conexión para autenticar las solicitudes de API.

  3. Descargue e instale el paquete de la biblioteca cliente para el idioma que prefiera:

    Lenguaje Versión del paquete
    .NET 1.0.0
    Python 1.0.0
  4. Consulte la siguiente documentación de referencia para obtener más información sobre el cliente y el objeto devuelto:

Límites de servicio y datos

Para obtener información sobre el tamaño y el número de solicitudes que puede enviar por minuto y segundo, consulte el artículo sobre límites del servicio.