Comment détecter et masquer les informations d’identification personnelle (PII) dans les conversations

La fonctionnalité PII conversationnelle peut évaluer les conversations pour extraire des informations sensibles (PII) dans le contenu dans plusieurs catégories prédéfinies et les masquer. Cette API fonctionne sur le texte transcrit (référencé en tant que transcriptions) et les conversations. Pour les transcriptions, l’API permet également la réaction des segments audio, qui contient les informations de piI en fournissant les informations de minutage audio pour ces segments audio.

Déterminer le mode de traitement des données (facultatif)

Spécifier le modèle de détection des informations d’identification personnelle

Par défaut, cette fonctionnalité utilise le dernier modèle IA disponible sur votre saisie. Vous pouvez également configurer vos requêtes d’API pour utiliser une version de modèle spécifique.

Support multilingue

Actuellement, l’API PII conversationnelle en préversion prend uniquement en charge la langue anglaise.

Prise en charge de la région

Actuellement, l’API PII conversationnelle en préversion prend en charge toutes les régions Azure prises en charge par le service de langage.

Envoi de données

Remarque

Consultez l’article Language Studio pour plus d’informations sur la mise en forme du texte conversationnel à envoyer à l’aide de Language Studio.

Vous pouvez soumettre l’entrée à l’API en tant que liste d’éléments de conversation. L’analyse est effectuée à la réception de la demande. Étant donné que l’API est asynchrone, il peut y avoir un délai entre l’envoi d’une demande d’API et la réception des résultats. Pour connaître la taille et le nombre de requêtes que vous pouvez envoyer par minute et seconde, consultez les limites de données ci-dessous.

Lorsque vous utilisez la fonctionnalité asynchrone, les résultats de l’API sont disponibles pendant 24 heures à partir du moment où la demande a été ingérée, et sont indiqués dans la réponse. Après cette période, les résultats sont purgés et ne sont plus disponibles pour récupération.

Lorsque vous envoyez des données à des informations personnelles conversationnelles, vous pouvez envoyer une conversation (écrite ou parlée) par demande.

L’API tente de détecter les catégories d’entité définies pour une saisie de conversation donnée. Si vous voulez spécifier les entités qui seront détectées et retournées, utilisez le paramètre facultatif piiCategories avec les catégories d’entités appropriées.

Pour les transcriptions parlées, les entités détectées sont retournées sur la valeur de paramètre redactionSource fournie. Actuellement, les valeurs prises en charge pour redactionSource sont text, lexical, itn et maskedItn (qui mappe aux formats d’API REST de reconnaissance vocale display\displayText, lexical, itn et maskedItn respectivement). En outre, pour l’entrée de transcription parlée, cette API fournit également des informations de minutage audio pour permettre la réaction audio. Pour utiliser la fonctionnalité audioRedaction, utilisez l’indicateur facultatif includeAudioRedaction avec la valeur true. La réaction audio est effectuée en fonction du format d’entrée lexical.

Remarque

Les informations d’identification personnelle de conversation prennent désormais en charge une taille de document de 40 000 caractères.

Obtention des résultats sur les informations d’identification personnelle

Lorsque vous recevez des résultats de la détection des informations d’identification personnelle, vous pouvez diffuser les résultats dans une application ou enregistrer la sortie dans un fichier sur le système local. La réponse de l’API comprend les entités reconnues, y compris leurs catégories et sous-catégories, ainsi que les scores de confiance. La chaîne de texte avec les entités d’informations d’identification personnelle floutées est également retournée.

Exemples

  1. Accédez à la page de vue d’ensemble de votre ressource dans le portail Azure

  2. Dans le menu de gauche, sélectionnez Clés et point de terminaison. Vous aurez besoin de l’une des clés et du point de terminaison pour authentifier vos demandes d’API.

  3. Téléchargez et installez le package de bibliothèque de clients pour le langage de votre choix :

    Langage Version du package
    .NET 1.0.0
    Python 1.0.0
  4. Consultez la documentation de référence suivante pour plus d’informations sur le client et l’objet retourné :

Limites du service et des données

Pour connaître la taille et le nombre de demandes que vous pouvez envoyer par minute et seconde, consultez l’article Limites de service.