Partager via


Qu’est-ce que la détection d’informations personnelles du langage Azure ?

La détection d’informations d’identification personnelle (PII) dans les outils Foundry est une fonctionnalité proposée par Azure Language. Le service de détection des informations personnelles est une API basée sur le cloud qui utilise des algorithmes d’apprentissage automatique et d’IA pour vous aider à développer des applications intelligentes avec une compréhension avancée du langage naturel. La détection des informations personnelles d'Azure Language utilise la reconnaissance d’entités nommées (NER) pour identifier et masquer des informations sensibles à partir des données d’entrée. Le service classifie les données personnelles sensibles en catégories prédéfinies. Ces catégories incluent les numéros de téléphone, les adresses e-mail et les documents d’identification. Cette classification permet de détecter et d’éliminer efficacement ces informations.

Conseil

Essayez la détection des informations personnelles dans le portail Microsoft Foundry. Vous pouvez utiliser une ressource Language Studio existante ou créer une ressource Foundry.

Démonstration vidéo

Dans cette vidéo, nous présentons le service de détection des informations personnelles et vous montrons comment il détecte et réacte les données sensibles sur le texte, les documents et les transcriptions conversationnelles. Nous abordons les points suivants :

  • Comment essayer le service dans le terrain de jeu du portail Azure Foundry
  • Options de personnalisation clés pour les types d’entités, les styles de masquage et les exclusions
  • Pourquoi la protection des informations personnelles est importante et l’impact commercial des violations de données

Les sous-titres fermés sont disponibles pour cette vidéo.

Capacités

Actuellement, la prise en charge des informations personnelles est disponible pour les fonctionnalités suivantes :

Language est un service cloud qui applique des fonctionnalités de traitement en langage naturel (NLP) pour détecter les catégories d’informations personnelles (PII) dans les données textuelles. Cette documentation contient les types suivants :

  • Les Démarrages rapides sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
  • Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.

Flux de travail classique

Pour utiliser cette fonctionnalité, vous envoyez des données à des fins d’analyse et gérez la sortie de l’API dans votre application. L’analyse est effectuée telle quelle, sans personnalisation supplémentaire du modèle utilisé sur vos données.

  1. Créez une ressource Azure Language in Foundry Tools, qui vous permet d’accéder aux fonctionnalités offertes par language. Cela génère un mot de passe (appelé clé) et une URL de point de terminaison que vous utilisez pour authentifier les requêtes d’API.

  2. Créez une requête à l’aide de l’API REST ou de la bibliothèque de client pour C#, Java, JavaScript, et Python. Vous pouvez également envoyer des appels asynchrones avec une requête de lot afin de combiner des requêtes d’API pour plusieurs fonctionnalités en un seul appel.

  3. Envoyez la requête contenant vos données texte. Votre clé et votre point de terminaison sont utilisés pour l’authentification.

  4. Diffusez ou stockez la réponse localement.

Principales caractéristiques des informations personnelles identifiables textuelles

La langue offre une reconnaissance d’entité nommée pour identifier et classer les informations dans votre texte. La fonctionnalité détecte les catégories d’informations personnelles, notamment les noms, les organisations, les adresses, les numéros de téléphone, les numéros de compte financier ou les codes et les numéros d’identification du gouvernement. Un sous-ensemble de ces informations d’identification personnelle comprend des informations médicales protégées (PHI). En spécifiant domain=phi dans votre requête, seules les entités PHI sont retournées.

Prise en main de la détection des informations d’identification personnelle

Pour utiliser la détection des informations d’identification personnelle (PII), vous envoyez du texte à des fins d’analyse et gérez la sortie de l’API dans votre application. L’analyse est effectuée telle quelle, sans personnalisation du modèle utilisé sur vos données. Il existe deux façons d’utiliser la détection des informations d’identification personnelle (PII) :

Option de développement Descriptif
Portail Microsoft Foundry (nouveau) Foundry (nouveau) est une plateforme IA basée sur le cloud qui fournit un accès simplifié aux modèles, agents et outils Foundry via des projets Foundry.
Portail Foundry (classique) Foundry (classique) est une plateforme cloud qui prend en charge les projets hub et d’autres types de ressources. Lorsque vous vous inscrivez, vous pouvez utiliser vos propres données pour détecter les informations d’identification personnelle dans des exemples de texte.
API REST ou bibliothèque cliente (SDK Azure) Intégrez la détection des informations d’identification personnelle dans vos applications à l’aide de l’API REST ou de la bibliothèque de client disponible dans divers langages.

Documentation de référence et exemples de code

Lorsque vous utilisez cette fonctionnalité dans vos applications, consultez la documentation de référence et les exemples suivants pour azure Language in Foundry Tools :

Option de développement / langage Documentation de référence Exemples
API REST Documentation sur l’API REST
C# Documentation C# Exemples C#
Java Documentation Java Exemples Java
JavaScript Documentation JavaScript Exemples JavaScript
Python Documentation Python Exemples Python

Exigences d’entrée et limites du service

IA responsable

Un système d’IA englobe non seulement la technologie, mais aussi ses utilisateurs, les personnes concernées, et l’environnement de déploiement. Lisez la Note de transparence pour les informations d’identification personnelle pour en savoir plus sur l’utilisation et le déploiement de l’IA responsable dans vos systèmes. Pour plus d’informations, consultez les articles suivants :

Exemples de scénarios

  • Appliquer des étiquettes de confidentialité : par exemple, en fonction des résultats du service PII, une étiquette de confidentialité publique peut être appliquée aux documents où aucune entité PII n’est détectée. Pour les documents où les adresses et numéros de téléphone américains sont reconnus, une étiquette confidentielle peut être appliquée. Une étiquette hautement confidentielle peut être utilisée pour les documents où les numéros de routage bancaire sont reconnus.
  • Rédiger certaines catégories d’informations personnelles provenant de documents qui obtiennent une circulation plus large : par exemple, si les enregistrements de contact des clients sont accessibles au support de première ligne, l’entreprise peut masquer les informations personnelles du client en plus de son nom à partir de la version de l’historique des clients pour préserver la confidentialité du client.
  • Effacement des informations personnelles afin de réduire les préjugés inconscients - Par exemple, pendant le processus de révision de CV d’une entreprise, ils peuvent bloquer le nom, l’adresse et le numéro de téléphone pour aider à réduire les biais inconscients liés au genre ou autres préjugés.
  • Remplacer les informations personnelles dans les données sources pour le Machine Learning afin de réduire l’injustice : par exemple, si vous souhaitez supprimer des noms susceptibles de révéler le sexe lors de l’entraînement d’un modèle Machine Learning, vous pouvez utiliser le service pour les identifier, et les remplacer par des espaces réservés génériques pour l’entraînement du modèle.
  • Supprimer les informations personnelles de la transcription du centre d’appels : par exemple, si vous souhaitez supprimer des noms ou d’autres données PII qui se surviennent entre l’agent et le client dans un scénario de centre d’appels. Vous pouvez utiliser le service pour les identifier et les supprimer.
  • Nettoyage des données pour la science des données : les PII peuvent être utilisées pour rendre les données accessibles aux scientifiques et aux ingénieurs afin qu’ils puissent les utiliser pour entraîner leurs modèles Machine Learning. Masquage des données pour éviter que les données client soient exposées.

Étapes suivantes

Il existe deux façons de commencer à utiliser la fonctionnalité de liaison d’entités :

  • Foundry est une plateforme web qui vous permet d’utiliser plusieurs fonctionnalités de langage sans avoir à écrire de code.
  • L’article Démarrage rapide qui explique comment envoyer des requêtes au service avec l’API REST et le kit SDK de la bibliothèque de client.