Teilen über


Was ist die Erkennung personenbezogener Informationen (Personally Identifiable Information, PII) in Azure KI Language?

Die Erkennung personenbezogener Informationen (Personally Identifiable Information, PII) von Azure AI ist ein Feature, das von Azure AI Language angeboten wird. Der PII-Erkennungsdienst ist eine cloudbasierte API, die maschinelles Lernen und KI-Algorithmen verwendet, um Ihnen bei der Entwicklung intelligenter Anwendungen mit erweitertem Verständnis der natürlichen Sprache zu helfen. Die Azure AI Language PII-Erkennung verwendet die automatische Erkennung benannter Entitäten (NER), um sensible Informationen aus Eingabedaten zu identifizieren und zu entfernen. Der Dienst klassifiziert vertrauliche personenbezogene Daten in vordefinierte Kategorien. Zu diesen Kategorien gehören Telefonnummern, E-Mail-Adressen und Identifikationsdokumente. Diese Klassifizierung hilft, solche Informationen effizient zu erkennen und zu beseitigen.

Neuerungen

Die API zur Vorschau der Erkennung von Text-PII und Unterhaltungs-PII (Version 2024-11-15-preview) unterstützt jetzt die Option, erkannte sensible Entitäten mit einer Beschriftung zu maskieren, die über reine Schwärzungszeichen hinausgeht. Kunden können angeben, ob personenbezogene Dateninhalte wie Namen und Telefonnummern, d. h., "John Doe received a call from 424-878-9192", mit einem Redaktionszeichen maskiert werden, d. h., "******** received a call from ************", oder mit einer Entitätsbezeichnung maskiert werden, d. h., "[PERSON_1] received a call from [PHONENUMBER_1]". Weitere Informationen dazu, wie Sie den Redaktionsrichtlinienstil für Ihre Ergebnisse festlegen, finden Sie in unseren Anleitungen.

Die konversationellen PII-Erkennungsmodelle (sowohl Version 2024-11-01-preview als auch Version GA) werden aktualisiert, um eine verbesserte Qualität der KI und Genauigkeit bereitzustellen. Der Entitätstyp „Numerische Kennung“ umfasst nun auch die Führerscheinnummer und die Medicare-Versichertennummer.

Ab Juni 2024 bieten wir allgemeine Verfügbarkeitsunterstützung für den Dienst Conversational PII (nur in englischer Sprache). Kunden können jetzt Transkripte, Chats und andere Texte, die im Konversationsstil geschrieben sind (d. h. Text mit um, ah, mehreren Sprechenden und dem Buchstabieren von Wörtern für mehr Klarheit), mit mehr Vertrauen in die KI-Qualität, Azure SLA-Unterstützung und Unterstützung der Produktionsumgebung sowie mit Blick auf die Sicherheit in Unternehmen maskieren.

Fähigkeiten

Derzeit steht die PII-Unterstützung für die folgenden Funktionen zur Verfügung:

Azure AI Language ist ein cloudbasierter Dienst, der NLP-Funktionen (Natural Language Processing) anwendet, um Kategorien von personenbezogenen Informationen (PII) in textbasierten Daten zu erkennen. Diese Dokumentation enthält die folgenden Typen:

  • Kurzanleitungen sind Anleitungen für die ersten Schritte, um Sie beim Erstellen von Anfragen an den Dienst zu unterstützen.
  • Schrittanleitungen enthalten Anweisungen zur spezifischeren oder individuelleren Verwendung des Diensts.

Typischer Workflow

Um dieses Feature zu verwenden, übermitteln Sie Daten zur Analyse und verarbeiten die API-Ausgabe in Ihrer Anwendung. Die Analyse wird ohne zusätzliche Anpassung des Modells durchgeführt, das für Ihre Daten verwendet wird.

  1. Erstellen Sie eine Azure KI Language-Ressource, die Ihnen den Zugriff auf die Features von Azure KI Language ermöglicht. Hierbei werden ein Kennwort (als „Schlüssel“ bezeichnet) und eine Endpunkt-URL generiert, die Sie zum Authentifizieren von API-Anforderungen verwenden können.

  2. Erstellen Sie eine Anforderung, indem Sie entweder die REST-API oder die Clientbibliothek für C#, Java, JavaScript oder Python verwenden. Sie können auch asynchrone Aufrufe per Batchanforderung senden, um API-Anforderungen für mehrere Features in einem gemeinsamen Aufruf zu kombinieren.

  3. Senden Sie die Anforderung, die Ihre Textdaten enthält. Ihr Schlüssel und Endpunkt werden für die Authentifizierung verwendet.

  4. Streamen oder speichern Sie die Antwort lokal.

Wichtige Features für Text-PII

Azure AI Language bietet eine benannte Entitätserkennung, um Informationen in Ihrem Text zu identifizieren und zu kategorisieren. Das Feature erkennt PII-Kategorien, einschließlich Namen, Organisationen, Adressen, Telefonnummern, Finanzkontonummern oder Codes sowie Staatliche Identifikationsnummern. Eine Teilmenge dieser personenbezogenen Informationen ist geschützte Gesundheitsinformationen (PHI). Durch Angeben von "domain=phi" in Ihrer Anforderung werden nur PHI-Entitäten zurückgegeben.

Erste Schritte bei der Erkennung personenbezogener Daten

Zur Verwendung der Erkennung personenbezogener Daten übermitteln Sie Text zur Analyse und verarbeiten die API-Ausgabe in Ihrer Anwendung. Die Analyse wird ohne Anpassung des Modells durchgeführt, das für Ihre Daten verwendet wird. Es gibt zwei Möglichkeiten, die Erkennung personenbezogener Informationen zu nutzen:

Entwicklungsoption Beschreibung
Azure KI Foundry Azure AI Foundry ist eine webbasierte Plattform, auf der Sie die Erkennung personenbezogener Informationen mit Textbeispielen mit Ihren eigenen Daten verwenden können, wenn Sie sich registrieren. Weitere Informationen finden Sie auf der Website von Azure AI Foundry oder in der Dokumentation von Azure AI Foundry.
REST-API oder Clientbibliothek (Azure SDK) Integrieren Sie die Erkennung personenbezogener Informationen mithilfe der REST-API oder der Clientbibliothek, die in zahlreichen Sprachen verfügbar ist, in Ihre Anwendungen. Weitere Informationen finden Sie im Schnellstart zur Erkennung personenbezogener Informationen.

Referenzdokumentation und Codebeispiele

Wenn Sie dieses Feature in Ihren Anwendungen verwenden, lesen Sie die folgende Referenzdokumentation und die Beispiele für Azure KI Language:

Entwicklungsoption/Sprache Referenzdokumentation Beispiele
REST-API REST-API-Dokumentation
C# C#-Dokumentation Beispiele für C#
Java Java-Dokumentation Java-Beispiele
JavaScript JavaScript-Dokumentation JavaScript samples (JavaScript-Beispiele)
Python Python-Dokumentation Python-Beispiele

Eingabeanforderungen und Dienstgrenzwerte

  • Text mit personenbezogenen Daten akzeptiert Text für die Analyse. Weitere Informationen finden Sie in der Schrittanleitung unter Daten- und Dienstgrenzwerte.
  • PII arbeitet mit verschiedenen schriftlichen Sprachen. Weitere Informationen finden Sie unter Sprachunterstützung. Sie können angeben, in welchen unterstützten Sprachen Der Quelltext geschrieben wird. Wenn Sie keine Sprache angeben, wird die Extraktion standardmäßig auf Englisch festgelegt. Die API gibt möglicherweise Offsets in der Antwort zurück, um verschiedene mehrsprachige und Emoji-Codierungen zu unterstützen.

Verantwortungsbewusste künstliche Intelligenz

Zu einem KI-System gehört nicht nur die Technologie, sondern auch die Personen, die es verwenden, die davon betroffenen Personen und die Bereitstellungsumgebung. Weitere Informationen zur verantwortungsbewussten Verwendung und Bereitstellung von KI in Ihren Systemen finden Sie unter dem Transparenzhinweis für personenbezogene Informationen. Weitere Informationen finden Sie in den folgenden Artikeln:

Beispielszenarien

  • Vertraulichkeitsbezeichnungen nutzen: Abhängig von den Ergebnissen des PII-Diensts kann beispielsweise die Vertraulichkeitsbezeichnung „öffentlich“ auf Dokumente angewendet werden, in denen keine PII-Entitäten erkannt werden. Für Dokumente, bei denen US-Adressen und Telefonnummern erkannt werden, kann z.B. die Bezeichnung „vertraulich“ verwendet werden. Die Bezeichnung „streng vertraulich“ kann für Dokumente verwendet werden, in denen Bankleitzahlen erkannt werden.
  • Persönliche Daten in Dokumenten maskieren, die eine größere Verbreitung finden: Wenn beispielsweise Kundenkontaktdaten für Mitarbeitende des Support in Service und Produktion zugänglich sind,kann das Unternehmen alle persönlichen Daten von Kunden außer des Namens aus der Version des Kundenverlaufs entfernen, um ihre Privatsphäre zu schützen.
  • Persönliche Informationen maskieren, um unbewusste Vorurteile zu vermeiden: Beispielsweise kann ein Unternehmen während der Überprüfung des Lebenslaufs Name, Adresse und Telefonnummer blockieren, um unbewusste geschlechtsspezifische oder andere Vorurteile zu vermeiden.
  • Ersetzen Sie personenbezogene Daten in Quelldaten für maschinelles Lernen, um Ungerechtigkeiten zu vermeiden – Wenn Sie beispielsweise Namen entfernen möchten, die beim Trainieren eines maschinellen Lernmodells das Geschlecht preisgeben könnten, können Sie den Dienst verwenden, um diese zu identifizieren und durch generische Platzhalter für das Modelltraining zu ersetzen.
  • Entfernen Sie persönliche Informationen aus der Callcenter-Transkription – Wenn Sie beispielsweise Namen oder andere PII-Daten entfernen möchten, die in einem Callcenter-Gespräch zwischen dem Agenten und dem Kunden ausgetauscht wurden. Sie könnten den Dienst verwenden, um diese zu identifizieren und zu entfernen.
  • Datenbereinigung für Datenforschung – Mithilfe von PII können Daten aufbereitet werden, sodass Datenwissenschaftler und Techniker damit das Training von Maschinen-Lernmodellen durchführen können. Daten verschleiern, damit Kundendaten nicht offengelegt werden.

Nächste Schritte

Es gibt zwei Möglichkeiten für die ersten Schritte zur Verwendung des Features für die Entitätsverknüpfung:

  • Azure AI Foundry ist eine webbasierte Plattform, auf der Sie mehrere Sprachdienstfeatures verwenden können, ohne Code schreiben zu müssen.
  • Im Schnellstartartikel finden Sie eine Anleitung zum Senden von Anfragen an den Dienst mithilfe der REST-API und des Clientbibliothek-SDK.