Teilen über


Schnellstart: Erkennen von personenbezogenen Informationen (PII)

Hinweis

In dieser Schnellstartanleitung wird nur die Erkennung personenbezogener Informationen in Dokumenten behandelt. Weitere Informationen zum Erkennen von personenbezogenen Informationen in Unterhaltungen finden Sie unter Erkennen und Bearbeiten personenbezogener Informationen (Personally Identifying Information, PII) in Unterhaltungen.

Referenzdokumentation | Weitere Beispiele | Paket (NuGet) | Quellcode der Bibliothek

Verwenden Sie diese Schnellstartanleitung, um eine Anwendung zur Erkennung personenbezogener Informationen (Personally Identifiable Information, PII) mit der Clientbibliothek für .NET zu erstellen. Im folgenden Beispiel erstellen Sie eine C#-Anwendung, die erkannte vertrauliche Informationen im Text identifizieren kann.

Tipp

Sie können Language Studio verwenden, um die PII-Erkennung in Dokumenten zu testen, ohne programmieren zu müssen.

Voraussetzungen

Einrichten

Erstellen einer Azure-Ressource

Um das nachstehende Codebeispiel zu verwenden, müssen Sie eine Azure-Ressource bereitstellen. Diese Ressource enthält einen Schlüssel und Endpunkt, mit dem Sie die API-Aufrufe authentifizieren, die Sie an den Sprachdienst senden.

  1. Verwenden Sie den folgenden Link, um über das Azure-Portal eine Sprachressource zu erstellen. Sie müssen sich mit Ihrem Azure-Abonnement anmelden.

  2. Wählen Sie auf dem angezeigten Bildschirm Zusätzliche Funktionen auswählen die Option Fahren Sie fort mit dem Erstellen Ihrer Ressource aus.

    Screenshot: Optionen für zusätzliche Funktionen im Azure-Portal

  3. Geben Sie auf dem Bildschirm Sprache erstellen die folgenden Informationen an:

    Detail Beschreibung
    Subscription Das Abonnementkonto, mit dem Ihre Ressource verknüpft wird. Wählen Sie im Dropdownmenü Ihr Azure-Abonnement aus.
    Ressourcengruppe Eine Ressourcengruppe ist ein Container, der die von Ihnen erstellten Ressourcen speichert. Wählen Sie Neu erstellen aus, um eine neue Ressourcengruppe zu erstellen.
    Region Der Standort Ihrer Sprachressource Verschiedene Regionen können je nach physischem Standort Wartezeiten verursachen, haben aber keinen Einfluss auf die Laufzeitverfügbarkeit Ihrer Ressource. Wählen Sie für diesen Schnellstart entweder eine verfügbare Region in Ihrer Nähe oder USA, Osten aus.
    Name Der Name für Ihre Sprachressource. Dieser Name wird auch zum Erstellen einer Endpunkt-URL verwendet, die Ihre Anwendungen zum Senden von API-Anforderungen verwenden.
    Tarif Der Tarif für Ihre Sprachressource Sie können den Tarif Free F0 verwenden, um den Dienst zu testen, und später für die Produktion auf einen kostenpflichtigen Tarif upgraden.

    Screenshot: Details zur Ressourcenerstellung im Azure-Portal

  4. Vergewissern Sie sich, dass das Kontrollkästchen Hinweis zu verantwortungsvoller KI aktiviert ist.

  5. Wählen Sie am unteren Rand der Seite die Option Bewerten + erstellen aus.

  6. Stellen Sie auf dem angezeigten Bildschirm sicher, dass die Überprüfung erfolgreich war und dass Sie Ihre Informationen ordnungsgemäß eingegeben haben. Klicken Sie anschließend auf Erstellen.

Abrufen Ihres Schlüssels und Endpunkts

Als Nächstes benötigen Sie den Schlüssel und Endpunkt der Ressource, um Ihre Anwendung mit der API zu verbinden. Der Schlüssel und der Endpunkt werden später in der Schnellstartanleitung in den Code eingefügt.

  1. Klicken Sie nach erfolgreicher Bereitstellung der Sprachressource unter Nächste Schritte auf die Schaltfläche Zu Ressource wechseln.

    Screenshot: Nächste Schritte nach der Bereitstellung einer Ressource

  2. Wählen Sie auf dem Bildschirm für Ihre Ressource im linken Navigationsmenü die Option Schlüssel und Endpunkt aus. Sie verwenden einen Ihrer Schlüssel und Ihren Endpunkt in den folgenden Schritten.

    Screenshot: Abschnitt „Schlüssel und Endpunkt“ für eine Ressource

Erstellen von Umgebungsvariablen

Ihre Anwendung muss authentifiziert werden, um API-Anforderungen senden zu können. In der Produktionsumgebung sollten Sie eine sichere Methode zum Speichern Ihrer Anmeldeinformationen sowie zum Zugriff darauf verwenden. In diesem Beispiel schreiben Sie Ihre Anmeldeinformationen in Umgebungsvariablen auf dem lokalen Computer, auf dem die Anwendung ausgeführt wird.

Tipp

Fügen Sie den Schlüssel nicht direkt in Ihren Code ein, und machen Sie ihn nicht öffentlich. Im Artikel zur Azure KI Services-Sicherheit finden Sie weitere Authentifizierungsoptionen wie zum Beispiel Azure Key Vault.

Um die Umgebungsvariable für Ihren Sprachressourcenschlüssel festzulegen, öffnen Sie ein Konsolenfenster und befolgen die Anweisungen für Ihr Betriebssystem und Ihre Entwicklungsumgebung.

  1. Zum Festlegen der Umgebungsvariablen LANGUAGE_KEY ersetzen Sie your-key durch einen der Schlüssel für Ihre Ressource.
  2. Zum Festlegen der Umgebungsvariablen LANGUAGE_ENDPOINT ersetzen Sie your-endpoint durch den Endpunkt für Ihre Ressource.
setx LANGUAGE_KEY your-key
setx LANGUAGE_ENDPOINT your-endpoint

Hinweis

Wenn Sie nur in der aktuell ausgeführten Konsole auf die Umgebungsvariable zugreifen müssen, können Sie die Umgebungsvariable mit set anstelle von setx festlegen.

Nachdem Sie die Umgebungsvariable hinzugefügt haben, müssen Sie unter Umständen alle ausgeführten Programme neu starten, von denen die Umgebungsvariablen gelesen werden müssen, z. B. das Konsolenfenster. Wenn Sie beispielsweise Visual Studio als Editor verwenden, müssen Sie Visual Studio neu starten, bevor Sie das Beispiel ausführen.

Erstellen einer neuen .NET Core-Anwendung

Erstellen Sie über die Visual Studio-IDE eine neue .NET Core-Konsolenanwendung. Dadurch wird ein Projekt vom Typ „Hallo Welt“ mit einer einzelnen C#-Quelldatei program.cs erstellt.

Installieren Sie die Clientbibliothek, indem Sie im Projektmappen-Explorer mit der rechten Maustaste auf die Projektmappe klicken und NuGet-Pakete verwalten auswählen. Wählen Sie im daraufhin geöffneten Paket-Manager die Option Durchsuchen aus, und suchen Sie nach Azure.AI.TextAnalytics. Wählen Sie die Version 5.2.0 und anschließend Installieren aus. Sie können auch die Paket-Manager-Konsole verwenden.

Codebeispiel

Kopieren Sie den folgenden Code in die Datei program.cs, und führen Sie den Code aus.

using Azure;
using System;
using Azure.AI.TextAnalytics;

namespace Example
{
    class Program
    {
        // This example requires environment variables named "LANGUAGE_KEY" and "LANGUAGE_ENDPOINT"
        static string languageKey = Environment.GetEnvironmentVariable("LANGUAGE_KEY");
        static string languageEndpoint = Environment.GetEnvironmentVariable("LANGUAGE_ENDPOINT");

        private static readonly AzureKeyCredential credentials = new AzureKeyCredential(languageKey);
        private static readonly Uri endpoint = new Uri(languageEndpoint);

        // Example method for detecting sensitive information (PII) from text 
        static void RecognizePIIExample(TextAnalyticsClient client)
        {
            string document = "Call our office at 312-555-1234, or send an email to support@contoso.com.";
        
            PiiEntityCollection entities = client.RecognizePiiEntities(document).Value;
        
            Console.WriteLine($"Redacted Text: {entities.RedactedText}");
            if (entities.Count > 0)
            {
                Console.WriteLine($"Recognized {entities.Count} PII entit{(entities.Count > 1 ? "ies" : "y")}:");
                foreach (PiiEntity entity in entities)
                {
                    Console.WriteLine($"Text: {entity.Text}, Category: {entity.Category}, SubCategory: {entity.SubCategory}, Confidence score: {entity.ConfidenceScore}");
                }
            }
            else
            {
                Console.WriteLine("No entities were found.");
            }
        }

        static void Main(string[] args)
        {
            var client = new TextAnalyticsClient(endpoint, credentials);
            RecognizePIIExample(client);

            Console.Write("Press any key to exit.");
            Console.ReadKey();
        }

    }
}

Output

Redacted Text: Call our office at ************, or send an email to *******************.
Recognized 2 PII entities:
Text: 312-555-1234, Category: PhoneNumber, SubCategory: , Confidence score: 0.8
Text: support@contoso.com, Category: Email, SubCategory: , Confidence score: 0.8

Referenzdokumentation | Weitere Beispiele | Paket (Maven) | Quellcode der Bibliothek

Verwenden Sie diese Schnellstartanleitung, um eine Anwendung zur Erkennung personenbezogener Informationen (Personally Identifiable Information, PII) mit der Clientbibliothek für Java zu erstellen. Im folgenden Beispiel erstellen Sie eine Java-Anwendung, die erkannte vertrauliche Informationen im Text identifizieren kann.

Tipp

Sie können Language Studio verwenden, um die PII-Erkennung in Dokumenten zu testen, ohne programmieren zu müssen.

Voraussetzungen

Einrichten

Erstellen einer Azure-Ressource

Um das nachstehende Codebeispiel zu verwenden, müssen Sie eine Azure-Ressource bereitstellen. Diese Ressource enthält einen Schlüssel und Endpunkt, mit dem Sie die API-Aufrufe authentifizieren, die Sie an den Sprachdienst senden.

  1. Verwenden Sie den folgenden Link, um über das Azure-Portal eine Sprachressource zu erstellen. Sie müssen sich mit Ihrem Azure-Abonnement anmelden.

  2. Wählen Sie auf dem angezeigten Bildschirm Zusätzliche Funktionen auswählen die Option Fahren Sie fort mit dem Erstellen Ihrer Ressource aus.

    Screenshot: Optionen für zusätzliche Funktionen im Azure-Portal

  3. Geben Sie auf dem Bildschirm Sprache erstellen die folgenden Informationen an:

    Detail Beschreibung
    Subscription Das Abonnementkonto, mit dem Ihre Ressource verknüpft wird. Wählen Sie im Dropdownmenü Ihr Azure-Abonnement aus.
    Ressourcengruppe Eine Ressourcengruppe ist ein Container, der die von Ihnen erstellten Ressourcen speichert. Wählen Sie Neu erstellen aus, um eine neue Ressourcengruppe zu erstellen.
    Region Der Standort Ihrer Sprachressource Verschiedene Regionen können je nach physischem Standort Wartezeiten verursachen, haben aber keinen Einfluss auf die Laufzeitverfügbarkeit Ihrer Ressource. Wählen Sie für diesen Schnellstart entweder eine verfügbare Region in Ihrer Nähe oder USA, Osten aus.
    Name Der Name für Ihre Sprachressource. Dieser Name wird auch zum Erstellen einer Endpunkt-URL verwendet, die Ihre Anwendungen zum Senden von API-Anforderungen verwenden.
    Tarif Der Tarif für Ihre Sprachressource Sie können den Tarif Free F0 verwenden, um den Dienst zu testen, und später für die Produktion auf einen kostenpflichtigen Tarif upgraden.

    Screenshot: Details zur Ressourcenerstellung im Azure-Portal

  4. Vergewissern Sie sich, dass das Kontrollkästchen Hinweis zu verantwortungsvoller KI aktiviert ist.

  5. Wählen Sie am unteren Rand der Seite die Option Bewerten + erstellen aus.

  6. Stellen Sie auf dem angezeigten Bildschirm sicher, dass die Überprüfung erfolgreich war und dass Sie Ihre Informationen ordnungsgemäß eingegeben haben. Klicken Sie anschließend auf Erstellen.

Abrufen Ihres Schlüssels und Endpunkts

Als Nächstes benötigen Sie den Schlüssel und Endpunkt der Ressource, um Ihre Anwendung mit der API zu verbinden. Der Schlüssel und der Endpunkt werden später in der Schnellstartanleitung in den Code eingefügt.

  1. Klicken Sie nach erfolgreicher Bereitstellung der Sprachressource unter Nächste Schritte auf die Schaltfläche Zu Ressource wechseln.

    Screenshot: Nächste Schritte nach der Bereitstellung einer Ressource

  2. Wählen Sie auf dem Bildschirm für Ihre Ressource im linken Navigationsmenü die Option Schlüssel und Endpunkt aus. Sie verwenden einen Ihrer Schlüssel und Ihren Endpunkt in den folgenden Schritten.

    Screenshot: Abschnitt „Schlüssel und Endpunkt“ für eine Ressource

Erstellen von Umgebungsvariablen

Ihre Anwendung muss authentifiziert werden, um API-Anforderungen senden zu können. In der Produktionsumgebung sollten Sie eine sichere Methode zum Speichern Ihrer Anmeldeinformationen sowie zum Zugriff darauf verwenden. In diesem Beispiel schreiben Sie Ihre Anmeldeinformationen in Umgebungsvariablen auf dem lokalen Computer, auf dem die Anwendung ausgeführt wird.

Tipp

Fügen Sie den Schlüssel nicht direkt in Ihren Code ein, und machen Sie ihn nicht öffentlich. Im Artikel zur Azure KI Services-Sicherheit finden Sie weitere Authentifizierungsoptionen wie zum Beispiel Azure Key Vault.

Um die Umgebungsvariable für Ihren Sprachressourcenschlüssel festzulegen, öffnen Sie ein Konsolenfenster und befolgen die Anweisungen für Ihr Betriebssystem und Ihre Entwicklungsumgebung.

  1. Zum Festlegen der Umgebungsvariablen LANGUAGE_KEY ersetzen Sie your-key durch einen der Schlüssel für Ihre Ressource.
  2. Zum Festlegen der Umgebungsvariablen LANGUAGE_ENDPOINT ersetzen Sie your-endpoint durch den Endpunkt für Ihre Ressource.
setx LANGUAGE_KEY your-key
setx LANGUAGE_ENDPOINT your-endpoint

Hinweis

Wenn Sie nur in der aktuell ausgeführten Konsole auf die Umgebungsvariable zugreifen müssen, können Sie die Umgebungsvariable mit set anstelle von setx festlegen.

Nachdem Sie die Umgebungsvariable hinzugefügt haben, müssen Sie unter Umständen alle ausgeführten Programme neu starten, von denen die Umgebungsvariablen gelesen werden müssen, z. B. das Konsolenfenster. Wenn Sie beispielsweise Visual Studio als Editor verwenden, müssen Sie Visual Studio neu starten, bevor Sie das Beispiel ausführen.

Hinzufügen der Clientbibliothek

Erstellen Sie ein Maven-Projekt in Ihrer bevorzugten IDE oder Entwicklungsumgebung. Fügen Sie anschließend der Datei pom.xml Ihres Projekts die folgende Abhängigkeit hinzu. Die Implementierungssyntax für andere Buildtools ist online verfügbar.

<dependencies>
     <dependency>
        <groupId>com.azure</groupId>
        <artifactId>azure-ai-textanalytics</artifactId>
        <version>5.2.0</version>
    </dependency>
</dependencies>

Codebeispiel

Erstellen Sie eine Java-Datei mit dem Namen Example.java. Öffnen Sie die Datei, und kopieren Sie den folgenden Code. Führen Sie dann den Code aus.

import com.azure.core.credential.AzureKeyCredential;
import com.azure.ai.textanalytics.models.*;
import com.azure.ai.textanalytics.TextAnalyticsClientBuilder;
import com.azure.ai.textanalytics.TextAnalyticsClient;

public class Example {

    // This example requires environment variables named "LANGUAGE_KEY" and "LANGUAGE_ENDPOINT"
    private static String languageKey = System.getenv("LANGUAGE_KEY");
    private static String languageEndpoint = System.getenv("LANGUAGE_ENDPOINT");

    public static void main(String[] args) {
        TextAnalyticsClient client = authenticateClient(languageKey, languageEndpoint);
        recognizePiiEntitiesExample(client);
    }
    // Method to authenticate the client object with your key and endpoint
    static TextAnalyticsClient authenticateClient(String key, String endpoint) {
        return new TextAnalyticsClientBuilder()
                .credential(new AzureKeyCredential(key))
                .endpoint(endpoint)
                .buildClient();
    }

    // Example method for detecting sensitive information (PII) from text 
    static void recognizePiiEntitiesExample(TextAnalyticsClient client)
    {
        // The text that need be analyzed.
        String document = "My SSN is 859-98-0987";
        PiiEntityCollection piiEntityCollection = client.recognizePiiEntities(document);
        System.out.printf("Redacted Text: %s%n", piiEntityCollection.getRedactedText());
        piiEntityCollection.forEach(entity -> System.out.printf(
            "Recognized Personally Identifiable Information entity: %s, entity category: %s, entity subcategory: %s,"
                + " confidence score: %f.%n",
            entity.getText(), entity.getCategory(), entity.getSubcategory(), entity.getConfidenceScore()));
    }
}

Output

Redacted Text: My SSN is ***********
Recognized Personally Identifiable Information entity: 859-98-0987, entity category: USSocialSecurityNumber, entity subcategory: null, confidence score: 0.650000.

Referenzdokumentation | Weitere Beispiele | Paket (npm) | Quellcode der Bibliothek

Verwenden Sie diese Schnellstartanleitung, um eine Anwendung zur Erkennung personenbezogener Informationen (Personally Identifiable Information, PII) mit der Clientbibliothek für Node.js zu erstellen. Im folgenden Beispiel erstellen Sie eine JavaScript-Anwendung, die erkannte vertrauliche Informationen im Text identifizieren kann.

Voraussetzungen

Einrichten

Erstellen einer Azure-Ressource

Um das nachstehende Codebeispiel zu verwenden, müssen Sie eine Azure-Ressource bereitstellen. Diese Ressource enthält einen Schlüssel und Endpunkt, mit dem Sie die API-Aufrufe authentifizieren, die Sie an den Sprachdienst senden.

  1. Verwenden Sie den folgenden Link, um über das Azure-Portal eine Sprachressource zu erstellen. Sie müssen sich mit Ihrem Azure-Abonnement anmelden.

  2. Wählen Sie auf dem angezeigten Bildschirm Zusätzliche Funktionen auswählen die Option Fahren Sie fort mit dem Erstellen Ihrer Ressource aus.

    Screenshot: Optionen für zusätzliche Funktionen im Azure-Portal

  3. Geben Sie auf dem Bildschirm Sprache erstellen die folgenden Informationen an:

    Detail Beschreibung
    Subscription Das Abonnementkonto, mit dem Ihre Ressource verknüpft wird. Wählen Sie im Dropdownmenü Ihr Azure-Abonnement aus.
    Ressourcengruppe Eine Ressourcengruppe ist ein Container, der die von Ihnen erstellten Ressourcen speichert. Wählen Sie Neu erstellen aus, um eine neue Ressourcengruppe zu erstellen.
    Region Der Standort Ihrer Sprachressource Verschiedene Regionen können je nach physischem Standort Wartezeiten verursachen, haben aber keinen Einfluss auf die Laufzeitverfügbarkeit Ihrer Ressource. Wählen Sie für diesen Schnellstart entweder eine verfügbare Region in Ihrer Nähe oder USA, Osten aus.
    Name Der Name für Ihre Sprachressource. Dieser Name wird auch zum Erstellen einer Endpunkt-URL verwendet, die Ihre Anwendungen zum Senden von API-Anforderungen verwenden.
    Tarif Der Tarif für Ihre Sprachressource Sie können den Tarif Free F0 verwenden, um den Dienst zu testen, und später für die Produktion auf einen kostenpflichtigen Tarif upgraden.

    Screenshot: Details zur Ressourcenerstellung im Azure-Portal

  4. Vergewissern Sie sich, dass das Kontrollkästchen Hinweis zu verantwortungsvoller KI aktiviert ist.

  5. Wählen Sie am unteren Rand der Seite die Option Bewerten + erstellen aus.

  6. Stellen Sie auf dem angezeigten Bildschirm sicher, dass die Überprüfung erfolgreich war und dass Sie Ihre Informationen ordnungsgemäß eingegeben haben. Klicken Sie anschließend auf Erstellen.

Abrufen Ihres Schlüssels und Endpunkts

Als Nächstes benötigen Sie den Schlüssel und Endpunkt der Ressource, um Ihre Anwendung mit der API zu verbinden. Der Schlüssel und der Endpunkt werden später in der Schnellstartanleitung in den Code eingefügt.

  1. Klicken Sie nach erfolgreicher Bereitstellung der Sprachressource unter Nächste Schritte auf die Schaltfläche Zu Ressource wechseln.

    Screenshot: Nächste Schritte nach der Bereitstellung einer Ressource

  2. Wählen Sie auf dem Bildschirm für Ihre Ressource im linken Navigationsmenü die Option Schlüssel und Endpunkt aus. Sie verwenden einen Ihrer Schlüssel und Ihren Endpunkt in den folgenden Schritten.

    Screenshot: Abschnitt „Schlüssel und Endpunkt“ für eine Ressource

Erstellen von Umgebungsvariablen

Ihre Anwendung muss authentifiziert werden, um API-Anforderungen senden zu können. In der Produktionsumgebung sollten Sie eine sichere Methode zum Speichern Ihrer Anmeldeinformationen sowie zum Zugriff darauf verwenden. In diesem Beispiel schreiben Sie Ihre Anmeldeinformationen in Umgebungsvariablen auf dem lokalen Computer, auf dem die Anwendung ausgeführt wird.

Tipp

Fügen Sie den Schlüssel nicht direkt in Ihren Code ein, und machen Sie ihn nicht öffentlich. Im Artikel zur Azure KI Services-Sicherheit finden Sie weitere Authentifizierungsoptionen wie zum Beispiel Azure Key Vault.

Um die Umgebungsvariable für Ihren Sprachressourcenschlüssel festzulegen, öffnen Sie ein Konsolenfenster und befolgen die Anweisungen für Ihr Betriebssystem und Ihre Entwicklungsumgebung.

  1. Zum Festlegen der Umgebungsvariablen LANGUAGE_KEY ersetzen Sie your-key durch einen der Schlüssel für Ihre Ressource.
  2. Zum Festlegen der Umgebungsvariablen LANGUAGE_ENDPOINT ersetzen Sie your-endpoint durch den Endpunkt für Ihre Ressource.
setx LANGUAGE_KEY your-key
setx LANGUAGE_ENDPOINT your-endpoint

Hinweis

Wenn Sie nur in der aktuell ausgeführten Konsole auf die Umgebungsvariable zugreifen müssen, können Sie die Umgebungsvariable mit set anstelle von setx festlegen.

Nachdem Sie die Umgebungsvariable hinzugefügt haben, müssen Sie unter Umständen alle ausgeführten Programme neu starten, von denen die Umgebungsvariablen gelesen werden müssen, z. B. das Konsolenfenster. Wenn Sie beispielsweise Visual Studio als Editor verwenden, müssen Sie Visual Studio neu starten, bevor Sie das Beispiel ausführen.

Erstellen einer neuen Node.js-Anwendung

Erstellen Sie in einem Konsolenfenster (etwa cmd, PowerShell oder Bash) ein neues Verzeichnis für Ihre App, und rufen Sie es auf.

mkdir myapp 

cd myapp

Führen Sie den Befehl npm init aus, um eine Knotenanwendung mit der Datei package.json zu erstellen.

npm init

Installieren der Clientbibliothek

Installieren des npm-Pakets:

npm install @azure/ai-text-analytics

Codebeispiel

Öffnen Sie die Datei, und kopieren Sie den folgenden Code. Führen Sie dann den Code aus.

"use strict";

const { TextAnalyticsClient, AzureKeyCredential } = require("@azure/ai-text-analytics");

// This example requires environment variables named "LANGUAGE_KEY" and "LANGUAGE_ENDPOINT"
const key = process.env.LANGUAGE_KEY;
const endpoint = process.env.LANGUAGE_ENDPOINT;

//an example document for pii recognition
const documents = [ "The employee's phone number is (555) 555-5555." ];

async function main() {
    console.log(`PII recognition sample`);
  
    const client = new TextAnalyticsClient(endpoint, new AzureKeyCredential(key));
  
    const documents = ["My phone number is 555-555-5555"];
  
    const [result] = await client.analyze("PiiEntityRecognition", documents, "en");
  
    if (!result.error) {
      console.log(`Redacted text: "${result.redactedText}"`);
      console.log("Pii Entities: ");
      for (const entity of result.entities) {
        console.log(`\t- "${entity.text}" of type ${entity.category}`);
      }
    }
}

main().catch((err) => {
console.error("The sample encountered an error:", err);
});

Output

PII recognition sample
Redacted text: "My phone number is ************"
Pii Entities:
        - "555-555-5555" of type PhoneNumber

Referenzdokumentation | Weitere Beispiele | Paket (PyPi) | Quellcode der Bibliothek

Verwenden Sie diese Schnellstartanleitung, um eine Anwendung zur Erkennung personenbezogener Informationen (Personally Identifiable Information, PII) mit der Clientbibliothek für Python zu erstellen. Im folgenden Beispiel erstellen Sie eine Python-Anwendung, die erkannte vertrauliche Informationen im Text identifizieren kann.

Voraussetzungen

Einrichten

Erstellen einer Azure-Ressource

Um das nachstehende Codebeispiel zu verwenden, müssen Sie eine Azure-Ressource bereitstellen. Diese Ressource enthält einen Schlüssel und Endpunkt, mit dem Sie die API-Aufrufe authentifizieren, die Sie an den Sprachdienst senden.

  1. Verwenden Sie den folgenden Link, um über das Azure-Portal eine Sprachressource zu erstellen. Sie müssen sich mit Ihrem Azure-Abonnement anmelden.

  2. Wählen Sie auf dem angezeigten Bildschirm Zusätzliche Funktionen auswählen die Option Fahren Sie fort mit dem Erstellen Ihrer Ressource aus.

    Screenshot: Optionen für zusätzliche Funktionen im Azure-Portal

  3. Geben Sie auf dem Bildschirm Sprache erstellen die folgenden Informationen an:

    Detail Beschreibung
    Subscription Das Abonnementkonto, mit dem Ihre Ressource verknüpft wird. Wählen Sie im Dropdownmenü Ihr Azure-Abonnement aus.
    Ressourcengruppe Eine Ressourcengruppe ist ein Container, der die von Ihnen erstellten Ressourcen speichert. Wählen Sie Neu erstellen aus, um eine neue Ressourcengruppe zu erstellen.
    Region Der Standort Ihrer Sprachressource Verschiedene Regionen können je nach physischem Standort Wartezeiten verursachen, haben aber keinen Einfluss auf die Laufzeitverfügbarkeit Ihrer Ressource. Wählen Sie für diesen Schnellstart entweder eine verfügbare Region in Ihrer Nähe oder USA, Osten aus.
    Name Der Name für Ihre Sprachressource. Dieser Name wird auch zum Erstellen einer Endpunkt-URL verwendet, die Ihre Anwendungen zum Senden von API-Anforderungen verwenden.
    Tarif Der Tarif für Ihre Sprachressource Sie können den Tarif Free F0 verwenden, um den Dienst zu testen, und später für die Produktion auf einen kostenpflichtigen Tarif upgraden.

    Screenshot: Details zur Ressourcenerstellung im Azure-Portal

  4. Vergewissern Sie sich, dass das Kontrollkästchen Hinweis zu verantwortungsvoller KI aktiviert ist.

  5. Wählen Sie am unteren Rand der Seite die Option Bewerten + erstellen aus.

  6. Stellen Sie auf dem angezeigten Bildschirm sicher, dass die Überprüfung erfolgreich war und dass Sie Ihre Informationen ordnungsgemäß eingegeben haben. Klicken Sie anschließend auf Erstellen.

Abrufen Ihres Schlüssels und Endpunkts

Als Nächstes benötigen Sie den Schlüssel und Endpunkt der Ressource, um Ihre Anwendung mit der API zu verbinden. Der Schlüssel und der Endpunkt werden später in der Schnellstartanleitung in den Code eingefügt.

  1. Klicken Sie nach erfolgreicher Bereitstellung der Sprachressource unter Nächste Schritte auf die Schaltfläche Zu Ressource wechseln.

    Screenshot: Nächste Schritte nach der Bereitstellung einer Ressource

  2. Wählen Sie auf dem Bildschirm für Ihre Ressource im linken Navigationsmenü die Option Schlüssel und Endpunkt aus. Sie verwenden einen Ihrer Schlüssel und Ihren Endpunkt in den folgenden Schritten.

    Screenshot: Abschnitt „Schlüssel und Endpunkt“ für eine Ressource

Erstellen von Umgebungsvariablen

Ihre Anwendung muss authentifiziert werden, um API-Anforderungen senden zu können. In der Produktionsumgebung sollten Sie eine sichere Methode zum Speichern Ihrer Anmeldeinformationen sowie zum Zugriff darauf verwenden. In diesem Beispiel schreiben Sie Ihre Anmeldeinformationen in Umgebungsvariablen auf dem lokalen Computer, auf dem die Anwendung ausgeführt wird.

Tipp

Fügen Sie den Schlüssel nicht direkt in Ihren Code ein, und machen Sie ihn nicht öffentlich. Im Artikel zur Azure KI Services-Sicherheit finden Sie weitere Authentifizierungsoptionen wie zum Beispiel Azure Key Vault.

Um die Umgebungsvariable für Ihren Sprachressourcenschlüssel festzulegen, öffnen Sie ein Konsolenfenster und befolgen die Anweisungen für Ihr Betriebssystem und Ihre Entwicklungsumgebung.

  1. Zum Festlegen der Umgebungsvariablen LANGUAGE_KEY ersetzen Sie your-key durch einen der Schlüssel für Ihre Ressource.
  2. Zum Festlegen der Umgebungsvariablen LANGUAGE_ENDPOINT ersetzen Sie your-endpoint durch den Endpunkt für Ihre Ressource.
setx LANGUAGE_KEY your-key
setx LANGUAGE_ENDPOINT your-endpoint

Hinweis

Wenn Sie nur in der aktuell ausgeführten Konsole auf die Umgebungsvariable zugreifen müssen, können Sie die Umgebungsvariable mit set anstelle von setx festlegen.

Nachdem Sie die Umgebungsvariable hinzugefügt haben, müssen Sie unter Umständen alle ausgeführten Programme neu starten, von denen die Umgebungsvariablen gelesen werden müssen, z. B. das Konsolenfenster. Wenn Sie beispielsweise Visual Studio als Editor verwenden, müssen Sie Visual Studio neu starten, bevor Sie das Beispiel ausführen.

Installieren der Clientbibliothek

Nach der Installation von Python, können Sie die Clientbibliothek mit Folgendem installieren:

pip install azure-ai-textanalytics==5.2.0

Codebeispiel

Erstellen Sie eine neue Python-Datei, und kopieren Sie den folgenden Code. Führen Sie dann den Code aus.

# This example requires environment variables named "LANGUAGE_KEY" and "LANGUAGE_ENDPOINT"
language_key = os.environ.get('LANGUAGE_KEY')
language_endpoint = os.environ.get('LANGUAGE_ENDPOINT')

from azure.ai.textanalytics import TextAnalyticsClient
from azure.core.credentials import AzureKeyCredential

# Authenticate the client using your key and endpoint 
def authenticate_client():
    ta_credential = AzureKeyCredential(language_key)
    text_analytics_client = TextAnalyticsClient(
            endpoint=language_endpoint, 
            credential=ta_credential)
    return text_analytics_client

client = authenticate_client()

# Example method for detecting sensitive information (PII) from text 
def pii_recognition_example(client):
    documents = [
        "The employee's SSN is 859-98-0987.",
        "The employee's phone number is 555-555-5555."
    ]
    response = client.recognize_pii_entities(documents, language="en")
    result = [doc for doc in response if not doc.is_error]
    for doc in result:
        print("Redacted Text: {}".format(doc.redacted_text))
        for entity in doc.entities:
            print("Entity: {}".format(entity.text))
            print("\tCategory: {}".format(entity.category))
            print("\tConfidence Score: {}".format(entity.confidence_score))
            print("\tOffset: {}".format(entity.offset))
            print("\tLength: {}".format(entity.length))
pii_recognition_example(client)

Ausgabe

Redacted Text: The ********'s SSN is ***********.
Entity: employee
        Category: PersonType
        Confidence Score: 0.97
        Offset: 4
        Length: 8
Entity: 859-98-0987
        Category: USSocialSecurityNumber
        Confidence Score: 0.65
        Offset: 22
        Length: 11
Redacted Text: The ********'s phone number is ************.
Entity: employee
        Category: PersonType
        Confidence Score: 0.96
        Offset: 4
        Length: 8
Entity: 555-555-5555
        Category: PhoneNumber
        Confidence Score: 0.8
        Offset: 31
        Length: 12

Referenzdokumentation

Verwenden Sie diese Schnellstartanleitung, um Anforderung für die Erkennung personenbezogener Daten (Personally Identifiable Information, PII) mithilfe der REST-API zu senden. Im folgenden Beispiel verwenden Sie cURL, um erkannte vertrauliche Informationen im Text zu identifizieren.

Voraussetzungen

Einrichten

Erstellen einer Azure-Ressource

Um das nachstehende Codebeispiel zu verwenden, müssen Sie eine Azure-Ressource bereitstellen. Diese Ressource enthält einen Schlüssel und Endpunkt, mit dem Sie die API-Aufrufe authentifizieren, die Sie an den Sprachdienst senden.

  1. Verwenden Sie den folgenden Link, um über das Azure-Portal eine Sprachressource zu erstellen. Sie müssen sich mit Ihrem Azure-Abonnement anmelden.

  2. Wählen Sie auf dem angezeigten Bildschirm Zusätzliche Funktionen auswählen die Option Fahren Sie fort mit dem Erstellen Ihrer Ressource aus.

    Screenshot: Optionen für zusätzliche Funktionen im Azure-Portal

  3. Geben Sie auf dem Bildschirm Sprache erstellen die folgenden Informationen an:

    Detail Beschreibung
    Subscription Das Abonnementkonto, mit dem Ihre Ressource verknüpft wird. Wählen Sie im Dropdownmenü Ihr Azure-Abonnement aus.
    Ressourcengruppe Eine Ressourcengruppe ist ein Container, der die von Ihnen erstellten Ressourcen speichert. Wählen Sie Neu erstellen aus, um eine neue Ressourcengruppe zu erstellen.
    Region Der Standort Ihrer Sprachressource Verschiedene Regionen können je nach physischem Standort Wartezeiten verursachen, haben aber keinen Einfluss auf die Laufzeitverfügbarkeit Ihrer Ressource. Wählen Sie für diesen Schnellstart entweder eine verfügbare Region in Ihrer Nähe oder USA, Osten aus.
    Name Der Name für Ihre Sprachressource. Dieser Name wird auch zum Erstellen einer Endpunkt-URL verwendet, die Ihre Anwendungen zum Senden von API-Anforderungen verwenden.
    Tarif Der Tarif für Ihre Sprachressource Sie können den Tarif Free F0 verwenden, um den Dienst zu testen, und später für die Produktion auf einen kostenpflichtigen Tarif upgraden.

    Screenshot: Details zur Ressourcenerstellung im Azure-Portal

  4. Vergewissern Sie sich, dass das Kontrollkästchen Hinweis zu verantwortungsvoller KI aktiviert ist.

  5. Wählen Sie am unteren Rand der Seite die Option Bewerten + erstellen aus.

  6. Stellen Sie auf dem angezeigten Bildschirm sicher, dass die Überprüfung erfolgreich war und dass Sie Ihre Informationen ordnungsgemäß eingegeben haben. Klicken Sie anschließend auf Erstellen.

Abrufen Ihres Schlüssels und Endpunkts

Als Nächstes benötigen Sie den Schlüssel und Endpunkt der Ressource, um Ihre Anwendung mit der API zu verbinden. Der Schlüssel und der Endpunkt werden später in der Schnellstartanleitung in den Code eingefügt.

  1. Klicken Sie nach erfolgreicher Bereitstellung der Sprachressource unter Nächste Schritte auf die Schaltfläche Zu Ressource wechseln.

    Screenshot: Nächste Schritte nach der Bereitstellung einer Ressource

  2. Wählen Sie auf dem Bildschirm für Ihre Ressource im linken Navigationsmenü die Option Schlüssel und Endpunkt aus. Sie verwenden einen Ihrer Schlüssel und Ihren Endpunkt in den folgenden Schritten.

    Screenshot: Abschnitt „Schlüssel und Endpunkt“ für eine Ressource

Erstellen von Umgebungsvariablen

Ihre Anwendung muss authentifiziert werden, um API-Anforderungen senden zu können. In der Produktionsumgebung sollten Sie eine sichere Methode zum Speichern Ihrer Anmeldeinformationen sowie zum Zugriff darauf verwenden. In diesem Beispiel schreiben Sie Ihre Anmeldeinformationen in Umgebungsvariablen auf dem lokalen Computer, auf dem die Anwendung ausgeführt wird.

Tipp

Fügen Sie den Schlüssel nicht direkt in Ihren Code ein, und machen Sie ihn nicht öffentlich. Im Artikel zur Azure KI Services-Sicherheit finden Sie weitere Authentifizierungsoptionen wie zum Beispiel Azure Key Vault.

Um die Umgebungsvariable für Ihren Sprachressourcenschlüssel festzulegen, öffnen Sie ein Konsolenfenster und befolgen die Anweisungen für Ihr Betriebssystem und Ihre Entwicklungsumgebung.

  1. Zum Festlegen der Umgebungsvariablen LANGUAGE_KEY ersetzen Sie your-key durch einen der Schlüssel für Ihre Ressource.
  2. Zum Festlegen der Umgebungsvariablen LANGUAGE_ENDPOINT ersetzen Sie your-endpoint durch den Endpunkt für Ihre Ressource.
setx LANGUAGE_KEY your-key
setx LANGUAGE_ENDPOINT your-endpoint

Hinweis

Wenn Sie nur in der aktuell ausgeführten Konsole auf die Umgebungsvariable zugreifen müssen, können Sie die Umgebungsvariable mit set anstelle von setx festlegen.

Nachdem Sie die Umgebungsvariable hinzugefügt haben, müssen Sie unter Umständen alle ausgeführten Programme neu starten, von denen die Umgebungsvariablen gelesen werden müssen, z. B. das Konsolenfenster. Wenn Sie beispielsweise Visual Studio als Editor verwenden, müssen Sie Visual Studio neu starten, bevor Sie das Beispiel ausführen.

Erstellen einer JSON-Datei mit dem Beispielanforderungstext

Erstellen Sie in einem Code-Editor eine neue Datei namens test_pii_payload.json, und kopieren Sie das folgende JSON-Beispiel. Diese Beispielanforderung wird im nächsten Schritt an die API gesendet.

{
    "kind": "PiiEntityRecognition",
    "parameters": {
        "modelVersion": "latest"
    },
    "analysisInput":{
        "documents":[
            {
                "id":"1",
                "language": "en",
                "text": "Call our office at 312-555-1234, or send an email to support@contoso.com"
            }
        ]
    }
}
'

Speichern Sie test_pii_payload.json irgendwo auf Ihrem Computer. Beispielsweise auf Ihrem Desktop.

Senden einer API-Anforderung zum Erkennen von personenbezogenen Informationen

Verwenden Sie die folgenden Befehle, um die API-Anforderung mithilfe des von Ihnen genutzten Programms zu senden. Kopieren Sie den Befehl in Ihr Terminal, und führen Sie ihn aus.

parameter BESCHREIBUNG
-X POST <endpoint> Gibt den Endpunkt für den Zugriff auf die API an
-H Content-Type: application/json Der Inhaltstyp zum Senden von JSON-Daten
-H "Ocp-Apim-Subscription-Key:<key> Gibt den Schlüssel für den Zugriff auf die API an
-d <documents> Die JSON-Datei, die die zu sendenden Dokumente enthält

Ersetzen Sie C:\Users\<myaccount>\Desktop\test_pii_payload.json durch den Speicherort der im vorherigen Schritt erstellten JSON-Anforderungsdatei.

Eingabeaufforderung

curl -X POST "%LANGUAGE_ENDPOINT%/language/:analyze-text?api-version=2022-05-01" ^
-H "Content-Type: application/json" ^
-H "Ocp-Apim-Subscription-Key: %LANGUAGE_KEY%" ^
-d "@C:\Users\<myaccount>\Desktop\test_pii_payload.json"

PowerShell

curl.exe -X POST $env:LANGUAGE_ENDPOINT/language/:analyze-text?api-version=2022-05-01 `
-H "Content-Type: application/json" `
-H "Ocp-Apim-Subscription-Key: $env:LANGUAGE_KEY" `
-d "@C:\Users\<myaccount>\Desktop\test_pii_payload.json"

JSON-Antwort

{
	"kind": "PiiEntityRecognitionResults",
	"results": {
		"documents": [{
			"redactedText": "Call our office at ************, or send an email to *******************",
			"id": "1",
			"entities": [{
				"text": "312-555-1234",
				"category": "PhoneNumber",
				"offset": 19,
				"length": 12,
				"confidenceScore": 0.8
			}, {
				"text": "support@contoso.com",
				"category": "Email",
				"offset": 53,
				"length": 19,
				"confidenceScore": 0.8
			}],
			"warnings": []
		}],
		"errors": [],
		"modelVersion": "2021-01-15"
	}
}

Bereinigen von Ressourcen

Wenn Sie ein Azure KI Services-Abonnement bereinigen und entfernen möchten, können Sie die Ressource oder die Ressourcengruppe löschen. Wenn Sie die Ressourcengruppe löschen, werden auch alle anderen Ressourcen gelöscht, die ihr zugeordnet sind.

Nächste Schritte