Wat is PII-detectie (Personally Identifiable Information) in Azure AI Language?

Artikel
10/16/2024

Vanaf juni 2024 bieden we nu ondersteuning voor algemene beschikbaarheid voor de Conversational PII-service (alleen engels). Klanten kunnen nu transcripties, chats en andere tekst redigeren die zijn geschreven in een gespreksstijl (dat wil zeggen tekst met 'um's, 'ah's, meerdere sprekers en de spelling van woorden voor meer duidelijkheid) met een beter vertrouwen in AI-kwaliteit, ondersteuning en productie-omgevingsondersteuning van Azure, en beveiliging op ondernemingsniveau.

PII-detectie is een van de functies die worden aangeboden door Azure AI Language, een verzameling machine learning- en AI-algoritmen in de cloud voor het ontwikkelen van intelligente toepassingen die betrekking hebben op geschreven taal. De functie PII-detectie kan gevoelige informatie identificeren, categoriseren en redacteren in ongestructureerde tekst. Bijvoorbeeld telefoonnummers, e-mailadressen en vormen van identificatie. Azure AI Language ondersteunt algemene tekst-PII-redaction, evenals Conversational PII, een gespecialiseerd model voor het verwerken van spraaktranscripties en de meer informele gesprekstoon van vergaderings- en gesprektranscripties. De service biedt ook ondersteuning voor systeemeigen document-PII-redaction, waarbij de invoer en uitvoer gestructureerde documentbestanden zijn.

Quickstarts zijn aan de slag-instructies om u te begeleiden bij het indienen van aanvragen bij de service.
Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.
De conceptuele artikelen bieden uitgebreide uitleg over de functionaliteit en functies van de service.

Standaardwerkstroom

Als u deze functie wilt gebruiken, verzendt u gegevens voor analyse en verwerkt u de API-uitvoer in uw toepassing. Analyse wordt uitgevoerd als zodanig, zonder dat er aanpassingen zijn toegevoegd aan het model dat op uw gegevens wordt gebruikt.

Maak een Azure AI Language-resource, waarmee u toegang krijgt tot de functies die door Azure AI Language worden aangeboden. Er wordt een wachtwoord gegenereerd (een sleutel genoemd) en een eindpunt-URL die u gebruikt om API-aanvragen te verifiëren.
Maak een aanvraag met behulp van de REST API of de clientbibliotheek voor C#, Java, JavaScript en Python. U kunt ook asynchrone aanroepen verzenden met een batchaanvraag om API-aanvragen voor meerdere functies te combineren tot één aanroep.
Verzend de aanvraag met uw tekstgegevens. Uw sleutel en eindpunt worden gebruikt voor verificatie.
U kunt het antwoord streamen of lokaal opslaan.

Systeemeigen documentondersteuning

Een systeemeigen document verwijst naar de bestandsindeling die wordt gebruikt om het oorspronkelijke document te maken, zoals Microsoft Word (docx) of een draagbaar documentbestand (PDF). Systeemeigen documentondersteuning elimineert de noodzaak voor het vooraf verwerken van tekst voordat u de resourcemogelijkheden van Azure AI Language gebruikt. Momenteel is systeemeigen documentondersteuning beschikbaar voor de mogelijkheid PiiEntityRecognition.

PiI ondersteunt momenteel de volgende systeemeigen documentindelingen:

Bestandstype	Bestandsextensie	Beschrijving
Tekst	`.txt`	Een niet-opgemaakt tekstdocument.
Adobe PDF	`.pdf`	Een document met een draagbare documentindeling.
Microsoft Word	`.docx`	Een Microsoft Word-documentbestand.

Zie Systeemeigen documenten gebruiken voor taalverwerking voor meer informatie

Aan de slag met PII-detectie

Als u PII-detectie wilt gebruiken, verzendt u tekst voor analyse en verwerkt u de API-uitvoer in uw toepassing. Analyse wordt uitgevoerd als zodanig, zonder aanpassingen aan het model dat op uw gegevens wordt gebruikt. Er zijn twee manieren om PII-detectie te gebruiken:

Ontwikkelingsoptie	Beschrijving
Taalstudio	Language Studio is een webplatform waarmee u entiteitskoppelingen kunt proberen met tekstvoorbeelden zonder een Azure-account en uw eigen gegevens wanneer u zich aanmeldt. Zie de quickstart voor Language Studio of Language Studio voor meer informatie.
REST API of clientbibliotheek (Azure SDK)	Integreer PII-detectie in uw toepassingen met behulp van de REST API of de clientbibliotheek die beschikbaar is in verschillende talen. Zie de quickstart voor PII-detectie voor meer informatie.

Referentiedocumentatie en codevoorbeelden

Als u deze functie in uw toepassingen gebruikt, raadpleegt u de volgende referentiedocumentatie en voorbeelden voor Azure AI Language:

Ontwikkelingsoptie/taal	Referentiedocumentatie	Voorbeelden
REST-API	REST API-documentatie
C#	C#-documentatie	C#-voorbeelden
Java	Java-documentatie	Java-voorbeelden
JavaScript	Documentatie over JavaScript	JavaScript-voorbeelden
Python	Python-documentatie	Python-voorbeelden

Verantwoorde AI

Een AI-systeem bevat niet alleen de technologie, maar ook de mensen die het gebruiken, de mensen die er last van hebben en de implementatieomgeving. Lees de transparantienotitie voor PII voor meer informatie over verantwoord AI-gebruik en -implementatie in uw systemen. Raadpleeg voor meer informatie de volgende artikelen:

Voorbeeldscenario's

Vertrouwelijkheidslabels toepassen, bijvoorbeeld op basis van de resultaten van de PII-service, kan een openbaar vertrouwelijkheidslabel worden toegepast op documenten waarop geen PII-entiteiten worden gedetecteerd. Voor documenten waarin Amerikaanse adressen en telefoonnummers worden herkend, kan een vertrouwelijk label worden toegepast. Een zeer vertrouwelijk label kan worden gebruikt voor documenten waar bankrouteringsnummers worden herkend.
Bepaalde categorieën persoonlijke gegevens redigeren uit documenten die bredere circulatie krijgen : als klantcontactrecords bijvoorbeeld toegankelijk zijn voor ondersteuningsmedewerkers van de frontline, kan het bedrijf de persoonlijke gegevens van de klant redigeren naast hun naam uit de versie van de klantgeschiedenis om de privacy van de klant te behouden.
Persoonlijke gegevens reden om onbewuste vooroordelen te verminderen, bijvoorbeeld tijdens het cv-beoordelingsproces van een bedrijf, kunnen ze naam, adres en telefoonnummer blokkeren om onbewust geslacht of andere vooroordelen te verminderen.
Vervang persoonlijke gegevens in brongegevens voor machine learning om de oneerlijkheid te verminderen. Als u bijvoorbeeld namen wilt verwijderen die geslacht kunnen onthullen bij het trainen van een machine learning-model, kunt u de service gebruiken om ze te identificeren en kunt u ze vervangen door algemene tijdelijke aanduidingen voor modeltraining.
Persoonlijke gegevens verwijderen uit transcriptie van het callcenter, bijvoorbeeld als u namen of andere PII-gegevens wilt verwijderen die plaatsvinden tussen de agent en de klant in een callcenterscenario. U kunt de service gebruiken om ze te identificeren en te verwijderen.
Gegevens opschonen voor gegevenswetenschap : PII kan worden gebruikt om de gegevens gereed te maken voor gegevenswetenschappers en technici om deze gegevens te kunnen gebruiken om hun machine learning-modellen te trainen. Redacting van de gegevens om ervoor te zorgen dat klantgegevens niet zichtbaar zijn.

Volgende stappen

Er zijn twee manieren om aan de slag te gaan met de entiteitskoppelingsfunctie:

Language Studio, een webplatform waarmee u verschillende taalservicefuncties kunt uitproberen zonder dat u code hoeft te schrijven.
Het quickstart-artikel voor instructies voor het indienen van aanvragen voor de service met behulp van de REST API en clientbibliotheek-SDK.

Delen via