Wat is PII-detectie (Personally Identifiable Information) in Azure AI Language?
Vanaf juni 2024 bieden we nu ondersteuning voor algemene beschikbaarheid voor de Conversational PII-service (alleen engels). Klanten kunnen nu transcripties, chats en andere tekst redigeren die zijn geschreven in een gespreksstijl (dat wil zeggen tekst met 'um's, 'ah's, meerdere sprekers en de spelling van woorden voor meer duidelijkheid) met een beter vertrouwen in AI-kwaliteit, ondersteuning en productie-omgevingsondersteuning van Azure, en beveiliging op ondernemingsniveau.
PII-detectie is een van de functies die worden aangeboden door Azure AI Language, een verzameling machine learning- en AI-algoritmen in de cloud voor het ontwikkelen van intelligente toepassingen die betrekking hebben op geschreven taal. De functie PII-detectie kan gevoelige informatie identificeren, categoriseren en redacteren in ongestructureerde tekst. Bijvoorbeeld telefoonnummers, e-mailadressen en vormen van identificatie. Azure AI Language ondersteunt algemene tekst-PII-redaction, evenals Conversational PII, een gespecialiseerd model voor het verwerken van spraaktranscripties en de meer informele gesprekstoon van vergaderings- en gesprektranscripties. De service biedt ook ondersteuning voor systeemeigen document-PII-redaction, waarbij de invoer en uitvoer gestructureerde documentbestanden zijn.
- Quickstarts zijn aan de slag-instructies om u te begeleiden bij het indienen van aanvragen bij de service.
- Instructiegidsen bevatten instructies voor het gebruik van de service op specifiekere of aangepaste manieren.
- De conceptuele artikelen bieden uitgebreide uitleg over de functionaliteit en functies van de service.
Standaardwerkstroom
Als u deze functie wilt gebruiken, verzendt u gegevens voor analyse en verwerkt u de API-uitvoer in uw toepassing. Analyse wordt uitgevoerd als zodanig, zonder dat er aanpassingen zijn toegevoegd aan het model dat op uw gegevens wordt gebruikt.
Maak een Azure AI Language-resource, waarmee u toegang krijgt tot de functies die door Azure AI Language worden aangeboden. Er wordt een wachtwoord gegenereerd (een sleutel genoemd) en een eindpunt-URL die u gebruikt om API-aanvragen te verifiëren.
Maak een aanvraag met behulp van de REST API of de clientbibliotheek voor C#, Java, JavaScript en Python. U kunt ook asynchrone aanroepen verzenden met een batchaanvraag om API-aanvragen voor meerdere functies te combineren tot één aanroep.
Verzend de aanvraag met uw tekstgegevens. Uw sleutel en eindpunt worden gebruikt voor verificatie.
U kunt het antwoord streamen of lokaal opslaan.
Systeemeigen documentondersteuning
Een systeemeigen document verwijst naar de bestandsindeling die wordt gebruikt om het oorspronkelijke document te maken, zoals Microsoft Word (docx) of een draagbaar documentbestand (PDF). Systeemeigen documentondersteuning elimineert de noodzaak voor het vooraf verwerken van tekst voordat u de resourcemogelijkheden van Azure AI Language gebruikt. Momenteel is systeemeigen documentondersteuning beschikbaar voor de mogelijkheid PiiEntityRecognition.
PiI ondersteunt momenteel de volgende systeemeigen documentindelingen:
Bestandstype | Bestandsextensie | Beschrijving |
---|---|---|
Tekst | .txt |
Een niet-opgemaakt tekstdocument. |
Adobe PDF | .pdf |
Een document met een draagbare documentindeling. |
Microsoft Word | .docx |
Een Microsoft Word-documentbestand. |
Zie Systeemeigen documenten gebruiken voor taalverwerking voor meer informatie
Aan de slag met PII-detectie
Als u PII-detectie wilt gebruiken, verzendt u tekst voor analyse en verwerkt u de API-uitvoer in uw toepassing. Analyse wordt uitgevoerd als zodanig, zonder aanpassingen aan het model dat op uw gegevens wordt gebruikt. Er zijn twee manieren om PII-detectie te gebruiken:
Ontwikkelingsoptie | Beschrijving |
---|---|
Taalstudio | Language Studio is een webplatform waarmee u entiteitskoppelingen kunt proberen met tekstvoorbeelden zonder een Azure-account en uw eigen gegevens wanneer u zich aanmeldt. Zie de quickstart voor Language Studio of Language Studio voor meer informatie. |
REST API of clientbibliotheek (Azure SDK) | Integreer PII-detectie in uw toepassingen met behulp van de REST API of de clientbibliotheek die beschikbaar is in verschillende talen. Zie de quickstart voor PII-detectie voor meer informatie. |
Referentiedocumentatie en codevoorbeelden
Als u deze functie in uw toepassingen gebruikt, raadpleegt u de volgende referentiedocumentatie en voorbeelden voor Azure AI Language:
Ontwikkelingsoptie/taal | Referentiedocumentatie | Voorbeelden |
---|---|---|
REST-API | REST API-documentatie | |
C# | C#-documentatie | C#-voorbeelden |
Java | Java-documentatie | Java-voorbeelden |
JavaScript | Documentatie over JavaScript | JavaScript-voorbeelden |
Python | Python-documentatie | Python-voorbeelden |
Verantwoorde AI
Een AI-systeem bevat niet alleen de technologie, maar ook de mensen die het gebruiken, de mensen die er last van hebben en de implementatieomgeving. Lees de transparantienotitie voor PII voor meer informatie over verantwoord AI-gebruik en -implementatie in uw systemen. Raadpleeg voor meer informatie de volgende artikelen:
- Transparantienotitie voor Azure AI-taal
- Integratie en verantwoordelijk gebruik
- Gegevens, privacy en beveiliging
Voorbeeldscenario's
- Vertrouwelijkheidslabels toepassen, bijvoorbeeld op basis van de resultaten van de PII-service, kan een openbaar vertrouwelijkheidslabel worden toegepast op documenten waarop geen PII-entiteiten worden gedetecteerd. Voor documenten waarin Amerikaanse adressen en telefoonnummers worden herkend, kan een vertrouwelijk label worden toegepast. Een zeer vertrouwelijk label kan worden gebruikt voor documenten waar bankrouteringsnummers worden herkend.
- Bepaalde categorieën persoonlijke gegevens redigeren uit documenten die bredere circulatie krijgen : als klantcontactrecords bijvoorbeeld toegankelijk zijn voor ondersteuningsmedewerkers van de frontline, kan het bedrijf de persoonlijke gegevens van de klant redigeren naast hun naam uit de versie van de klantgeschiedenis om de privacy van de klant te behouden.
- Persoonlijke gegevens reden om onbewuste vooroordelen te verminderen, bijvoorbeeld tijdens het cv-beoordelingsproces van een bedrijf, kunnen ze naam, adres en telefoonnummer blokkeren om onbewust geslacht of andere vooroordelen te verminderen.
- Vervang persoonlijke gegevens in brongegevens voor machine learning om de oneerlijkheid te verminderen. Als u bijvoorbeeld namen wilt verwijderen die geslacht kunnen onthullen bij het trainen van een machine learning-model, kunt u de service gebruiken om ze te identificeren en kunt u ze vervangen door algemene tijdelijke aanduidingen voor modeltraining.
- Persoonlijke gegevens verwijderen uit transcriptie van het callcenter, bijvoorbeeld als u namen of andere PII-gegevens wilt verwijderen die plaatsvinden tussen de agent en de klant in een callcenterscenario. U kunt de service gebruiken om ze te identificeren en te verwijderen.
- Gegevens opschonen voor gegevenswetenschap : PII kan worden gebruikt om de gegevens gereed te maken voor gegevenswetenschappers en technici om deze gegevens te kunnen gebruiken om hun machine learning-modellen te trainen. Redacting van de gegevens om ervoor te zorgen dat klantgegevens niet zichtbaar zijn.
Volgende stappen
Er zijn twee manieren om aan de slag te gaan met de entiteitskoppelingsfunctie:
- Language Studio, een webplatform waarmee u verschillende taalservicefuncties kunt uitproberen zonder dat u code hoeft te schrijven.
- Het quickstart-artikel voor instructies voor het indienen van aanvragen voor de service met behulp van de REST API en clientbibliotheek-SDK.