Persoonlijke identificatiegegevens (PII) detecteren en redacteren in gesprekken
Met de functie Conversational PII kunnen gesprekken worden geëvalueerd om gevoelige informatie (PII) op te halen in de inhoud in verschillende vooraf gedefinieerde categorieën en deze op te slaan. Deze API werkt op zowel getranscribeerde tekst (waarnaar wordt verwezen als transcripties) als chats. Voor transcripties maakt de API ook redaction van audiosegmenten mogelijk, die de PII-informatie bevat door de audiotijdinformatie voor die audiosegmenten op te geven.
Bepalen hoe de gegevens moeten worden verwerkt (optioneel)
Het PII-detectiemodel opgeven
Deze functie gebruikt standaard het nieuwste beschikbare AI-model voor uw invoer. U kunt uw API-aanvragen ook configureren voor het gebruik van een specifieke modelversie.
Taalondersteuning
Zie de pagina taalondersteuning voor PII voor meer informatie. Momenteel ondersteunt het model van de conversationele PII GA alleen de Engelse taal. Het preview-model en de API ondersteunen dezelfde lijsttalen als de andere taalservices.
Ondersteuning voor regio
De conversationele PII-API ondersteunt alle Azure-regio's die worden ondersteund door de Taalservice.
Gegevens verzenden
Notitie
Zie het Language Studio-artikel voor informatie over het opmaken van gesprekstekst die u wilt verzenden met Behulp van Language Studio.
U kunt de invoer verzenden naar de API als lijst met gespreksitems. Analyse wordt uitgevoerd na ontvangst van de aanvraag. Omdat de API asynchroon is, kan er een vertraging optreden tussen het verzenden van een API-aanvraag en het ontvangen van de resultaten. Zie de onderstaande gegevenslimieten voor informatie over de grootte en het aantal aanvragen dat u per minuut en seconde kunt verzenden.
Wanneer u de asynchrone functie gebruikt, zijn de API-resultaten gedurende 24 uur beschikbaar vanaf het moment dat de aanvraag is opgenomen en wordt aangegeven in het antwoord. Na deze periode worden de resultaten opgeschoond en zijn ze niet meer beschikbaar voor het ophalen.
Wanneer u gegevens verzendt naar conversationele PII, kunt u één gesprek (chat of gesproken) per aanvraag verzenden.
De API probeert alle gedefinieerde entiteitscategorieën voor een bepaalde gespreksinvoer te detecteren. Als u wilt opgeven welke entiteiten worden gedetecteerd en geretourneerd, gebruikt u de optionele piiCategories
parameter met de juiste entiteitscategorieën.
Voor gesproken transcripties worden de gedetecteerde entiteiten geretourneerd op de redactionSource
opgegeven parameterwaarde. Op dit moment zijn de ondersteunde waarden voorredactionSource
, en maskedItn
lexical
itn
(die respectievelijk worden toegewezen aan spraak-naar-tekst-REST API's itn
display
\displayText
lexical
en maskedItn
indeling).text
Daarnaast biedt deze API voor de gesproken transcriptieinvoer ook informatie over de timing van audio om audio redaction mogelijk te maken. Gebruik de optionele includeAudioRedaction
vlag met true
waarde voor het gebruik van de functie audioRedaction. De audio redaction wordt uitgevoerd op basis van de lexicale invoerindeling.
Notitie
Gespreks-PII ondersteunt nu 40.000 tekens als documentgrootte.
PII-resultaten ophalen
Wanneer u resultaten van PII-detectie krijgt, kunt u de resultaten streamen naar een toepassing of de uitvoer opslaan in een bestand op het lokale systeem. Het API-antwoord bevat herkende entiteiten, inclusief hun categorieën en subcategorieën en betrouwbaarheidsscores. De tekenreeks met de ge redacteerde PII-entiteiten wordt ook geretourneerd.
Voorbeelden
Ga naar de overzichtspagina van uw resource in Azure Portal
Selecteer sleutels en eindpunt in het menu aan de linkerkant. U hebt een van de sleutels en het eindpunt nodig om uw API-aanvragen te verifiëren.
Download en installeer het clientbibliotheekpakket voor uw gewenste taal:
Taal Versie van het pakket .NET 1.0.0 Python 1.0.0 Zie de volgende referentiedocumentatie voor meer informatie over de client en het retourobject:
Service- en gegevenslimieten
Zie het artikel over servicelimieten voor informatie over de grootte en het aantal aanvragen dat u per minuut en seconde kunt verzenden.