Identifiera och redigera personligt identifierande information (PII) i konversationer
Funktionen konversations-PII kan utvärdera konversationer för att extrahera känslig information (PII) i innehållet i flera fördefinierade kategorier och redigera dem. Det här API:et fungerar på både transkriberad text (refereras till som avskrifter) och chattar. För avskrifter möjliggör API:et även redigering av ljudsegment, som innehåller PII-informationen genom att tillhandahålla information om ljudtidsinställningar för dessa ljudsegment.
Fastställ hur data ska bearbetas (valfritt)
Ange PII-identifieringsmodellen
Som standard använder den här funktionen den senaste tillgängliga AI-modellen på dina indata. Du kan också konfigurera dina API-begäranden så att de använder en specifik modellversion.
Stöd för språk
För närvarande stöder api:et för förhandsgranskning av konversations-PII endast engelska.
Stöd för regioner
För närvarande stöder API:et för förhandsgranskning av konversations-PII alla Azure-regioner som stöds av språktjänsten.
Skicka data
Anteckning
Mer information om hur du formaterar konversationstext som ska skickas med Language Studio finns i Language Studio-artikeln .
Du kan skicka indata till API:et som en lista över konversationsobjekt. Analysen utförs när begäran har tagits emot. Eftersom API:et är asynkront kan det uppstå en fördröjning mellan att skicka en API-begäran och att ta emot resultatet. Information om storleken och antalet begäranden som du kan skicka per minut och sekund finns i datagränserna nedan.
När du använder funktionen async är API-resultaten tillgängliga i 24 timmar från det att begäran matades in och anges i svaret. Efter den här tidsperioden rensas resultaten och är inte längre tillgängliga för hämtning.
När du skickar data till konversations-PII kan du skicka en konversation (chatt eller talat) per begäran.
API:et försöker identifiera alla definierade entitetskategorier för en viss konversationsinmatning. Om du vill ange vilka entiteter som ska identifieras och returneras använder du den valfria piiCategories
parametern med lämpliga entitetskategorier.
För talade avskrifter returneras de identifierade entiteterna för det redactionSource
angivna parametervärdet. För närvarande är de värden som stöds för redactionSource
, lexical
, itn
och maskedItn
(som mappar till Speech to text REST API:ets display
\displayText
format , itn
lexical
respektive maskedItn
).text
För talade avskriftsindata tillhandahåller detta API dessutom information om ljudtidsinställningar för att underlätta ljudredigering. Om du vill använda funktionen audioRedaction använder du den valfria includeAudioRedaction
flaggan med true
värde. Ljudredigeringen utförs baserat på det lexikala indataformatet.
Anteckning
Konversations-PII stöder nu 40 000 tecken som dokumentstorlek.
Hämta PII-resultat
När du får resultat från PII-identifiering kan du strömma resultatet till ett program eller spara utdata till en fil i det lokala systemet. API-svaret innehåller identifierade entiteter, inklusive deras kategorier och underkategorier, samt förtroendepoäng. Textsträngen med PII-entiteterna som redigeras returneras också.
Exempel
Gå till resursöversiktssidan i Azure Portal
På menyn till vänster väljer du Nycklar och slutpunkt. Du behöver en av nycklarna och slutpunkten för att autentisera dina API-begäranden.
Ladda ned och installera klientbibliotekspaketet för valfritt språk:
Språk Paketversion .NET 1.0.0 Python 1.0.0 Mer information om klienten och returobjekt finns i följande referensdokumentation:
Tjänst- och datagränser
Information om storleken och antalet begäranden som du kan skicka per minut och sekund finns i artikeln om tjänstbegränsningar .
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för