Sdílet prostřednictvím


Detekovat a redigovat osobní identifikovatelné informace v konverzacích

Rozhraní API pro zpracování konverzací v Azure AI analyzuje zvukovou diskuzi, aby identifikovalo a redigovalo citlivé informace (PII) pomocí různých předdefinovaných kategorií. Toto rozhraní API funguje na přepisovaném textu (označovaného jako přepisy) i na chatech. V případě přepisů usnadňuje také redakci zvukových segmentů obsahujících PII poskytnutím informací o načasování těchto segmentů.

Určení způsobu zpracování dat (volitelné)

Určení modelu detekce PII

Ve výchozím nastavení tato funkce používá ve vstupu nejnovější dostupný model AI. Můžete také nakonfigurovat požadavky rozhraní API tak, aby používaly konkrétní verzi modelu.

Podpora jazyků

Další informace najdete na stránce podpory jazyka PII. Aktuálně konverzační model PII GA podporuje pouze anglický jazyk. Model Preview a rozhraní API podporují stejné jazyky seznamů jako ostatní jazykové služby.

Podpora oblastí

Konverzační rozhraní API PII podporuje všechny oblasti Azure podporované službou Language.

Odesílání dat

Vstup můžete odeslat do rozhraní API jako seznam položek konverzace. Analýza se provede po přijetí žádosti. Vzhledem k tomu, že rozhraní API je asynchronní, může dojít ke zpoždění mezi odesláním požadavku rozhraní API a příjmem výsledků. Informace o velikosti a počtu požadavků, které můžete odeslat za minutu a sekundu, najdete v následujících omezeních dat.

Při použití asynchronní funkce jsou výsledky rozhraní API k dispozici po dobu 24 hodin od doby, kdy se žádost ingestovala, a je uvedena v odpovědi. Po uplynutí tohoto časového období se výsledky vyprázdní a už nejsou k dispozici pro načtení.

Když odesíláte data do konverzačních PII, můžete na žádost odeslat jednu konverzaci (chat nebo mluvený hovor).

Rozhraní API se pokusí zjistit všechny definované kategorie entit pro daný vstup konverzace. Pokud chcete určit, které entity se detekují a vrátí, použijte volitelný piiCategories parametr s příslušnými kategoriemi entit.

U mluvených přepisů se zjištěné entity vrátí na zadanou hodnotu parametru redactionSource . V současné době jsou podporované hodnoty redactionSource, text, lexical, itn a maskedItn (které se mapují na příslušné formáty rozhraní REST API pro převod řeči na text: display\displayText, lexical, itn a maskedItn). Kromě toho pro mluvený vstup přepisu toto rozhraní API také poskytuje informace o časování zvuku, které umožňují redakci zvuku. Pro použití funkce audioRedaction použijte volitelný includeAudioRedaction příznak s true hodnotou. Redakce zvuku se provádí na základě lexikálního vstupního formátu.

Poznámka:

Konverzace PII nyní podporují velikost dokumentu až 40 000 znaků.

Získání výsledků osobních identifikačních údajů

Když z detekce PII získáte výsledky, můžete výsledky streamovat do aplikace nebo uložit výstup do souboru v místním systému. Odpověď rozhraní API zahrnuje rozpoznané entity, včetně jejich kategorií a podkategorií a skóre spolehlivosti. Textový řetězec s odstraněnými entitami PII je také vrácen.

Příklady

  1. Na webu Azure Portal přejděte na stránku přehledu prostředků.

  2. V nabídce na levé straně vyberte Klíče a koncový bod. K ověření požadavků rozhraní API potřebujete jeden z klíčů a koncový bod.

  3. Stáhněte a nainstalujte balíček klientské knihovny pro jazyk podle vašeho výběru:

    Jazyk Verze balíčku
    .NET 1.0.0
    Python 1.0.0
  4. Další informace o klientovi a návratovém objektu najdete v následující referenční dokumentaci:

Limity služeb a dat

Informace o velikosti a počtu požadavků, které můžete odeslat za minutu a sekundu, najdete v článku o omezeních služeb.