Mi a személyazonosításra alkalmas adatok (PII) észlelése az Azure AI-nyelven?

A PII-észlelés az Azure AI Language egyik funkciója, amely gépi tanulási és AI-algoritmusok gyűjteménye a felhőben az írott nyelvet használó intelligens alkalmazások fejlesztéséhez. A PII-észlelési funkció strukturálatlan szövegekben képes azonosítani, kategorizálni és újra kiosztani a bizalmas információkat. Például: telefonszámok, e-mail-címek és azonosítási formák. A PII beszélgetésekben való felhasználásának módja eltér a többi használati esetétől, és az erre a célra vonatkozó cikkek külön lettek elválasztva.

  • A rövid útmutatók útmutatást adnak a szolgáltatásnak küldött kérések teljesítéséhez.
  • Az útmutatók a szolgáltatás konkrétabb vagy testre szabottabb módon történő használatára vonatkozó utasításokat tartalmaznak.
  • A fogalmi cikkek részletesen ismertetik a szolgáltatás funkcióit és funkcióit.

A PII két alakzatból áll:

Jellemző munkafolyamat

A funkció használatához elemzés céljából adatokat kell küldenie, és kezelnie kell az alkalmazás API-kimenetét. Az elemzés az adott módon történik, az adatokon használt modell további testreszabása nélkül.

  1. Hozzon létre egy Azure AI Language-erőforrást, amely hozzáférést biztosít az Azure AI Language által kínált funkciókhoz. Létrehoz egy jelszót (úgynevezett kulcsot) és egy végpont URL-címét, amelyet az API-kérések hitelesítéséhez fog használni.

  2. Hozzon létre egy kérést a REST API vagy a C#, Java, JavaScript és Python ügyfélkódtár használatával. Aszinkron hívásokat kötegkérel is küldhet, hogy egyetlen hívásba egyesítse a több funkcióHOZ tartozó API-kéréseket.

  3. Küldje el az adatokat tartalmazó kérést nyers strukturálatlan szövegként. A rendszer a kulcsot és a végpontot használja a hitelesítéshez.

  4. A válasz streamelhető vagy helyileg is tárolható.

A PII-észlelés használatának első lépései

A PII-észlelés használatához nyers strukturálatlan szöveget kell küldenie elemzéshez, és kezelnie kell az api-kimenetet az alkalmazásban. Az elemzés az adott módon történik, és nincs testre szabva az adatokon használt modell. A PII-észlelés kétféleképpen használható:

Fejlesztési lehetőség Leírás
Language Studio A Language Studio egy webalapú platform, amely lehetővé teszi az entitások Azure-fiók nélküli szöveges példákkal és saját adatokkal való összekapcsolását a regisztráció során. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál.
REST API vagy ügyfélkódtár (Azure SDK) Integrálja a PII-észlelést az alkalmazásokba a REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával. További információt a PII-észlelési rövid útmutatóban talál.

Referenciadokumentáció és kódminták

Ahogy ezt a funkciót használja az alkalmazásokban, tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:

Fejlesztési lehetőség / nyelv Referenciadokumentáció Példák
REST API REST API-dokumentáció
C# C#-dokumentáció C#-minták
Java Java-dokumentáció Java-minták
JavaScript A JavaScript dokumentációja JavaScript-minták
Python Python-dokumentáció Python-példák

Felelősségteljes MI

Az AI-rendszerek nem csak a technológiát, hanem a felhasználókat is magukban foglalják, akik használni fogják, azokat, akiket érint, és a környezet, amelyben üzembe helyezik. Olvassa el a PII átláthatósági megjegyzését , amelyből megismerheti a felelősségteljes AI-használatot és üzembe helyezést a rendszerekben. További információért tekintse meg az alábbi cikkeket is:

Példaforgatókönyvek

  • Bizalmassági címkék alkalmazása – A PII-szolgáltatás eredményei alapján például nyilvános bizalmassági címke alkalmazható olyan dokumentumokra, amelyekben nem észlelhető PII-entitás. Az amerikai címeket és telefonszámokat felismerő dokumentumok esetében előfordulhat, hogy bizalmas címkét használnak. Szigorúan bizalmas címke használható olyan dokumentumokhoz, amelyekben a banki útválasztási számok felismerhetők.
  • A személyes adatok bizonyos kategóriáinak újbóli megadása szélesebb körben elérhető dokumentumokból – Ha például az ügyfél kapcsolattartási rekordjai elérhetők az első vonal ügyfélszolgálati képviselői számára, előfordulhat, hogy a vállalat a nevük mellett az ügyfélelőzmények verziójából is újra szeretné kiterjeszteni az ügyfél személyes adatait, hogy megőrizze az ügyfél személyes adatait.
  • Személyes adatok újbóli megadása a tudattalan elfogultság csökkentése érdekében – Előfordulhat például, hogy a vállalat önéletrajz-felülvizsgálati folyamata során letiltják a nevet, a címet és a telefonszámot, hogy segítsenek csökkenteni a tudattalan nemet vagy más torzításokat.
  • Cserélje le a személyes adatokat a gépi tanulás forrásadataiban a tisztességtelenség csökkentése érdekében – Ha például el szeretné távolítani azokat a neveket, amelyek nemet fedhetnek fel a gépi tanulási modellek betanításakor, a szolgáltatással azonosíthatja őket, és lecserélheti őket általános helyőrzőkre a modellbetanításhoz.
  • Személyes adatok eltávolítása a call center átírásából – Például ha el szeretné távolítani az ügynök és az ügyfél között egy call center-forgatókönyvben előforduló neveket vagy egyéb PII-adatokat. A szolgáltatással azonosíthatja és eltávolíthatja őket.
  • Adattisztítás adatelemzéshez – A PII segítségével az adatok készen állnak az adattudósok és mérnökök számára, hogy ezeket az adatokat a gépi tanulási modelljeik betanítására használhassák. Az adatok újbóli megadása annak biztosítása érdekében, hogy az ügyféladatok ne legyenek közzétéve.

Következő lépések

Az entitás-összekapcsolási funkció használatának két módja van:

  • A Language Studio egy webalapú platform, amely lehetővé teszi, hogy kód írása nélkül kipróbáljon több Language Service-funkciót.
  • A rest API-val és az ügyfélkódtár SDK-val történő kérések szolgáltatásba történő küldésére vonatkozó rövid útmutató .