Mi a személyazonosításra alkalmas adatok (PII) észlelése az Azure AI-nyelven?
A PII-észlelés az Azure AI Language egyik funkciója, amely gépi tanulási és AI-algoritmusok gyűjteménye a felhőben az írott nyelvet használó intelligens alkalmazások fejlesztéséhez. A PII-észlelési funkció strukturálatlan szövegekben képes azonosítani, kategorizálni és újra kiosztani a bizalmas információkat. Például: telefonszámok, e-mail-címek és azonosítási formák. A PII beszélgetésekben való felhasználásának módja eltér a többi használati esetétől, és az erre a célra vonatkozó cikkek külön lettek elválasztva.
- A rövid útmutatók útmutatást adnak a szolgáltatásnak küldött kérések teljesítéséhez.
- Az útmutatók a szolgáltatás konkrétabb vagy testre szabottabb módon történő használatára vonatkozó utasításokat tartalmaznak.
- A fogalmi cikkek részletesen ismertetik a szolgáltatás funkcióit és funkcióit.
A PII két alakzatból áll:
- PII – strukturálatlan szövegen működik.
- Beszélgetési PII (előzetes verzió) – testre szabott modell, amely a beszélgetés átírásán dolgozik.
Jellemző munkafolyamat
A funkció használatához elemzés céljából adatokat kell küldenie, és kezelnie kell az alkalmazás API-kimenetét. Az elemzés az adott módon történik, az adatokon használt modell további testreszabása nélkül.
Hozzon létre egy Azure AI Language-erőforrást, amely hozzáférést biztosít az Azure AI Language által kínált funkciókhoz. Létrehoz egy jelszót (úgynevezett kulcsot) és egy végpont URL-címét, amelyet az API-kérések hitelesítéséhez fog használni.
Hozzon létre egy kérést a REST API vagy a C#, Java, JavaScript és Python ügyfélkódtár használatával. Aszinkron hívásokat kötegkérel is küldhet, hogy egyetlen hívásba egyesítse a több funkcióHOZ tartozó API-kéréseket.
Küldje el az adatokat tartalmazó kérést nyers strukturálatlan szövegként. A rendszer a kulcsot és a végpontot használja a hitelesítéshez.
A válasz streamelhető vagy helyileg is tárolható.
A PII-észlelés használatának első lépései
A PII-észlelés használatához nyers strukturálatlan szöveget kell küldenie elemzéshez, és kezelnie kell az api-kimenetet az alkalmazásban. Az elemzés az adott módon történik, és nincs testre szabva az adatokon használt modell. A PII-észlelés kétféleképpen használható:
Fejlesztési lehetőség | Leírás |
---|---|
Language Studio | A Language Studio egy webalapú platform, amely lehetővé teszi az entitások Azure-fiók nélküli szöveges példákkal és saját adatokkal való összekapcsolását a regisztráció során. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál. |
REST API vagy ügyfélkódtár (Azure SDK) | Integrálja a PII-észlelést az alkalmazásokba a REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával. További információt a PII-észlelési rövid útmutatóban talál. |
Referenciadokumentáció és kódminták
Ahogy ezt a funkciót használja az alkalmazásokban, tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:
Fejlesztési lehetőség / nyelv | Referenciadokumentáció | Példák |
---|---|---|
REST API | REST API-dokumentáció | |
C# | C#-dokumentáció | C#-minták |
Java | Java-dokumentáció | Java-minták |
JavaScript | A JavaScript dokumentációja | JavaScript-minták |
Python | Python-dokumentáció | Python-példák |
Felelősségteljes MI
Az AI-rendszerek nem csak a technológiát, hanem a felhasználókat is magukban foglalják, akik használni fogják, azokat, akiket érint, és a környezet, amelyben üzembe helyezik. Olvassa el a PII átláthatósági megjegyzését , amelyből megismerheti a felelősségteljes AI-használatot és üzembe helyezést a rendszerekben. További információért tekintse meg az alábbi cikkeket is:
- Átláthatósági megjegyzés az Azure AI-nyelvhez
- Integráció és felelős használat
- Adatok, adatvédelem és biztonság
Példaforgatókönyvek
- Bizalmassági címkék alkalmazása – A PII-szolgáltatás eredményei alapján például nyilvános bizalmassági címke alkalmazható olyan dokumentumokra, amelyekben nem észlelhető PII-entitás. Az amerikai címeket és telefonszámokat felismerő dokumentumok esetében előfordulhat, hogy bizalmas címkét használnak. Szigorúan bizalmas címke használható olyan dokumentumokhoz, amelyekben a banki útválasztási számok felismerhetők.
- A személyes adatok bizonyos kategóriáinak újbóli megadása szélesebb körben elérhető dokumentumokból – Ha például az ügyfél kapcsolattartási rekordjai elérhetők az első vonal ügyfélszolgálati képviselői számára, előfordulhat, hogy a vállalat a nevük mellett az ügyfélelőzmények verziójából is újra szeretné kiterjeszteni az ügyfél személyes adatait, hogy megőrizze az ügyfél személyes adatait.
- Személyes adatok újbóli megadása a tudattalan elfogultság csökkentése érdekében – Előfordulhat például, hogy a vállalat önéletrajz-felülvizsgálati folyamata során letiltják a nevet, a címet és a telefonszámot, hogy segítsenek csökkenteni a tudattalan nemet vagy más torzításokat.
- Cserélje le a személyes adatokat a gépi tanulás forrásadataiban a tisztességtelenség csökkentése érdekében – Ha például el szeretné távolítani azokat a neveket, amelyek nemet fedhetnek fel a gépi tanulási modellek betanításakor, a szolgáltatással azonosíthatja őket, és lecserélheti őket általános helyőrzőkre a modellbetanításhoz.
- Személyes adatok eltávolítása a call center átírásából – Például ha el szeretné távolítani az ügynök és az ügyfél között egy call center-forgatókönyvben előforduló neveket vagy egyéb PII-adatokat. A szolgáltatással azonosíthatja és eltávolíthatja őket.
- Adattisztítás adatelemzéshez – A PII segítségével az adatok készen állnak az adattudósok és mérnökök számára, hogy ezeket az adatokat a gépi tanulási modelljeik betanítására használhassák. Az adatok újbóli megadása annak biztosítása érdekében, hogy az ügyféladatok ne legyenek közzétéve.
Következő lépések
Az entitás-összekapcsolási funkció használatának két módja van:
- A Language Studio egy webalapú platform, amely lehetővé teszi, hogy kód írása nélkül kipróbáljon több Language Service-funkciót.
- A rest API-val és az ügyfélkódtár SDK-val történő kérések szolgáltatásba történő küldésére vonatkozó rövid útmutató .