Share via


Mi a személyazonosításra alkalmas adatok (PII) észlelése az Azure AI-nyelven?

A PII-észlelés az Azure AI Language egyik funkciója, amely gépi tanulási és AI-algoritmusok gyűjteménye a felhőben az írott nyelvet használó intelligens alkalmazások fejlesztéséhez. A PII-észlelési funkció képes azonosítani, kategorizálni és újrajelezni a strukturálatlan szövegek bizalmas információit. Például: telefonszámok, e-mail-címek és azonosítási formák. A PII beszélgetésekben való felhasználásának módja eltér a többi használati esetétől, és az erre a célra szolgáló cikkek külön-külön vannak.

  • A rövid útmutatók első lépések, amelyek végigvezetik a szolgáltatás kéréseinek teljesítésén.
  • Az útmutatók konkrétabb vagy testre szabottabb módon tartalmazzák a szolgáltatás használatára vonatkozó utasításokat.
  • Az elméleti cikkek részletesen ismertetik a szolgáltatás funkcióit és funkcióit.

A PII két alakzatból áll:

Jellemző munkafolyamat

A funkció használatához adatokat kell küldenie elemzéshez, és kezelnie kell az api-kimenetet az alkalmazásban. Az elemzés az adott módon történik, és nincs hozzá további testreszabás az adatokhoz használt modellhez.

  1. Hozzon létre egy Azure AI Language-erőforrást, amely hozzáférést biztosít az Azure AI Language által kínált funkciókhoz. Létrehoz egy jelszót (egy kulcsot) és egy végponti URL-címet, amelyet az API-kérések hitelesítéséhez használ.

  2. Hozzon létre egy kérést a REST API vagy a C#, Java, JavaScript és Python ügyfélkódtár használatával. Aszinkron hívásokat kötegkéréssel is küldhet, így több funkció API-kéréseit egyetlen hívásba egyesítheti.

  3. Küldje el a szöveges adatokat tartalmazó kérést. A rendszer a kulcsot és a végpontot használja a hitelesítéshez.

  4. A válasz streamelhető vagy helyileg is tárolható.

Natív dokumentumtámogatás

A natív dokumentumok az eredeti dokumentum, például a Microsoft Word (docx) vagy egy hordozható dokumentumfájl (pdf) létrehozásához használt fájlformátumra utalnak. A natív dokumentumok támogatása szükségtelenné teszi a szöveg előfeldolgozását az Azure AI Language erőforrás-képességeinek használata előtt. Jelenleg a piiEntityRecognition képességhez natív dokumentumtámogatás érhető el.

A PII jelenleg a következő natív dokumentumformátumokat támogatja:

Fájltípus Fájlkiterjesztés Leírás
Szöveges .txt Formázatlan szöveges dokumentum.
Adobe PDF .pdf Egy hordozható dokumentumfájl formázott dokumentuma.
Microsoft Word .docx Egy Microsoft Word-dokumentumfájl.

További információ: Natív dokumentumok használata nyelvfeldolgozáshoz

A PII-észlelés használatának első lépései

A PII-észlelés használatához szöveget kell küldenie az elemzéshez, és kezelnie kell az API-kimenetet az alkalmazásban. Az elemzés az adott módon történik, az adatokon használt modell testreszabása nélkül. A PII-észlelés kétféleképpen használható:

Fejlesztési lehetőség Leírás
Language Studio A Language Studio egy webes platform, amellyel azure-fiók nélkül próbálhatja ki a szöveges példákkal összekapcsolt entitásokat, valamint a regisztrációkor a saját adatait. További információt a Language Studio webhelyén vagy a Language Studio rövid útmutatójában talál.
REST API vagy ügyfélkódtár (Azure SDK) Integrálja a PII-észlelést az alkalmazásokba a REST API vagy a különböző nyelveken elérhető ügyfélkódtár használatával. További információkért tekintse meg a PII-észlelési rövid útmutatót.

Referenciadokumentáció és kódminták

Ahogy ezt a funkciót az alkalmazásokban használja, tekintse meg a következő referenciadokumentációt és -mintákat az Azure AI-nyelvhez:

Fejlesztési lehetőség / nyelv Referenciadokumentáció Példák
REST API REST API-dokumentáció
C# C#-dokumentáció C#-minták
Java Java-dokumentáció Java-minták
JavaScript A JavaScript dokumentációja JavaScript-minták
Python Python-dokumentáció Python-példák

Felelős AI

Az AI-rendszerek nem csak a technológiát, hanem az azt használó személyeket, az érintett személyeket és az üzembe helyezési környezetet is magukban foglalják. Olvassa el a PII átláthatósági megjegyzését, amelyből megismerheti a felelősségteljes MI-használatot és üzembe helyezést a rendszerekben. További információért tekintse át az alábbi cikkeket:

Példaforgatókönyvek

  • Bizalmassági címkék alkalmazása – Például a PII szolgáltatás eredményei alapján nyilvános bizalmassági címke alkalmazható olyan dokumentumokra, amelyekben nem észlelhető PII-entitás. Az olyan dokumentumok esetében, amelyekben az USA-beli címek és telefonszámok felismerhetők, bizalmas címkét alkalmazhatnak. Szigorúan bizalmas címke használható olyan dokumentumokhoz, amelyekben a banki útválasztási számok felismerhetők.
  • A szélesebb körben terjeszthető dokumentumokból származó személyes adatok bizonyos kategóriáinak újbóli megadása – Ha például az ügyfél kapcsolattartási rekordjai elérhetők az előtérbeli támogatási képviselők számára, a vállalat a név mellett az ügyfél előzményeiből is újra kiterjesztheti az ügyfél személyes adatait, hogy megőrizze az ügyfél személyes adatait.
  • Személyes adatok újbóli megadása a tudattalan elfogultság csökkentése érdekében – Például egy vállalat önéletrajz-felülvizsgálati folyamata során blokkolhatják a nevet, a címet és a telefonszámot, hogy segítsenek csökkenteni a nemi vagy egyéb torzításokat.
  • Cserélje le a személyes adatokat a gépi tanulás forrásadataiban a tisztességtelenség csökkentése érdekében – Ha például el szeretné távolítani azokat a neveket, amelyek a gépi tanulási modellek betanításakor nemet fedhetnek fel, a szolgáltatással azonosíthatja őket, és lecserélheti őket a modell betanítására szolgáló általános helyőrzőkre.
  • Személyes adatok eltávolítása a call center átírásából – Például ha el szeretné távolítani az ügynök és az ügyfél között egy call center-forgatókönyvben előforduló neveket vagy egyéb PII-adatokat. A szolgáltatással azonosíthatja és eltávolíthatja őket.
  • Adattisztítás adatelemzéshez – A PII segítségével az adatok készen állnak az adattudósok és mérnökök számára, hogy ezeket az adatokat gépi tanulási modelljeik betanítására használhassák. Az adatok újrakódolása annak érdekében, hogy az ügyféladatok ne legyenek közzétéve.

Következő lépések

Az entitás-összekapcsolási funkció használatának két módja van: