Személyazonosításra alkalmas információk (PII) Észlelési kognitív képesség
A PII-észlelési képesség kinyeri a személyes adatokat egy bemeneti szövegből, és lehetővé teszi a maszkolást. Ez a képesség az Azure AI-nyelven biztosított észlelési modelleket használja.
Feljegyzés
Ez a képesség az Azure AI-szolgáltatásokhoz van kötve, és számlázható erőforrást igényel olyan tranzakciókhoz, amelyek indexelőnként naponta 20 dokumentumot meghaladóak. A beépített készségek végrehajtásáért a meglévő Azure AI-szolgáltatások használatalapú fizetéses díját számítjuk fel.
@odata.type
Microsoft.Skills.Text.PIIDetectionSkill
Adatkorlátok
A rekord maximális méretének 50 000 karakternek kell lennie a mért érték szerint String.Length
. A Szöveg felosztása jártasságot az adattömb-készítéshez használhatja. A legjobb eredmény érdekében állítsa az oldalhosszt 5000-re.
Képességparaméterek
A paraméterek megkülönböztetik a kis- és nagybetűket, és mindegyik nem kötelező.
Paraméter neve | Leírás |
---|---|
defaultLanguageCode |
(Nem kötelező) Azokra a dokumentumokra alkalmazandó nyelvi kód, amelyek nem adják meg explicit módon a nyelvet. Ha nincs megadva az alapértelmezett nyelvi kód, akkor az angol (en) az alapértelmezett nyelvkód. Tekintse meg a támogatott nyelvek teljes listáját. |
minimumPrecision |
0,0 és 1,0 közötti érték. Ha a megbízhatósági pontszám (a piiEntities kimenetben) alacsonyabb a beállított minimumPrecision értéknél, az entitás nem lesz visszaadva vagy maszkolva. Az alapértelmezett érték 0,0. |
maskingMode |
A bemeneti szövegben észlelt személyes adatok maszkolásának különböző módjait biztosító paraméter. A következő lehetőségek támogatottak:
|
maskingCharacter |
A szöveg maszkolásához használt karakter, ha a maskingMode paraméter értéke replace . A következő beállítás támogatott: * (alapértelmezett). Ez a paraméter csak akkor lehet null , ha maskingMode nincs beállítva replace . |
domain |
(Nem kötelező) Ha meg van adva sztringérték, a tartományt az entitáskategóriák egy részhalmazára állítja. A lehetséges értékek a következők: "phi" (csak bizalmas állapotinformációk észlelése), "none" . |
piiCategories |
(Nem kötelező) Ha meg szeretné adni, hogy mely entitásokat észleli és adja vissza, használja ezt az opcionális paramétert (sztringlistaként definiálva) a megfelelő entitáskategóriákkal. Ez a paraméter lehetővé teszi az olyan entitások észlelését is, amelyek alapértelmezés szerint nem engedélyezettek a dokumentum nyelvéhez. A teljes lista támogatott személyazonosításra alkalmas információ entitáskategóriáinak megtekintése. |
modelVersion |
(Nem kötelező) Meghatározza a modell azon verzióját, amelyet a személyazonosításra alkalmas információészlelés meghívásakor használni kell. Ha nincs megadva, alapértelmezés szerint a legújabb verzió lesz. Javasoljuk, hogy csak akkor adja meg ezt az értéket, ha szükséges. |
Készségbemenetek
Bemeneti név | Leírás |
---|---|
languageCode |
A rekordok nyelvét jelző sztring. Ha ez a paraméter nincs megadva, a rendszer az alapértelmezett nyelvi kódot használja a rekordok elemzéséhez. Tekintse meg a támogatott nyelvek teljes listáját. |
text |
Az elemezni kívánt szöveg. |
Képességkimenetek
Kimeneti név | Leírás |
---|---|
piiEntities |
Összetett típusok tömbje, amely a következő mezőket tartalmazza:
A teljes lista támogatott személyazonosításra alkalmas információ entitáskategóriáinak megtekintése. |
maskedText |
Ez a kimenet a függvénytől függően maskingMode változik. Ha maskingMode igen replace , akkor a kimenet a bemeneti szövegen végzett maszkolás sztringeredménye maskingMode , a leírásnak megfelelően. Ha maskingMode igen none , akkor nincs kimenet. |
Mintadefiníció
{
"@odata.type": "#Microsoft.Skills.Text.PIIDetectionSkill",
"defaultLanguageCode": "en",
"minimumPrecision": 0.5,
"maskingMode": "replace",
"maskingCharacter": "*",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "piiEntities"
},
{
"name": "maskedText"
}
]
}
Példabemenet
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Microsoft employee with ssn 859-98-0987 is using our awesome API's."
}
}
]
}
Példakimenet
{
"values": [
{
"recordId": "1",
"data" :
{
"piiEntities":[
{
"text":"859-98-0987",
"type":"U.S. Social Security Number (SSN)",
"subtype":"",
"offset":28,
"length":11,
"score":0.65
}
],
"maskedText": "Microsoft employee with ssn *********** is using our awesome API's."
}
}
]
}
A képesség kimenetében szereplő entitások által visszaadott eltolásokat közvetlenül a Language Service API-k adják vissza, ami azt jelenti, hogy ha azokat az eredeti sztringbe indexeli, a .NET StringInfo osztályát kell használnia a megfelelő tartalom kinyeréséhez. További információ: Többnyelvű és hangulatjelek támogatása a Nyelvi szolgáltatás funkcióiban.
Hibák és figyelmeztetések
Ha a dokumentum nyelvi kódja nem támogatott, a rendszer figyelmeztetést ad vissza, és nem nyer ki entitásokat. Ha a szöveg üres, a rendszer figyelmeztetést ad vissza. Ha a szöveg 50 000 karakternél nagyobb, a rendszer csak az első 50 000 karaktert elemzi, és figyelmeztetést ad ki.
Ha a képesség figyelmeztetést ad vissza, a kimenet maskedText
üres lehet, ami hatással lehet a kimenetre váró alsóbb rétegbeli készségekre. Ezért mindenképpen vizsgálja meg a hiányzó kimenettel kapcsolatos összes figyelmeztetést a készségkészlet definíciójának megírásakor.