Megosztás a következőn keresztül:


Személyazonosításra alkalmas információk (PII) Észlelési kognitív képesség

A PII-észlelési képesség kinyeri a személyes adatokat egy bemeneti szövegből, és lehetővé teszi a maszkolást. Ez a képesség az Azure AI-nyelven biztosított észlelési modelleket használja.

Feljegyzés

Ez a képesség az Azure AI-szolgáltatásokhoz van kötve, és számlázható erőforrást igényel olyan tranzakciókhoz, amelyek indexelőnként naponta 20 dokumentumot meghaladóak. A beépített készségek végrehajtásáért a meglévő Azure AI-szolgáltatások használatalapú fizetéses díját számítjuk fel.

@odata.type

Microsoft.Skills.Text.PIIDetectionSkill

Adatkorlátok

A rekord maximális méretének 50 000 karakternek kell lennie a mért érték szerint String.Length. A Szöveg felosztása jártasságot az adattömb-készítéshez használhatja. A legjobb eredmény érdekében állítsa az oldalhosszt 5000-re.

Képességparaméterek

A paraméterek megkülönböztetik a kis- és nagybetűket, és mindegyik nem kötelező.

Paraméter neve Leírás
defaultLanguageCode (Nem kötelező) Azokra a dokumentumokra alkalmazandó nyelvi kód, amelyek nem adják meg explicit módon a nyelvet. Ha nincs megadva az alapértelmezett nyelvi kód, akkor az angol (en) az alapértelmezett nyelvkód.
Tekintse meg a támogatott nyelvek teljes listáját.
minimumPrecision 0,0 és 1,0 közötti érték. Ha a megbízhatósági pontszám (a piiEntities kimenetben) alacsonyabb a beállított minimumPrecision értéknél, az entitás nem lesz visszaadva vagy maszkolva. Az alapértelmezett érték 0,0.
maskingMode A bemeneti szövegben észlelt személyes adatok maszkolásának különböző módjait biztosító paraméter. A következő lehetőségek támogatottak:
  • "none" (alapértelmezett): Nem történik maszkolás, és a maskedText kimenet nem lesz visszaadva.
  • "replace": Az észlelt entitásokat lecseréli a paraméterben maskingCharacter megadott karakterre. A karakter az észlelt entitás hosszáig ismétlődik, így az eltolások helyesen felelnek meg a bemeneti szövegnek és a kimenetnek maskedTextis.
maskingCharacter A szöveg maszkolásához használt karakter, ha a maskingMode paraméter értéke replace. A következő beállítás támogatott: * (alapértelmezett). Ez a paraméter csak akkor lehet null , ha maskingMode nincs beállítva replace.
domain (Nem kötelező) Ha meg van adva sztringérték, a tartományt az entitáskategóriák egy részhalmazára állítja. A lehetséges értékek a következők: "phi" (csak bizalmas állapotinformációk észlelése), "none".
piiCategories (Nem kötelező) Ha meg szeretné adni, hogy mely entitásokat észleli és adja vissza, használja ezt az opcionális paramétert (sztringlistaként definiálva) a megfelelő entitáskategóriákkal. Ez a paraméter lehetővé teszi az olyan entitások észlelését is, amelyek alapértelmezés szerint nem engedélyezettek a dokumentum nyelvéhez. A teljes lista támogatott személyazonosításra alkalmas információ entitáskategóriáinak megtekintése.
modelVersion (Nem kötelező) Meghatározza a modell azon verzióját, amelyet a személyazonosításra alkalmas információészlelés meghívásakor használni kell. Ha nincs megadva, alapértelmezés szerint a legújabb verzió lesz. Javasoljuk, hogy csak akkor adja meg ezt az értéket, ha szükséges.

Készségbemenetek

Bemeneti név Leírás
languageCode A rekordok nyelvét jelző sztring. Ha ez a paraméter nincs megadva, a rendszer az alapértelmezett nyelvi kódot használja a rekordok elemzéséhez.
Tekintse meg a támogatott nyelvek teljes listáját.
text Az elemezni kívánt szöveg.

Képességkimenetek

Kimeneti név Leírás
piiEntities Összetett típusok tömbje, amely a következő mezőket tartalmazza:
  • "text" (A kinyert tényleges, személyazonosításra alkalmas adatok)
  • "type"
  • "subType"
  • "score" (A magasabb érték azt jelenti, hogy valószínűbb, hogy valódi entitás)
  • "offset" (a bemeneti szövegbe)
  • "length"

A teljes lista támogatott személyazonosításra alkalmas információ entitáskategóriáinak megtekintése.
maskedText Ez a kimenet a függvénytől függően maskingModeváltozik. Ha maskingMode igen replace, akkor a kimenet a bemeneti szövegen végzett maszkolás sztringeredménye maskingMode, a leírásnak megfelelően. Ha maskingMode igen none, akkor nincs kimenet.

Mintadefiníció

  {
    "@odata.type": "#Microsoft.Skills.Text.PIIDetectionSkill",
    "defaultLanguageCode": "en",
    "minimumPrecision": 0.5,
    "maskingMode": "replace",
    "maskingCharacter": "*",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "piiEntities"
      },
      {
        "name": "maskedText"
      }
    ]
  }

Példabemenet

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft employee with ssn 859-98-0987 is using our awesome API's."
           }
      }
    ]
}

Példakimenet

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "piiEntities":[ 
           { 
              "text":"859-98-0987",
              "type":"U.S. Social Security Number (SSN)",
              "subtype":"",
              "offset":28,
              "length":11,
              "score":0.65
           }
        ],
        "maskedText": "Microsoft employee with ssn *********** is using our awesome API's."
      }
    }
  ]
}

A képesség kimenetében szereplő entitások által visszaadott eltolásokat közvetlenül a Language Service API-k adják vissza, ami azt jelenti, hogy ha azokat az eredeti sztringbe indexeli, a .NET StringInfo osztályát kell használnia a megfelelő tartalom kinyeréséhez. További információ: Többnyelvű és hangulatjelek támogatása a Nyelvi szolgáltatás funkcióiban.

Hibák és figyelmeztetések

Ha a dokumentum nyelvi kódja nem támogatott, a rendszer figyelmeztetést ad vissza, és nem nyer ki entitásokat. Ha a szöveg üres, a rendszer figyelmeztetést ad vissza. Ha a szöveg 50 000 karakternél nagyobb, a rendszer csak az első 50 000 karaktert elemzi, és figyelmeztetést ad ki.

Ha a képesség figyelmeztetést ad vissza, a kimenet maskedText üres lehet, ami hatással lehet a kimenetre váró alsóbb rétegbeli készségekre. Ezért mindenképpen vizsgálja meg a hiányzó kimenettel kapcsolatos összes figyelmeztetést a készségkészlet definíciójának megírásakor.

Lásd még