Tudnivalók a bizalmasadat-típusokról

Az Information Protection szemlélet első lépése a szervezet által felügyelt bizalmas elemek azonosítása és besorolása. A Microsoft Purview háromféleképpen azonosítja az elemeket, hogy besorolhatók legyenek:

  • felhasználók által manuálisan
  • automatizált mintafelismerés, például bizalmas információtípusok
  • gépi tanulás

A bizalmas információtípusok (SIT) mintaalapú osztályozók. Észlelik a bizalmas adatokat, például a társadalombiztosítást, a hitelkártyát vagy a bankszámlaszámokat a bizalmas elemek azonosításához. Az összes SIT teljes listájáért tekintse meg a Bizalmas információtípusok entitásdefinícióit .

A Microsoft számos előre konfigurált SIT-t biztosít, de saját SIT-t is létrehozhat.

A bizalmas információtípusok a következőben használatosak:

Bizalmas információtípusok kategóriái

Beépített bizalmasadat-típusok

Ezeket az SIT-ket a Microsoft hozza létre alapértelmezés szerint a megfelelőségi konzolon. Ezek az SIT-k nem szerkeszthetők, de sablonként használhatók, és átmásolhatók egyéni bizalmas információtípusok létrehozásához. Az összes SIT teljes listájáért lásd: Bizalmas információtípus entitásdefiníciók .

Nevesített entitás bizalmas információtípusai

A nevesített entitás-SIT-k alapértelmezés szerint a megfelelőségi konzolon is megjelennek. Észlelik a személyek nevét, a fizikai címeket, valamint az orvosi feltételeket és kikötéseket. Nem szerkeszthetők és nem másolhatók. További információt a nevesített entitásokról talál. A nevesített entitás-SIT-k két típusba sorolhatók:

kötegmentes

Ezek a nevesített entitás-SIT-k szűkebb fókuszba kerülnek, például egyetlen országra vagy egyetlen kifejezésosztályra. Akkor használja őket, ha szűkebb észlelési hatókörrel rendelkező DLP-szabályzatra van szüksége. Példák nevesített entitás-SIT-kre.

Köteg

A kötegelt nevesített entitás-SIT-k észlelik az osztály összes lehetséges egyezését, például az Összes fizikai címet. A bizalmas elemek észleléséhez használja őket a DLP-szabályzatokban széles körű feltételként. Példák nevesített entitás-SIT-kre.

Egyéni bizalmas információtípusok

Ha az előre konfigurált bizalmas információtípusok nem felelnek meg az igényeinek, létrehozhatja saját, teljes mértékben definiált egyéni bizalmasadat-típusait, vagy átmásolhatja az egyik beépített adattípust, és módosíthatja azt. További információ: Egyéni bizalmas információtípus létrehozása a Megfelelőségi központban .

A pontos adatok megfelelnek a bizalmas információtípusoknak

Minden EDM-alapú SIT az alapoktól jön létre. Ezekkel észlelheti azokat az elemeket, amelyek pontos értékekkel rendelkeznek, amelyeket bizalmas adatokat tartalmazó adatbázisban definiál. További információ: Pontos adatok egyeztetése bizalmas információtípusok alapján .

A bizalmas információtípusok alapvető részei

Minden bizalmas információtípus-entitást ezek a mezők határoznak meg:

  • name: a bizalmas információtípusra való utalás
  • description: leírja, hogy milyen bizalmas információtípust keres
  • minta: A minta határozza meg, hogy egy bizalmas információtípus mit észlel. A következő összetevőkből áll.
    • Elsődleges elem – A bizalmas információtípus által keresett fő elem. Ez lehet reguláris kifejezés ellenőrzőösszeg-ellenőrzéssel vagy anélkül, kulcsszólista, kulcsszószótár vagy függvény.
    • Támogató elem – Olyan elemek, amelyek alátámasztó bizonyítékként szolgálnak, amelyek elősegítik a mérkőzés megbízhatóságának növelését. Az "SSN" kulcsszó például egy SSN-szám közelében található. Ez lehet reguláris kifejezés ellenőrzőösszeg-ellenőrzéssel vagy anélkül, kulcsszólista, kulcsszószótár.
    • Megbízhatósági szint – A megbízhatósági szintek (magas, közepes, alacsony) azt tükrözik, hogy mennyi alátámasztó bizonyítékot észleltek az elsődleges elemmel együtt. Minél több alátámasztó bizonyítékot tartalmaz egy elem, annál nagyobb a megbízhatósága annak, hogy az egyező elemek tartalmazzák a keresett bizalmas adatokat.
    • Közelség – Az elsődleges és a segédelem közötti karakterek száma.

A korroboratív bizonyítékok és a közelségi ablak ábrája.

Ebből a rövid videóból többet is megtudhat a megbízhatósági szintekről.

Példa bizalmas információtípusra

Argentin személyi szám (DNI)

Formátum

Nyolc számjegy pontokkal elválasztva

Minta

Nyolc számjegy:

  • két számjegy
  • egy időszak
  • három számjegy
  • egy időszak
  • három számjegy

Ellenőrzőösszeg

Nem

Definíció

A DLP-házirend közepes megbízhatósági szinttel jelenti e bizalmas adat észlelését, ha 300 karakteren belül:

  • A reguláris kifejezés Regex_argentina_national_id a mintának megfelelő tartalmat talál.
  • A rendszer Keyword_argentina_national_id egy kulcsszót talál.
<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
      <IdMatch idRef="Regex_argentina_national_id"/>
      <Match idRef="Keyword_argentina_national_id"/>
  </Pattern>
</Entity>

Kulcsszavak:

Keyword_argentina_national_id

  • Argentína nemzeti személyazonosító száma
  • Identitás
  • Azonosító nemzeti személyazonosító igazolvány
  • DNI
  • A hálózati adapter nemzeti nyilvántartása
  • Documento Nacional de Identidad
  • Registro Nacional de las Personas
  • Identidad
  • Identificación

További információ a megbízhatósági szintekről

Bizalmas információtípusú entitásdefiníciók esetén a megbízhatósági szint azt tükrözi, hogy a rendszer az elsődleges elem mellett mennyi alátámasztó bizonyítékot észlel. Minél több alátámasztó bizonyítékot tartalmaz egy elem, annál nagyobb a megbízhatósága annak, hogy az egyező elemek tartalmazzák a keresett bizalmas adatokat. A magas megbízhatósági szinttel rendelkező egyezések például több alátámasztó bizonyítékot fognak tartalmazni az elsődleges elem közelében, míg az alacsony megbízhatósági szinttel rendelkező egyezések a közelségben alig vagy egyáltalán nem tartalmaznak alátámasztó bizonyítékokat.

A magas megbízhatósági szint a legkevesebb vakriasztást adja vissza, de több hamis negatívumot eredményezhet. Az alacsony vagy közepes megbízhatósági szint több hamis pozitívot ad vissza, de kevés-nulla hamis negatívot.

  • alacsony megbízhatóság: A megfeleltetés a legkevesebb hamis negatívot, de a legtöbb hamis pozitívot fogja tartalmazni. Az alacsony megbízhatóság visszaadja az összes alacsony, közepes és nagy megbízhatósági egyezést. Az alacsony megbízhatósági szint értéke 65.
  • közepes megbízhatóság: A megfeleltetett elemek átlagosan hamis pozitív és hamis negatív értékeket tartalmaznak. A közepes megbízhatóság visszaadja az összes közepes és a nagy megbízhatósági egyezést. A közepes megbízhatósági szint értéke 75.
  • nagy megbízhatóság: A megfeleltetett elemek a legkevesebb vakriasztást, de a legtöbb hamis negatívot tartalmazzák. A nagy megbízhatóság csak a nagy megbízhatósági egyezéseket adja vissza, és értéke 85.

Magas megbízhatósági szintű mintákat kell használnia alacsony darabszámmal, például öttől tízig, illetve alacsony megbízhatósági mintákat magasabb számmal, például 20-zal vagy többel.

Megjegyzés

Ha meglévő szabályzatokkal vagy egyéni bizalmas információtípusokkal (SIT-kkel) rendelkezik, amelyek számalapú megbízhatósági szintek (más néven pontosság) alapján vannak meghatározva, akkor azok automatikusan a három különálló megbízhatósági szinthez lesznek leképezve; alacsony megbízhatóság, közepes megbízhatóság és nagy megbízhatóság a Biztonság @ Megfelelőségi központ felhasználói felületén.

  • A minimális pontosságú szabályzatok és a 76 és 100 közötti megbízhatósági szintű egyéni SIT-minták nagy megbízhatóságra lesznek leképezve.
  • A minimális pontosságú szabályzatok és a 66 és 75 közötti megbízhatósági szintű egyéni SIT-minták közepes megbízhatóságra lesznek leképezve.
  • A minimális pontosságú szabályzatok vagy a 65-nél kisebb vagy azzal egyenlő megbízhatósági szintű egyéni SIT-minták alacsony megbízhatóságra lesznek leképezve.

Egyéni bizalmas információtípusok létrehozása

A Megfelelőségi központban számos lehetőség közül választhat az egyéni bizalmas információtípusok létrehozásához.

Megjegyzés

Továbbfejlesztett megbízhatósági szintek érhetők el azonnali használatra a Microsoft Purview adatveszteség-megelőzési szolgáltatásaiban, az információvédelemben, a kommunikációs megfelelőségben, az adatéletciklus-kezelésben és a rekordkezelésben. Information Protection mostantól támogatja a kétbájtos karakterkészlet nyelvét:

  • Kínai (egyszerűsített)
  • Kínai (hagyományos)
  • Korean
  • Japanese

Ez a támogatás bizalmas információtípusokhoz érhető el. További információt a kétbájtos karakterkészletek információvédelmi támogatása kibocsátási megjegyzéseiben talál.

Tipp

A kínai/japán karaktereket és egy bájtos karaktereket tartalmazó minták észleléséhez, illetve a kínai/japán és angol nyelvű minták észleléséhez definiálja a kulcsszó vagy a regex két változatát.

  • Ha például a "机密的document" kulcsszóhoz hasonló kulcsszót szeretne észlelni, használja a kulcsszó két változatát; az egyik a japán és az angol szöveg közötti szóközt, a másikat pedig a japán és az angol szöveg közötti szóköz nélkül. Tehát a SIT-ben hozzáadandó kulcsszavaknak a következőnek kell lenniük: "机密的 document" és "机密的document". A "東京オリンピック2020" kifejezés észleléséhez két változatot kell használni; "東京オリンピック 2020" és "東京オリンピック2020".

A kínai/japán/duplabájtos karakterek mellett, ha a kulcsszavak/kifejezések listája nem kínai/japán szavakat is tartalmaz (csak angolul), akkor két szótárat/kulcsszólistát kell létrehoznia. Az egyik a kínai/japán/duplabájtos karaktereket tartalmazó kulcsszavakhoz, a másik pedig csak angol nyelvhez használható.

  • Ha például létre szeretne hozni egy kulcsszószótárat/listát három "Szigorúan bizalmas", "機密性が高い" és "机密的document" kifejezéssel, akkor két kulcsszólistát kell létrehoznia.
    1. Szigorúan bizalmas
    2. 機密性が高い, 机密的document és 机密的 dokumentum

Amikor reguláris kifejezést hoz létre duplabájtos kötőjellel vagy duplabájtos ponttal, ügyeljen arra, hogy mindkét karaktert feloldja, például egy kötőjelet vagy egy reguláris pontot. Íme egy referenciaként szolgáló reguláris minta:

(?<!\d)([4][0-9]{3}[\-?\-\t]*[0-9]{4}

Azt javasoljuk, hogy a kulcsszólistában a szóegyezés helyett sztringegyezést használjon.

Egyezés/nem egyezés pontosságának visszajelzése bizalmas információtípusokban

Megtekintheti a SIT-ben található egyezések számát a Bizalmas információtípusok és a Tartalomkezelőben. Visszajelzést is küldhet arról, hogy egy elem valóban egyezés-e, vagy nem a Match, Not a Match visszajelzési mechanizmust használja, és ezzel a visszajelzéssel hangolhatja az SIT-ket. További információt az osztályozó pontosságának növelése (előzetes verzió) című témakörben talál.

További információ

Ha meg szeretné tudni, hogyan használhat bizalmas információtípusokat az adatvédelmi előírásoknak való megfeleléshez, olvassa el a Microsoft 365 adatvédelmi szabályzatainak adatvédelmi nyilatkozata (aka.ms/m365dataprivacy) című témakört.