Lisätietoja arkaluonteisten tietojen tyypeistä

Organisaation hallinnassa olevien luottamuksellisten kohteiden tunnistaminen ja luokitteleminen on ensimmäinen vaihe Information Protection kurinalaisuudessa. Microsoft Purview tarjoaa kolme tapaa tunnistaa kohteet, jotta ne voidaan luokitella:

 • manuaalisesti käyttäjien toimesta
 • automatisoitu kuviontunnistus, kuten luottamukselliset tietotyypit
 • koneoppiminen

Luottamukselliset tietotyypit ovat kuviopohjaisia luokittajia. He tunnistavat arkaluonteisia tietoja, kuten sosiaaliturva-, luottokortti- tai pankkitilinumerot, arkaluontoisten kohteiden tunnistamiseksi. Saat kattavan luettelon kaikista SSIT:istä kohdasta Luottamuksellisten tietojen tyyppisten entiteettien määritykset .

Microsoft tarjoaa suuren määrän valmiiksi määritettyjä SIT-koodeja tai voit luoda itse.

Vihje

Jos et ole E5-asiakas, käytä 90 päivän Microsoft Purview -ratkaisujen kokeiluversiota ja tutustu siihen, miten muut Purview-ominaisuudet voivat auttaa organisaatiotasi hallitsemaan tietoturva- ja yhteensopivuustarpeita. Aloita nyt Microsoft Purview -yhteensopivuusportaali kokeilukeskuksesta. Lue lisätietoja rekisteröitymisestä ja kokeiluehdoista.

Luottamuksellisia tietotyyppejä käytetään kohteessa

Luottamuksellisten tietotyyppien luokat

Sisäiset luottamukselliset tietotyypit

Microsoft luo nämä SSIT:t, ja ne näkyvät oletusarvoisesti yhteensopivuuskonsolissa. Näitä SIT-malleja ei voi muokata, mutta voit käyttää niitä malleina kopioimalla ne mukautettujen luottamuksellisten tietotyyppien luomiseksi. Katso luottamuksellisten tietojen tyyppien entiteettimääritykset kaikkien SIT-tietojen täydellisestä luettelosta.

Nimetyn entiteetin luottamukselliset tietotyypit

Nimetyt entiteettien SSIT-tiedot näkyvät oletusarvoisesti myös yhteensopivuuskonsolissa. He tunnistavat henkilöiden nimet, fyysiset osoitteet ja lääketieteelliset ehdot. Niitä ei voi muokata tai kopioida. Katso lisätietoja kohdasta Lisätietoja nimetyistä entiteeteistä . Nimettyjä entiteettien SSIT-suodattimia on kahta tyyppiä:

niputtamaton

Näiden nimettyjen entiteettien SSIT-kohteissa painopiste on kapeampi, kuten yksi maa tai yksittäinen termiluokka. Käytä niitä, kun tarvitset DLP-käytännön, jolla on kapeampi tunnistusalue. Katso esimerkkejä nimetyn entiteetin SIT-kohteista.

Mukana

Niputetut nimetyt entiteetin SSIT-määritykset tunnistavat kaikki mahdolliset vastaavuudet luokassa, kuten Kaikki fyysiset osoitteet. Käytä niitä laajoina ehtoina luottamuksellisten kohteiden tunnistamisessa DLP-käytännöissäsi. Katso esimerkkejä nimetyn entiteetin SIT-kohteista.

Mukautetut luottamukselliset tietotyypit

Jos ennalta määritetyt luottamukselliset tietotyypit eivät vastaa tarpeitasi, voit luoda omia mukautettuja luottamuksellisia tietotyyppejä, jotka määrität kokonaan, tai voit kopioida jonkin valmiista tietotyypeistä ja muokata niitä. Lisätietoja on artikkelissa Luottamuksellisten tietotyyppien luominen yhteensopivuuskeskuksessa .

Tarkat tiedot vastaavat luottamuksellisia tietotyyppejä

Kaikki tarkat tietojen vastaavuus (EDM) -pohjaiset SSIT-tiedot luodaan alusta alkaen. Niiden avulla voit tunnistaa kohteita, joilla on tarkkoja arvoja, jotka määrität luottamuksellisten tietojen tietokannassa. Lisätietoja on artikkelissa Lisätietoja siitä, miten tarkat tiedot vastaavat luottamuksellisia tietotyyppejä .

Luottamuksellisen tietotyypin perusosat

Nämä kentät määrittävät jokaisen luottamuksellisen tietotyypin entiteetin:

 • Nimi: ilmaisee, miten luottamuksellisiin tietotyyppiin viitataan
 • Kuvaus: kuvaa, mitä luottamuksellista tietotyyppiä etsitään
 • Malli: Malli määrittää, mitä arkaluontoinen tietotyyppi havaitsee. Se koostuu seuraavista osista.
  • Ensisijainen elementti – luottamuksellisen tietotyypin etsimä pääelementti. Se voi olla säännöllinen lauseke tarkistussumman vahvistuksen kanssa tai ilman sitä, avainsanaluetteloa, avainsanasanastoa tai funktiota.
  • Tukielementti – elementti, joka toimii sitä tukevana todisteena, joka auttaa lisäämään ottelun luottamusta. Esimerkiksi avainsana "SSN" sosiaaliturvatunnuksen (SSN) lähellä. Se voi olla säännöllinen lauseke tarkistussumman vahvistuksen, avainsanaluettelon ja avainsanasanaston kanssa tai ilman sitä.
  • Luotettavuustaso - luottamustaso (korkea, keskitaso, alhainen) kuvaa sitä, kuinka paljon tukevaa näyttöä sekä ensisijaista elementtiä havaitaan. Mitä enemmän todisteita kohde sisältää, sitä luotettavampi on, että vastaava kohde sisältää etsimäsi luottamukselliset tiedot.
  • Proximity – ensisijaisten ja tukevien elementtien välissä olevien merkkien määrä.

Kaavio vahvistustodisteista ja läheisyysikkunasta.

Lisätietoja luotettavuustasoista on tässä lyhyessä videossa.

Esimerkki luottamuksellisista tietotyypeistä

Argentiinalainen henkilötunnus

Muotoilu

Kahdeksan numeroa pisteillä erotettuina

Kaava

Kahdeksan numeroa:

 • kaksi numeroa
 • kausi
 • kolme numeroa
 • kausi
 • kolme numeroa

Tarkistussumma

Ei

Määritelmä

DLP-käytäntö on kohtalaisen varma siitä, että se on havainnut tämän tyyppisiä arkaluonteisia tietoja, jos 300 merkin sisällä:

 • Säännönmukainen lauseke Regex_argentina_national_id löytää mallia vastaavan sisällön.
 • Keyword_argentina_national_id avainsana löytyy.
<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
  <Pattern confidenceLevel="75">
   <IdMatch idRef="Regex_argentina_national_id"/>
   <Match idRef="Keyword_argentina_national_id"/>
 </Pattern>
</Entity>

Avainsanat

Keyword_argentina_national_id

 • Argentiinan kansallinen henkilötunnus
 • Käyttäjätiedot
 • Kansallisen henkilökortin tunnistaminen
 • DNI
 • NIC, kansallinen henkilörekisteri
 • Documento Nacional de Identidad
 • Registro Nacional de las Personas
 • Identidad
 • Identificación

Lisätietoja luottamustasoilta

Luottamuksellisen tietotyypin entiteetin määrityksessä luotettavuustaso kuvastaa sitä, kuinka paljon tukevaa näyttöä ensisijaisen elementin lisäksi havaitaan. Mitä enemmän todisteita kohde sisältää, sitä luotettavampi on, että vastaava kohde sisältää etsimäsi luottamukselliset tiedot. Esimerkiksi osumat, joiden luotettavuustaso on korkea, sisältävät enemmän tukevia todisteita, jotka ovat lähellä ensisijaista elementtiä, kun taas osumat, joiden luotettavuustaso on alhainen, sisältävät vain vähän tai ei lainkaan näyttöä läheisyydestä.

Korkea luotettavuustaso palauttaa pienimmät false-positiiviset, mutta voi aiheuttaa enemmän false-negatiivisia tuloksia. Matalat tai keskisuuret luotettavuustasot palauttavat enemmän false-positiivisia mutta vain vähän tai nolla epätosi-negatiivisia.

 • alhainen luotettavuus: Vastaavat kohteet sisältävät vähiten false-negatiteetteja, mutta eniten false-positiivisia. Alhainen luotettavuus palauttaa kaikki alhaiset, keskitasoiset ja erittäin luotettavat osumat. Alhaisen luotettavuustason arvo on 65.
 • keskikokoinen luotettavuus: Vastaavat kohteet sisältävät keskiarvomäärän false-positiivisia ja false-negatiivisia. Keskitasoinen luotettavuus palauttaa kaikki keskikokoiset ja erittäin luotettavat vastaavuudet. Keskitason luotettavuustason arvo on 75.
 • korkea luotettavuus: Vastaavat kohteet sisältävät vähiten false-positiivisia arvoja, mutta eniten false-negatiteetteja. Korkea luotettavuus palauttaa vain erittäin luotettavat vastaavuudet, ja sen arvo on 85.

Sinun tulisi käyttää korkean luottamuksen tason malleja, joissa on alhainen määrä, esimerkiksi 5-10, ja alhaiset luottamusmallit, joissa on suurempia määriä, esimerkiksi 20 tai enemmän.

Huomautus

Jos sinulla on olemassa olevia käytäntöjä tai mukautettuja luottamuksellisia tietotyyppejä (SIT) määritettynä lukuihin perustuvilla luotettavuustasoilla (tunnetaan myös tarkkuudella), ne yhdistetään automaattisesti kolmeen erilliseen luotettavuustasoon. heikko luotettavuus, keskitasoinen luotettavuus ja korkea luotettavuus tietoturvakeskuksen käyttöliittymässä.

 • Kaikki käytännöt, joilla on pienin tarkkuus tai mukautetut SIT-mallit ja joiden luotettavuustaso on 76–100, yhdistetään erittäin luotettavaan tasoon.
 • Kaikki käytännöt, joilla on pienin tarkkuus tai mukautetut SIT-mallit ja joiden luotettavuustaso on 66–75, yhdistetään keskitason luotettavuuteen.
 • Kaikki käytännöt, joilla on pienin tarkkuus tai mukautetut SIT-mallit ja joiden luotettavuustaso on pienempi tai yhtä suuri kuin 65, yhdistetään alhaiseen luotettavuuteen.

Mukautettujen luottamuksellisten tietotyyppien luominen

Voit valita useista vaihtoehdoista mukautettujen luottamuksellisten tietotyyppien luomiseksi Yhteensopivuuskeskuksessa.

Huomautus

Parannetut luottamustasot ovat käytettävissä välittömästi Microsoft Purview -tietojen menetyksen estämispalveluissa, tietojen suojaamisessa, tietoliikenteen yhteensopivuuden, tietojen elinkaaren hallinnassa ja tietueiden hallinnassa. Information Protection tukee nyt kaksitavuisten merkistöjen kieliä seuraaville:

 • kiina (yksinkertaistettu)
 • kiina (perinteinen)
 • Korean
 • Japanese

Tämä tuki on saatavilla luottamuksellisille tietotyypeille. Lisätietoja on ohjeaiheessa Kaksitavuisten merkistöjen julkaisumuistiinpanojen tietojen suojaamisen tuki .

Vihje

Jos haluat tunnistaa kiinan/japanin merkkejä ja yksittäisiä tavumerkkejä sisältäviä kuvioita tai tunnistaa kiinan/japanin ja englannin sisältäviä kuvioita, määritä avainsanan tai rekisterin kaksi varianttia.

 • Jos haluat esimerkiksi tunnistaa avainsanan, kuten "机密的document", käytä avainsanan kahta varianttia; jossa on välilyönti japanin- ja englanninkielisen tekstin välissä ja toinen ilman välilyöntiä japanin- ja englanninkielisen tekstin välissä. Sit-komentoon lisättävän avainsanan tulee siis olla "机密的 asiakirja" ja "机密的document". Jos haluat myös tunnistaa lauseen "東京オリンピック2020", kannattaa käyttää kahta muunnelmaa; "東京オリンピック 2020" ja "東京オリンピック2020".

Jos avainsanojen tai lauseiden luettelo sisältää myös muita kuin kiinaa tai japania (esimerkiksi vain englanti), luo kaksi sanastoa tai avainsanaluetteloa. Yksi avainsanoille, jotka sisältävät kiinan-, japanin- ja kaksitavuisia merkkejä, ja toinen vain englanniksi -avainsanoille.

 • Jos esimerkiksi haluat luoda avainsanasanaston tai -luettelon, jossa on kolme ilmaisua "Erittäin luottamuksellinen", "機密性が高い" ja "机密的document", sinun tulee luoda kaksi avainsanaluetteloa.
  1. Erittäin luottamuksellinen
  2. 機密性が高い, 机密的document and 机密的 asiakirja

Kun luot rekisteriä käyttämällä kaksinkertaista tavuviivoja tai kaksinkertaista tavujaksoa, muista välttää molemmat merkit samalla tavalla kuin et käyttäisi yhdysmerkkiä tai pistettä rekisterissä. Tässä on mallirekisteri viitettä varten:

(?<!\d)([4][0-9]{3}[\-?\-\t]*[0-9]{4}

Suosittelemme, että käytät avainsanaluettelossa merkkijonovastaavuutta sanavastaavuus-sanan sijaan.

Anna vastaavuus/ ei vastaavuustarkkuuden palautetta luottamuksellisissa tietotyypeissä

Voit tarkastella SIT:n vastaavuuksien määrää luottamuksellisissa tietotyypeissä ja sisällönhallinnassa. Voit myös antaa palautetta siitä, onko kohde todella vastine vai ei, käyttämällä Match, Not a Match - palautemekanismia, ja käyttää tätä palautetta SIT-tietojen virittämiseen. Lisätietoja on kohdassa Luokittelun tarkkuuden parantaminen .

Lisätietoja

Jos haluat lisätietoja luottamuksellisten tietotyyppien käyttämisestä tietosuojamääräysten noudattamiseen, lue ohjeartikkeli Tietosuojamääräysten käyttöönotto Microsoft 365 :n (aka.ms/m365dataprivacy) avulla.