למד אודות סוגי מידע רגישים

זיהוי וסווג של פריטים רגישים שנמצאים תחת בקרת הארגונים שלך הוא השלב הראשון בתחום Information Protection שלך. Microsoft Purview מספק שלוש דרכים לזיהוי פריטים כדי שניתן יהיה לסווג אותם:

  • באופן ידני על-ידי משתמשים
  • זיהוי אוטומטי של תבניות, כגון סוגי מידע רגיש
  • למידת מכונה

סוגי מידע רגיש (SIT) הם מסווגים מבוססי דפוס. הם מזהים מידע רגיש כגון מספרי ביטוח לאומי, כרטיס אשראי או חשבון בנק כדי לזהות פריטים רגישים, ראה הגדרות ישות מסוגי מידע רגיש לקבלת רשימה מלאה של כל כרטיסי ה- SIM.

Microsoft מספקת מספר רב של כרטיסי SIM מוגדרים מראש או שתוכל ליצור כרטיסי SIM משלך.

סוגי מידע רגיש נמצאים בשימוש ב-

קטגוריות של סוגי מידע רגיש

סוגי מידע רגיש מוכללים

כרטיסי SIM אלה נוצרים על-ידי Microsoft מופיעים במסוף התאימות כברירת מחדל. לא ניתן לערוך כרטיסי SIM אלה, אך ניתן להשתמש בהם כתבניות ולהעתקה כדי ליצור סוגי מידע רגישים מותאמים אישית. ראה הגדרות ישות של סוג מידע רגיש עבור רישום מלא של כל כרטיסי ה- SIM.

סוגי מידע רגישים לישות בעלי שם

כרטיסי SIM בעלי שם של ישות מופיעים גם במסוף התאימות כברירת מחדל. הם מזהים שמות אנשים, כתובות פיזיות ותנאים והתניות רפואיים. לא ניתן לערוך או להעתיק אותם. לקבלת מידע נוסף, ראה מידע נוסף אודות ישויות בעלות שם. כרטיסי SIM בעלי שם של ישות מגיעים בשני סוגים:

לא כרוכה

רכיבי SIT אלה בעלי שם ישות כוללים מוקד צר יותר, כגון מדינה אחת או מחלקה אחת של מונחים. השתמש בהם כאשר אתה זקוק למדיניות DLP עם טווח זיהוי צר יותר. ראה דוגמאות ל- SITs של ישות בעלת שם.

ארוזות

כרטיסי SIM של ישות בחבילה מזהים את כל ההתאמות האפשריות בכיתה, כגון כל הכתובות הפיזיות. השתמש בהם כקריטריונים נרחבים במדיניות DLP שלך כדי לזהות פריטים רגישים. ראה דוגמאות ל- SITs של ישות בעלת שם.

סוגי מידע רגיש מותאמים אישית

אם סוגי המידע הרגיש שתצורתם נקבעה מראש אינם עומדים בצרכים שלך, באפשרותך ליצור סוגי מידע רגיש מותאמים אישית משלך שאתה מגדיר באופן מלא, או להעתיק אחד מסוגי המידע המוכללים ולשנות אותם. ראה יצירת סוג מידע רגיש מותאם אישית במרכז התאימות לקבלת מידע נוסף.

נתונים מדויקים תואמים לסוגי מידע רגישים

כל כרטיסי ה- SIM המבוססים על EDM נוצרים מאפס. השתמש בהם כדי לזהות פריטים בעלי ערכים מדויקים שאתה מגדיר במסד נתונים של מידע רגיש. לקבלת מידע נוסף, ראה מידע על סוגי מידע רגישים המבוססים על התאמת נתונים מדויקת.

חלקים בסיסיים מסוג מידע רגיש

כל ישות של סוג מידע רגיש מוגדרת על-ידי שדות אלה:

  • name: כיצד סוג המידע הרגיש נקרא
  • תיאור: מתאר מה סוג המידע הרגיש מחפש
  • תבנית: תבנית מגדירה איזה סוג מידע רגיש מזהה. הוא מורכב מהרכיבים הבאים.
    • רכיב ראשי – הרכיב הראשי שסוג המידע הרגיש מחפש. הוא יכול להיות ביטוי רגיל עם או ללא אימות בדיקת סיכום, רשימת מילות מפתח, מילון מילות מפתח או פונקציה.
    • רכיב תומך – רכיבים התומכים בראיות שמסייעות בהגדלת הביטחון של ההתאמה. לדוגמה, מילת מפתח "SSN" בקירבה למספר SSN. הוא יכול להיות ביטוי רגיל עם או בלי אימות בדיקת סיכום, רשימת מילות מפתח ומילון מילות מפתח.
    • רמת ביטחון - רמות ביטחון (גבוהה, בינונית, נמוכה) משקפות את כמות הראיות התומכות שזוהו יחד עם הרכיב הראשי. כמה שפריט מכיל ראיות תומכות יותר, כך רמת הביטחון שפריט תואם מכילה את המידע הרגיש שאתה מחפש.
    • קירבה – מספר התווים בין רכיב ראשי ותומך.

דיאגרמה של ראיות מתאם וחלון קירבה.

קבל מידע נוסף על רמות מהימנות בסרטון וידאו קצר זה.

סוג מידע רגיש לדוגמה

מספר זהות לאומית בארגנטינה (DNI)

פורמט

שמונה ספרות מופרדות באמצעות נקודות

תבנית

שמונה ספרות:

  • שתי ספרות
  • תקופה
  • שלוש ספרות
  • תקופה
  • שלוש ספרות

בדיקת סיכום

לא

הגדרה

למדיניות DLP יש רמת ודאות בינונית שמזוהה בסוג זה של מידע רגיש אם היא במסגרת של כ- של 300 תווים:

  • הביטוי הרגיל Regex_argentina_national_id מחפש תוכן התואם לתבנית.
  • מילת מפתח Keyword_argentina_national_id נמצאה.
<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
      <IdMatch idRef="Regex_argentina_national_id"/>
      <Match idRef="Keyword_argentina_national_id"/>
  </Pattern>
</Entity>

מילות מפתח

Keyword_argentina_national_id

  • מספר זהות לאומית בארגנטינה
  • זהות
  • תעודת זהות לאומית של זיהוי
  • DNI
  • רישום אנשים לאומי של NIC
  • Documento Nacional de Identidad
  • Registro Nacional de las Personas
  • מזהה זהה
  • מזההcación

מידע נוסף על רמות סמך

בהגדרת ישות מסוג מידע רגיש, רמת הביטחון משקפת את כמות הראיות התומכות שזוהו בנוסף לרכיב הראשי. כמה שפריט מכיל ראיות תומכות יותר, כך רמת הביטחון שפריט תואם מכילה את המידע הרגיש שאתה מחפש. לדוגמה, התאמות ברמת מהימנות גבוהה יכילו ראיות תומכות יותר בקרבה לרכיב הראשי, בעוד התאמות עם רמת ביטחון נמוכה לא יכילו ראיות תומכות בקרבת מקום.

רמת מהימנות גבוהה מחזירה את המספר הנמוך ביותר של תוצאות חיוביות מוטעות, אך עשויה לגרום לת שליליים מוטעים נוספים. רמות מהימנות נמוכה או בינונית מחזירות תוצאות חיוביות מוטעות יותר, אך מעט עד אפס תוצאות שליליות מוטעות.

  • רמת מהימנות נמוכה: פריטים תואמים יכילו את מספר השליליות המוערך הקטן ביותר, אך את תוצאה חיובית מוטעית ביותר. רמת מהימנות נמוכה מחזירה התאמות נמוכות, בינוניות ותאמות מהימנות גבוהה. רמת הביטחון הנמוכה כוללת ערך של 65.
  • מהימנות בינונית: פריטים תואמים יכילו כמות ממוצעת של תוצאות חיוביות מוטעות ושליליות מוטעות. מהימנות בינונית מחזירה את כל ההתאמות בגודל בינוני ובביטחון גבוה. רמת הביטחון בינונית כוללת ערך של 75.
  • מהימנות גבוהה: פריטים תואמים יכילו את הכי פחות תוצאות חיוביות מוטעות, אך את הת שליליות מוטעות ביותר. מהימנות גבוהה מחזירה התאמות במהימנות גבוהה בלבד ויש לה ערך של 85.

עליך להשתמש בדפוסים ברמת מהימנות גבוהה עם ספירות נמוכות, נניח חמש עד עשר, ודפוסי מהימנות נמוכה עם ספירות גבוהות יותר, נניח 20 ומעלה.

הערה

אם יש לך פריטי מדיניות קיימים או סוגי מידע רגישים מותאמים אישית (SITs) המוגדרים באמצעות רמות מהימנות מבוססות מספרים (יודעות גם הן ברמת דיוק), הן יותפו באופן אוטומטי לשלוש רמות הביטחון הדיסקרטיות; מהימנות נמוכה, מהימנות בינונית וביטחון גבוה, בממשק המשתמש של מרכז התאימות של Security @ .

  • כל פריטי המדיניות עם דיוק מינימלי או דפוסי SIT מותאמים אישית עם רמות סמך של בין 76 ל- 100 יותפו למהימנות גבוהה.
  • כל פריטי המדיניות עם דיוק מינימלי או תבניות SIT מותאמות אישית עם רמות סמך של בין 66 ל- 75 ינופו למהימנות בינונית.
  • כל פריטי המדיניות עם דיוק מינימלי או תבניות SIT מותאמות אישית עם רמות בטחון הקטנים מ- 65 או שוות לו ממופים לערך של רמת ביטחון נמוכה.

יצירת סוגי מידע רגישים מותאמים אישית

באפשרותך לבחור מבין כמה אפשרויות כדי ליצור סוגי מידע רגיש מותאמים אישית במרכז התאימות.

הערה

רמות מהימנות משופרות זמינות לשימוש מיידי בתוך שירותי מניעת אובדן נתונים של Microsoft Purview, הגנה על מידע, תאימות תקשורת, ניהול מחזור חיי נתונים וניהול רשומות. Information Protection תומך כעת בשפות של ערכת תווים של שני בתים עבור:

  • סינית (פשוטה)
  • סינית (מסורתית)
  • קוריאנית
  • יפנית

תמיכה זו זמינה עבור סוגי מידע רגיש. לקבלת מידע נוסף, ראה תמיכה בהגנה על מידע עבור ערכות תווים של שני בתים.

עצה

כדי לזהות תבניות המכילות תווים בסינית/יפנית ותארי בית יחיד או כדי לזהות דפוסים המכילים סינית/יפנית ואנגלית, הגדר שני וריאציות של מילת המפתח או ה- regex.

  • לדוגמה, כדי לזהות מילת מפתח כגון "机密的document", השתמש בשני וריאציות של מילת המפתח; אחד עם רווח בין הטקסט ביפנית ואנגלית לטקסט אחר ללא רווח בין הטקסט ביפנית לאנגלית. לכן, מילות המפתח שיש להוסיף ל- SIT צריכות להיות "机密的 document" ו- "机密的document". באופן דומה, כדי לזהות צירוף מילים "リクオリンピック2020", יש להשתמש בשני וריאציות; "リクオリンピック 2020" ו- "リクオリンピック2020".

יחד עם תווים בסינית/יפנית/כפולה בתים, אם רשימת מילות המפתח/צירופי המילים מכילה גם מילים שאינן בסינית/יפנית (כגון אנגלית בלבד), עליך ליצור שני מילונים/רשימות מילות מפתח. אחת עבור מילות מפתח המכילות תווי סינית/יפנית/שני בתים ותווים אחרים עבור אנגלית בלבד.

  • לדוגמה, אם ברצונך ליצור מילון/רשימה של מילת מפתח עם שלושה צירופי מילים "סודי ביותר", "機密性が高い" ו- "机密的document", עליך ליצור שתי רשימות מילות מפתח.
    1. סודי ביותר
    2. 機密性が高い, 机密的document ו- 机密的 document

בעת יצירת regex באמצעות מקף של שני בתים או תקופה של שני בתים, הקפד לברוח משני התווים, כגון אחד מהם, יבריחו מקף או נקודה ב- regex. הנה Regex לדוגמה לעיון:

(?<!\d)([4][0-9]{3}[\-?\-\t]*[0-9]{4}

אנו ממליצים להשתמש בהתאמה למחרוזת במקום בהתאמה בין מילים ברשימת מילות מפתח.

ספק משוב תואם/לא תואם לדיוק בסוגי מידע רגיש

באפשרותך להציג את מספר ההתאמות שיש ל- SIT בסוגי מידע רגיש ובסייר התוכן. באפשרותך גם לספק משוב לגבי התאמה או אי-התאמה של פריט באמצעות מנגנון 'לא התאם ', ולהשתמש במשוב זה כדי לכוונן את כרטיסי ה- SI שלך. ראה הגדלת דיוק סיווג (תצוגה מקדימה) לקבלת מידע נוסף.

לקבלת מידע נוסף

כדי ללמוד כיצד להשתמש בסוגי מידע רגיש כדי לציית לתקנות פרטיות של נתונים, ראה פריסת הגנה על מידע עבור תקנות פרטיות נתונים עם Microsoft 365 (aka.ms/m365dataprivacy).