Weitere Informationen zu Typen vertraulicher Informationen

Das Identifizieren und Klassifizieren vertraulicher Elemente, die sich unter der Kontrolle Ihrer organization befinden, ist der erste Schritt in der disziplin Information Protection. Microsoft Purview bietet drei Möglichkeiten, Elemente zu identifizieren, damit sie klassifiziert werden können:

  • manuell nach Benutzern
  • Automatisierte Mustererkennung, z. B. typen vertraulicher Informationen
  • Maschinelles Lernen

Typen vertraulicher Informationen (SIT) sind musterbasierte Klassifizierer. Sie erkennen vertrauliche Informationen wie Sozialversicherungs-, Karte- oder Bankkontonummern, um vertrauliche Elemente zu identifizieren. Eine vollständige Liste aller SITs finden Sie unter Entitätsdefinitionen für vertrauliche Informationen.

Microsoft stellt eine große Anzahl von vorkonfigurierten SITs bereit, oder Sie können eigene erstellen.

Tipp

Wenn Sie kein E5-Kunde sind, verwenden Sie die 90-tägige Testversion von Microsoft Purview-Lösungen, um zu erfahren, wie zusätzliche Purview-Funktionen Ihre Organisation bei der Verwaltung von Datensicherheits- und Complianceanforderungen unterstützen können. Starten Sie jetzt im Testhub für Microsoft Purview-Complianceportal. Erfahren Sie mehr über Anmelde- und Testbedingungen.

Typen vertraulicher Informationen werden in verwendet.

Kategorien vertraulicher Informationstypen

Integrierte Typen vertraulicher Informationen

Diese SITs werden von Microsoft erstellt und werden standardmäßig in der Compliancekonsole angezeigt. Diese SITs können nicht bearbeitet werden, aber Sie können sie als Vorlagen verwenden, indem Sie sie kopieren, um benutzerdefinierte Typen vertraulicher Informationen zu erstellen. Eine vollständige Liste aller SITs finden Sie unter Entitätsdefinitionen vom Typ vertraulicher Informationen .

Typen vertraulicher Informationen zu benannten Entitäten

Benannte Entitäts-SITs werden standardmäßig auch in der Konformitätskonsole angezeigt. Sie erkennen Personennamen, physische Adressen und medizinische Geschäftsbedingungen. Sie können nicht bearbeitet oder kopiert werden. Weitere Informationen finden Sie unter Informationen zu benannten Entitäten . Benannte Entitäts-SITs gibt es in zwei Typen:

entbündelt

Diese benannten Entitäts-SITs haben einen engeren Fokus, z. B. ein einzelnes Land oder eine einzelne Klasse von Begriffen. Verwenden Sie sie, wenn Sie eine DLP-Richtlinie mit einem engeren Erkennungsbereich benötigen. Weitere Informationen finden Sie unter Beispiele für benannte Entitäts-SITs.

Gebündelt

Gebündelte benannte Entitäts-SITs erkennen alle möglichen Übereinstimmungen in einer Klasse, z. B. Alle physischen Adressen. Verwenden Sie sie als allgemeine Kriterien in Ihren DLP-Richtlinien zum Erkennen vertraulicher Elemente. Weitere Informationen finden Sie unter Beispiele für benannte Entitäts-SITs.

Benutzerdefinierten Typen vertraulicher Informationen

Wenn die vorkonfigurierten Typen vertraulicher Informationen Nicht Ihren Anforderungen entsprechen, können Sie eigene benutzerdefinierte Typen vertraulicher Informationen erstellen, die Sie vollständig definieren, oder Sie können einen der integrierten Typen kopieren und ändern. Weitere Informationen finden Sie unter Erstellen eines benutzerdefinierten vertraulichen Informationstyps im Compliance Center .

Genaue Daten stimmen mit vertraulichen Informationstypen überein

Alle EDM-basierten SITs (Exact Data Match) werden von Grund auf neu erstellt. Sie verwenden sie, um Elemente zu erkennen, die genaue Werte aufweisen, die Sie in einer Datenbank mit vertraulichen Informationen definieren. Weitere Informationen finden Sie unter Informationen zu genauen Datenüberstimmungen basierenden typen vertraulicher Informationen .

Grundlegende Teile eines Vertraulichen Informationstyps

Jede Entität vom Typ vertraulicher Informationen wird durch die folgenden Felder definiert:

  • Name: Gibt an, wie auf den Typ vertraulicher Informationen verwiesen wird.
  • Beschreibung: Beschreibt, wonach der Typ vertraulicher Informationen gesucht wird.
  • Muster: Ein Muster definiert, was ein vertraulicher Informationstyp erkennt. Sie besteht aus den folgenden Komponenten.
    • Primäres Element: das Standard Element, nach dem der Typ vertraulicher Informationen sucht. Dabei kann es sich um einen regulären Ausdruck mit oder ohne Prüfsummenüberprüfung, eine Schlüsselwort (keyword) Liste, ein Schlüsselwort (keyword) Wörterbuch oder eine Funktion handeln.
    • Unterstützendes Element – ein Element, das als unterstützende Beweise fungiert, die dazu beitragen, das Vertrauen der Übereinstimmung zu erhöhen. Beispielsweise Schlüsselwort (keyword) "SSN" in der Nähe einer Sozialversicherungsnummer (SSN). Es kann sich um einen regulären Ausdruck mit oder ohne Prüfsummenüberprüfung, Schlüsselwort (keyword) Liste Schlüsselwort (keyword) Wörterbuch handeln.
    • Konfidenzniveau: Konfidenzniveaus (hoch, mittel, niedrig) geben an, wie viele unterstützende Beweise zusammen mit dem primären Element erkannt werden. Je mehr unterstützende Beweise ein Element enthält, desto höher ist die Zuverlässigkeit, dass ein übereinstimmendes Element die vertraulichen Informationen enthält, nach denen Sie suchen.
    • Näherung : Die Anzahl der Zeichen zwischen dem primären und dem unterstützenden Element.

Diagramm des Bestätigungsbeweis- und Näherungsfensters.

Weitere Informationen zu Konfidenzniveaus finden Sie in diesem kurzen Video.

Beispieltyp vertraulicher Informationen

Argentinische nationale Identitätsnummer (DNI)

Format

Acht Ziffern, durch Punkte getrennt

Muster

Acht Ziffern:

  • Zwei Ziffern
  • ein Punkt
  • drei Ziffern
  • ein Punkt
  • Drei Ziffern

Prüfsumme

Nein

Definition

Eine DLP-Richtlinie hat mittleres Konfidenz, dass sie diese Art von vertraulichen Informationen erkannt hat, wenn im Umkreis von 300 Zeichen Folgendes gilt:

  • Der reguläre Ausdruck Regex_argentina_national_id inhalt findet, der dem Muster entspricht.
  • Es wird ein Schlüsselwort (keyword) aus Keyword_argentina_national_id gefunden.
<!-- Argentina National Identity (DNI) Number -->
<Entity id="eefbb00e-8282-433c-8620-8f1da3bffdb2" recommendedConfidence="75" patternsProximity="300">
   <Pattern confidenceLevel="75">
      <IdMatch idRef="Regex_argentina_national_id"/>
      <Match idRef="Keyword_argentina_national_id"/>
  </Pattern>
</Entity>

Schlüsselwörter

Keyword_argentina_national_id

  • Argentina National Identity number
  • Identität
  • Identifikation Nationaler Personalausweis
  • DNI
  • Nationales Personenregister der NIC
  • Documento Nacional de Identidad
  • Registro Nacional de las Personas
  • Identidad
  • Identificación

Mehr zu Konfidenzniveaus

In einer Entitätsdefinition des Typs vertraulicher Informationen gibt das Konfidenzniveau an, wie viele unterstützende Beweise zusätzlich zum primären Element erkannt werden. Je mehr unterstützende Beweise ein Element enthält, desto höher ist die Zuverlässigkeit, dass ein übereinstimmendes Element die vertraulichen Informationen enthält, nach denen Sie suchen. Beispielsweise enthalten Übereinstimmungen mit einem hohen Konfidenzniveau mehr unterstützende Beweise in unmittelbarer Nähe zum primären Element, während Übereinstimmungen mit einem niedrigen Konfidenzniveau wenig oder gar keine unterstützenden Beweise in unmittelbarer Nähe enthalten würden.

Ein hohes Konfidenzniveau gibt die wenigsten falsch positiven Ergebnisse zurück, kann jedoch zu mehr falsch negativen Ergebnissen führen. Niedrige oder mittlere Konfidenzstufen geben mehr falsch positive Ergebnisse zurück, aber nur wenige bis null falsch negative Ergebnisse.

  • niedrige Zuverlässigkeit: Übereinstimmend elemente enthalten die wenigsten falsch negativen, aber die meisten falsch positiven Ergebnisse. Niedrige Konfidenz gibt alle Übereinstimmungen mit niedriger, mittlerer und hoher Konfidenz zurück. Das niedrige Konfidenzniveau hat den Wert 65.
  • Mittlere Zuverlässigkeit: Übereinstimmend elemente enthalten eine durchschnittliche Anzahl falsch positiver und falsch negativer Ergebnisse. Mittlere Konfidenz gibt alle Übereinstimmungen mit mittlerem und hohem Konfidenz zurück. Das mittlere Konfidenzniveau hat einen Wert von 75.
  • hohe Zuverlässigkeit: Übereinstimmend elemente enthalten die wenigsten falsch positiven Ergebnisse, aber die meisten falsch negativen Ergebnisse. Hohe Zuverlässigkeit gibt nur Übereinstimmungen mit hoher Zuverlässigkeit zurück und hat den Wert 85.

Sie sollten Muster mit hohem Konfidenzniveau mit niedriger Anzahl( z. B. fünf bis zehn) und niedrige Konfidenzmuster mit höheren Anzahlen (z. B. 20 oder mehr) verwenden.

Hinweis

Wenn Sie vorhandene Richtlinien oder benutzerdefinierte Typen vertraulicher Informationen (SITs) mit zahlenbasierten Konfidenzstufen (auch als Genauigkeit bezeichnet) definiert haben, werden diese automatisch den drei diskreten Konfidenzstufen zugeordnet. niedriges Vertrauen, mittleres Vertrauen und hohe Zuverlässigkeit auf der Benutzeroberfläche des Security @ Compliance Center.

  • Alle Richtlinien mit minimaler Genauigkeit oder benutzerdefinierte SIT-Muster mit Konfidenzstufen zwischen 76 und 100 werden einer hohen Zuverlässigkeit zugeordnet.
  • Alle Richtlinien mit minimaler Genauigkeit oder benutzerdefinierte SIT-Muster mit Konfidenzstufen zwischen 66 und 75 werden einer mittleren Zuverlässigkeit zugeordnet.
  • Alle Richtlinien mit minimaler Genauigkeit oder benutzerdefinierten SIT-Mustern mit Einem Konfidenzniveau kleiner oder gleich 65 werden einer niedrigen Zuverlässigkeit zugeordnet.

Benutzerdefinierte Typen vertraulicher Informationen erstellen

Sie können aus mehreren Optionen wählen, um benutzerdefinierte Typen vertraulicher Informationen im Compliance Center zu erstellen.

Hinweis

Verbesserte Zuverlässigkeitsstufen sind für die sofortige Verwendung in Microsoft Purview-Diensten zur Verhinderung von Datenverlust, Informationsschutz, Kommunikationscompliance, Datenlebenszyklusverwaltung und Datensatzverwaltung verfügbar. Information Protection unterstützt jetzt Sprachen mit Doppelbytezeichensatz für:

  • Chinesisch (vereinfacht)
  • Chinesisch (traditionell)
  • Koreanisch
  • Japanisch

Diese Unterstützung ist für vertrauliche Informationstypen verfügbar. Weitere Informationen finden Sie in den Versionshinweisen zur Information Protection-Unterstützung für Doppelbytezeichensätze .

Tipp

Um Muster zu erkennen, die chinesische/japanische Zeichen und einzelne Bytezeichen enthalten, oder um Muster zu erkennen, die Chinesisch/Japanisch und Englisch enthalten, definieren Sie zwei Varianten des Schlüsselworts oder regulären Ausdrucks.

  • Verwenden Sie z. B. zwei Varianten des Schlüsselworts, um ein Schlüsselwort wie „机密的document“ zu erkennen; eine mit einem Leerzeichen zwischen dem japanischen und dem englischen Text und eine andere ohne Leerzeichen zwischen dem japanischen und dem englischen Text. Daher sollten die Schlüsselwörter, die in SIT hinzugefügt werden sollen, „机密的 document“ und „机密的document“ lauten. Ebenso sollten zwei Varianten verwendet werden, um den Ausdruck „東京オリンピック2020“ zu erkennen; „東京オリンピック 2020“ und „東京オリンピック2020“.

Wenn die Liste der Schlüsselwörter/Ausdrücke auch nicht chinesische/japanische Wörter enthält (für instance, nur Englisch), sollten Sie zwei Wörterbücher/Schlüsselwort (keyword)-Listen erstellen. Eines für Schlüsselwörter mit chinesischen/japanischen/doppelten Bytezeichen und ein weiteres für Nur-Englisch-Schlüsselwörter.

  • Wenn Sie beispielsweise ein Schlüsselwort (keyword) Wörterbuch/eine Liste mit den drei Ausdrücken "Streng vertraulich", "機密性が高い" und "机密的document" erstellen möchten, sollten Sie zwei Schlüsselwort (keyword)-Listen erstellen.
    1. Highly confidential
    2. 機密性が高い, 机密的document und 机密的 document

Stellen Sie beim Erstellen eines Regulären Ausdrucks mithilfe eines Doppelbytebindestrichs oder eines Doppeltbyte-Zeitraums sicher, dass beide Zeichen wie ein Bindestrich oder ein Punkt in einem Regex mit Escapezeichen versehen werden. Hier sehen Sie ein Beispiel für einen regulären Ausdruck als Referenz:

(?<!\d)([4][0-9]{3}[\-?\-\t]*[0-9]{4}

Es wird empfohlen, eine Zeichenfolgen-Übereinstimmung anstelle von Wort-Übereinstimmung in einer Schlüsselwort (keyword)-Liste zu verwenden.

Testen des Typs vertraulicher Informationen

Sie können die SIT testen, indem Sie eine Beispieldatei hochladen. Die Testergebnisse zeigen die Anzahl der Übereinstimmungen für jedes Konfidenzniveau an. Sie können integrierte SITs, benutzerdefinierte SITs, trainierbare Klassifizierer und genaue Datenversprechungen testen.

Testen des integrierten und benutzerdefinierten Vertraulichen Informationstyps

Testen der genauen Übereinstimmung von Daten mit vertraulichen Informationen

Bereitstellen von Feedback zur Übereinstimmungsgenauigkeit/Nicht-Übereinstimmungsgenauigkeit in vertraulichen Informationstypen

Sie können die Anzahl der Übereinstimmungen eines SIT unter Typen vertraulicher Informationen und Inhalts-Explorer anzeigen. Sie können auch Feedback dazu geben, ob ein Element tatsächlich eine Übereinstimmung ist oder nicht, indem Sie den Feedbackmechanismus "Übereinstimmung, nicht übereinstimmen " verwenden und dieses Feedback verwenden, um Ihre SITs zu optimieren. Weitere Informationen finden Sie unter Erhöhen der Klassifizierungsgenauigkeit .

Weitere Informationen

Informationen zur Verwendung vertraulicher Informationstypen zur Einhaltung von Datenschutzbestimmungen finden Sie unter Bereitstellen von Datenschutzbestimmungen mit Microsoft 365 (aka.ms/m365dataprivacy).