Erhöhen der Klassifizierergenauigkeit

Artikel
08/11/2023

Klassifizierer, z. B. Typen vertraulicher Informationen (SIT ) und trainierbare Klassifizierer, werden in verschiedenen Richtlinientypen verwendet, um vertrauliche Informationen zu identifizieren. Wie die meisten dieser Modelle identifizieren sie manchmal ein Element als vertraulich, was nicht der Fall ist. Oder sie identifizieren ein Element möglicherweise nicht als vertraulich, wenn es tatsächlich ist. Diese werden als falsch positive Ergebnisse und falsch negative Werte bezeichnet.

In diesem Artikel erfahren Sie, wie Sie überprüfen, ob Elemente, die von einer Klassifizierung abgeglichen werden, true positive (eine Übereinstimmung) oder falsch positive Ergebnisse (keine Übereinstimmung) sind, und wie Sie Feedback zu Übereinstimmung/keine Übereinstimmung bereitstellen. Sie können dieses Feedback verwenden, um Ihre Klassifizierer zu optimieren, um die Genauigkeit zu erhöhen. Sie können auch bearbeitete Versionen des Dokuments sowie das Feedback "Übereinstimmung, keine Übereinstimmung " an Microsoft senden, wenn Sie die Genauigkeit der von Microsoft bereitgestellten Klassifizierer erhöhen möchten.

Die Funktionen "Übereinstimmung", "Keine Übereinstimmung" und "Kontextzusammenfassung" sind verfügbar in:

Inhalts-Explorer – für SharePoint-Websites, OneDrive-Websites
Seite Mit vertraulichen Informationstypen übereinstimmende Elemente – für SharePoint-Websites, OneDrive-Websites
Seite "Trainable Classifier Matched Items" (Trainable Classifier Matched Items) – für SharePoint-Websites, OneDrive-Websites
Microsoft Purview Data Loss Prevention(DLP)-Seite "Warnungen" – für SharePoint-Websites, OneDrive und E-Mails in Exchange
Microsoft Threat Protection(MTP)-Warnungsseite – für SharePoint-Websites, OneDrive-Websites und E-Mails in Exchange

Die Kontextzusammenfassung ist verfügbar in:

Microsoft Purview Information Protection (MIP)-Simulation für die automatische Bezeichnung übereinstimmender Elemente – für SharePoint-Websites, OneDrive-Websites

Tipp

Wenn Sie kein E5-Kunde sind, verwenden Sie die 90-tägige Testversion von Microsoft Purview-Lösungen, um zu erfahren, wie zusätzliche Purview-Funktionen Ihre Organisation bei der Verwaltung von Datensicherheits- und Complianceanforderungen unterstützen können. Starten Sie jetzt im Testhub für Microsoft Purview-Complianceportal. Erfahren Sie mehr über Anmelde- und Testbedingungen.

Gilt für

Klassifizierer	Kontextzusammenfassung	Überarbeiteter Vorschaubereich	Übereinstimmung und keine Übereinstimmung
SITZEN	Ja	Ja	Ja
Benutzerdefinierte SIT	Ja	Nein	Ja
Fingerabdruck SIT	Nein	Nein	Ja
Genaue Daten match SIT	Nein*	Nein	Nein
Benannte Entitäten	Nein*	Nein	Nein
Überprüfung der Anmeldeinformationen	Nein*	Nein	Nein
Integrierte trainierbare Klassifizierer	Ja**	Ja	Ja
Benutzerdefinierte trainierbare Klassifizierung	Nein	Nein	Ja

* Diese Klassifizierer werden in der automatischen MIP-Bezeichnungssimulation übereinstimmende Elemente für SharePoint-Websites und OneDrive-Websites unterstützt.

** Liste der integrierten trainierbaren Klassifizierer und die kontextbezogene Zusammenfassung unterstützen.

Wichtig

Das Übereinstimmungs-/Nicht-Übereinstimmungsfeedback und die kontextbezogene Zusammenfassung unterstützen Elemente in: SharePoint-Websites & OneDrive-Websites – für Inhalts-Explorer, Typ vertraulicher Informationen und trainierbare Klassifizierer übereinstimmende Elemente, DLP-Warnungen und MTP-Warnungen. E-Mails in Exchange – für DLP-Warnungen und MTP-Warnungen. Die kontextbezogene Zusammenfassungsoberfläche unterstützt Elemente in: SharePoint-Websites und OneDrive-Websites – für übereinstimmende Elemente der MIP-Simulation

Lizenzierung und Abonnements

Informationen zu den relevanten Lizenzierungen und Abonnements finden Sie in den Lizenzierungsanforderungen für Datenanalysen: Übersicht & Content & Activity Explorer.

Bekannte Einschränkungen

Die kontextbezogene Zusammenfassung zeigt nur eine begrenzte Anzahl von Übereinstimmungen in einem bestimmten Element an, nicht alle Übereinstimmungen.
Die kontextbezogene Zusammenfassung und feedback-Erfahrung ist nur für Elemente verfügbar, die erstellt oder aktualisiert wurden, nachdem die Feedbackerfahrung für den Mandanten aktiviert wurde. Elemente, die vor der Aktivierung des Features klassifiziert wurden, verfügen möglicherweise nicht über die kontextbezogene Zusammenfassung und Feedbackerfahrung.

Bewerten der Übereinstimmungsgenauigkeit und Bereitstellen von Feedback

Die kontextbezogene Zusammenfassungsoberfläche, in der Sie angeben, ob ein übereinstimmende Element ein wahr positives (Übereinstimmung) oder ein falsch positives Element (keine Übereinstimmung) ist, ist an allen stellen, an denen es angezeigt wird, ähnlich.

Wichtig

Sie müssen bereits DLP-Richtlinien bereitgestellt haben, die entweder SITs oder trainierbare Klassifizierer für OneDrive-Websites, SharePoint-Websites oder Exchange-Postfächer verwenden. Außerdem müssen Elemente übereinstimmen, bevor elemente auf der Seite Kontextzusammenfassung angezeigt werden.

Verwenden von Content Explorer

In diesem Beispiel wird gezeigt, wie Sie die Registerkarte Kontextzusammenfassung verwenden, um Feedback zu geben.

Öffnen Sie die Seite Microsoft Purview-Complianceportal>Datenklassifizierung>Inhalts-Explorer.
Geben Sie unter Nach Bezeichnungen, Infotypen oder Kategorien filtern den Namen des SIT- oder trainierbaren Klassifizierers ein, auf den Sie Übereinstimmungen überprüfen möchten.
Wählen Sie sit aus.
Wählen Sie den Speicherort aus, und stellen Sie sicher, dass in der Spalte Dateien ein Wert ungleich 0 (null) vorhanden ist. (Die einzigen unterstützten Speicherorte sind SharePoint und OneDrive.)
Öffnen Sie den Ordner, und wählen Sie dann ein Dokument aus.
Wählen Sie den Link in der Spalte Vertraulicher Informationstyp für das Dokument aus, um zu sehen, welchen SITs das Element entspricht und welche Zuverlässigkeitsstufe vorliegt.
Wählen Sie Schließen aus.
Öffnen Sie ein Dokument, und wählen Sie die Registerkarte Kontextzusammenfassung aus.
Überprüfen Sie das Element, und bestätigen Sie, ob es eine Übereinstimmung ist.
Wenn es sich um eine Übereinstimmung handelt, wählen Sie Schließen aus. Sie sind fertig.
Wenn es sich nicht um eine Übereinstimmung handelt, wählen Sie Keine Übereinstimmung aus.
Wenn Sie einen Fehler machen und die falsche Option ausgewählt haben, wählen Sie Feedback zurückziehen neben Schließen aus. Dadurch wird das Element wieder in den Zustand Keine Übereinstimmung/übereinstimmung versetzt.
Überprüfen Sie das Element, und bearbeiten Oder bearbeiten Sie Text.
Wählen Sie Schließen aus.

Verwenden der Seite "Übereinstimmend mit vertraulichen Informationstypen"

Sie können auf die gleichen Feedbackmechanismen auf der Seite Typen vertraulicher Informationen zugreifen.

Öffnen Sie die Microsoft Purview-Complianceportal, und navigieren Sie zu Datenklassifizierung>Klassifizierer>Vertrauliche Informationstypen.
Geben Sie im Feld Suchen den Namen des SIT ein, dessen Genauigkeit Sie überprüfen möchten.
Öffnen Sie die SIT. Daraufhin wird die Registerkarte Übersicht angezeigt. Hier sehen Sie die Anzahl der Übereinstimmend-Elemente, die Anzahl der Elemente, die keine Übereinstimmung sind, und die Anzahl der Elemente mit Feedback.
Wählen Sie die Registerkarte Übereinstimmend Elemente aus.
Öffnen Sie den Ordner, und wählen Sie ein Dokument aus. Nur SharePoint und OneDrive werden hier unterstützt. Stellen Sie sicher, dass in der Spalte Dateien ein Wert ungleich 0 (null) vorhanden ist.
Wählen Sie den Link in der Spalte Vertraulicher Informationstyp für ein Element aus, um zu sehen, welche SITs dem Element und dem Konfidenzniveau entsprechen.
Wählen Sie Schließen aus.
Öffnen Sie ein Dokument, und wählen Sie dann die Registerkarte Kontextzusammenfassung aus .
Überprüfen Sie das Element, und überprüfen Sie, ob es sich um eine Übereinstimmung handelt.
Wenn es sich um eine Übereinstimmung handelt, wählen Sie Übereinstimmung und dann Schließen aus.
Wenn es sich nicht um eine Übereinstimmung handelt, wählen Sie **Keine Übereinstimmung **** aus.
Wenn Sie einen Fehler machen und die falsche Option auswählen, wählen Sie Feedback zurückziehen neben Schließen aus. Dadurch wird das Element wieder in den Zustand Keine Übereinstimmung/übereinstimmung versetzt.
Wählen Sie Schließen aus.

Verwenden der Seite "Trainable Classifier Matched Items" (Trainable Classifier Matched Items)

Öffnen Sie die Microsoft Purview-Complianceportal, und navigieren Sie zu Datenklassifizierungsklassifizierer >>Trainierbare Klassifizierer.
Wählen Sie den trainierbaren Klassifizierer aus, dessen Genauigkeit Sie überprüfen möchten.
Öffnen Sie den trainierbaren Klassifizierer. Daraufhin wird die Registerkarte Übersicht angezeigt. Hier sehen Sie die Anzahl der Übereinstimmend-Elemente, die Anzahl der Elemente, die keine Übereinstimmung sind, und die Anzahl der Elemente mit Feedback.
Wählen Sie die Registerkarte Übereinstimmend Elemente aus.
Öffnen Sie den Ordner, und öffnen Sie ein Dokument. Nur SharePoint und OneDrive werden hier unterstützt. Stellen Sie sicher, dass in der Spalte Dateien ein Wert ungleich 0 (null) vorhanden ist.
Öffnen Sie ein Dokument, und wählen Sie dann die Registerkarte Kontextzusammenfassung aus .
Überprüfen Sie das Element, und überprüfen Sie, ob es sich um eine Übereinstimmung handelt.
Wenn es sich um eine Übereinstimmung handelt, wählen Sie Übereinstimmung und dann Schließen aus.
Wenn es sich nicht um eine Übereinstimmung handelt, wählen Sie **Keine Übereinstimmung **** aus.
Wenn Sie einen Fehler machen und die falsche Option auswählen, wählen Sie Feedback zurückziehen neben Schließen aus. Dadurch wird das Element wieder in den Zustand Keine Übereinstimmung/übereinstimmung versetzt.
Wählen Sie Schließen aus.

Verwenden der Seite "Warnungen zur Verhinderung von Datenverlust"

Öffnen Sie die Microsoft Purview-Complianceportal, und navigieren Sie zur Seite Warnungen zur Verhinderung von> Datenverlust.
Wählen Sie eine Warnung aus.
Wählen Sie Details anzeigen aus.
Wählen Sie die Registerkarte Ereignisse aus.
Maximieren Sie die Registerkarte Details .
Überprüfen Sie das Element, und überprüfen Sie, ob es sich um eine Übereinstimmung handelt.
Wählen Sie Aktionen aus.
Wenn es sich um eine Übereinstimmung handelt, schließen Sie das Fenster. Sie sind fertig.
Wenn es sich nicht um eine Übereinstimmung handelt, wählen Sie Aktionen und dann Keine Übereinstimmung aus.
Überprüfen Sie das Element, und bearbeiten Oder bearbeiten Sie Text.
Schließen Sie das Fenster.

Verwenden des Feedbacks zum Optimieren Ihrer Klassifizierer

Wenn Ihre SITs oder trainierbaren Klassifizierer basierend auf dem Feedback zu viele falsch positive Ergebnisse zurückgeben, probieren Sie einige dieser Optionen aus, um sie zu verfeinern und ihre Genauigkeit zu erhöhen.

Trainierbare Klassifizierungsmerkmale

Verwenden Sie die Schritte unter Erneutes Trainieren eines Klassifizierers im Inhalts-Explorer , um die Genauigkeit eines trainierbaren Klassifizierers zu erhöhen.

Typen vertraulicher Informationen

Erhöhen Sie die Schwellenwerte für vertrauliche Informationstypen, die gefunden wurden, um den Schweregrad zu bestimmen. Es ist in Ordnung, verschiedene Schwellenwerte für einzelne Klassifizierer zu verwenden.
Verstehen sie Die Zuverlässigkeitsstufen und deren Definition. Versuchen Sie, ein niedriges Vertrauen mit hoher instance Anzahl oder ein höheres Konfidenzniveau mit einer niedrigen instance Anzahl zu verwenden.
Klonen und ändern Sie die integrierten SITs, um andere Bedingungen einzuschließen, z. B. das Vorhandensein von Schlüsselwörtern, eine strengere Wertabgleichung oder strengere Formatierungsanforderungen.
Ändern Sie eine benutzerdefinierte SIT, um bekannte Präfixe, Suffixe oder Muster auszuschließen. Beispielsweise kann eine benutzerdefinierte SIT zum Erkennen von Telefonnummern für jede E-Mail ausgelöst werden, wenn Ihre E-Mail-Signaturen oder Dokumentkopfzeilen Telefonnummern enthalten. Das Ausschließen der Telefonnummernsequenzen Ihrer organization von Ihrem benutzerdefinierten SIT kann verhindern, dass die Regel für jede E-Mail oder jedes Dokument ausgelöst wird.
Fügen Sie weitere wörterbuchbasierte SITs als Bedingungen ein, um die Übereinstimmungen auf die Elemente einzugrenzen, die über die relevanten Artikel sprechen. Beispielsweise kann eine Regel für den Abgleich von Patienten-Diagnose verbessert werden, indem das Vorhandensein von Wörtern wie Diagnose, Diagnose, Zustand, Symptom und Patient erforderlich ist.
Für benannte Entitäts-SITs wie Alle vollständigen Namen empfiehlt es sich, einen höheren instance Zählungsschwellenwert festzulegen, z. B. 10 oder 50. Wenn sowohl die Personennamen als auch die Sozialversicherungsnummern (SSNs) gemeinsam erkannt werden, ist es wahrscheinlicher, dass die SSNs wirklich SSNs sind, und wir verringern das Risiko, dass die Richtlinie nicht ausgelöst wird, weil zu wenige SSNs erkannt werden.