Informationen zur optischen Zeichenerkennung in Microsoft Purview

Artikel
08/03/2024

Das Scannen der optischen Zeichenerkennung (Optical Character Recognition, OCR) ermöglicht Microsoft Purview das Scannen von Inhalten in Bildern auf vertrauliche Informationen. Als optionales Feature wird die OCR-Überprüfung zuerst auf Mandantenebene aktiviert. Nach der Aktivierung wählen Sie die Speicherorte aus, an denen Sie Bilder überprüfen möchten. Die Bildüberprüfung ist für Exchange-, SharePoint-, OneDrive-, Teams-, Windows- und macOS-Geräte verfügbar. Nachdem die OCR-Einstellungen konfiguriert wurden, werden Ihre vorhandenen Richtlinien für die Verhinderung von Datenverlust (Data Loss Prevention, DLP), Datensatzverwaltung und Insider-Risikomanagement (IRM) auf Bilder und textbasierte Inhalte angewendet. Angenommen, Sie haben den Inhalt der DLP-Bedingung konfiguriert, der vertrauliche Informationen enthält und einen Datenklassifizierer wie den vertraulichen Informationstyp "Kreditkarte" (Sit) eingeschlossen hat. In diesem Fall sucht Microsoft Purview an allen ausgewählten Standorten nach Kreditkartennummern in Text und Bildern.

Der Ablauf auf einen Blick

Phase	Anforderungen
Phase 1: Erstellen eines Azure-Abonnements bei Bedarf	Wenn Ihre Organisation noch nicht über ein Azure-Abonnement mit nutzungsbasierter Bezahlung für Ihren Mandanten verfügt, muss Ihr globaler Administrator zunächst ein Azure-Konto erstellen.
Phase 2: Richten Sie die nutzungsbasierte Abrechnung ein, um OCR zu aktivieren.	Ihr globaler oder SharePoint-Administrator muss die Anweisungen unter Einrichten der Microsoft Syntex-Abrechnung in Azure befolgen, um ein Abonnement für OCR hinzuzufügen.
Phase 3: Konfigurieren von OCR-Scaneinstellungen	Der Complianceadministrator für Ihre Organisation konfiguriert die OCR-Einstellungen für Ihren Mandanten.

Phase 1: Voraussetzungen

Um die OCR-Überprüfung verwenden zu können, muss der globale Administrator Ihrer Organisation überprüfen, ob ein Azure-Abonnement mit nutzungsbasierter Bezahlung vorhanden ist. Andernfalls muss dies entsprechend den Anweisungen unter Erstellen Ihrer anfänglichen Azure-Abonnements eingerichtet werden.

Phase 2: Konfigurieren der Abrechnung

Wenn Sie OCR aktivieren, können alle Typen vertraulicher Informationen und trainierbaren Klassifizierer Zeichen erkennen, die sich in Bildern befinden.

Da es sich um ein optionales Feature handelt, muss Ihr globaler Administrator die abrechnungsbasierte Bezahlung einrichten, um OCR zu aktivieren. Informationen zum Hinzufügen eines Abonnements für OCR finden Sie in den Anweisungen unter Einrichten der Microsoft Syntex-Abrechnung in Azure .

Hinweis

Nachdem Abrechnungsinformationen in Microsoft Syntex eingegeben wurden, kann Ihr Complianceadministrator OCR in Microsoft Purview konfigurieren, ohne dass zusätzliche Setup- oder Lizenzierungsanforderungen erforderlich sind.

Preisinformationen zur nutzungsbasierten Bezahlung für OCR finden Sie auf der Seite Einrichten der Microsoft Syntex-Abrechnung in Azure .

Gebühren

Die Gebühr für die Verwendung von OCR beträgt 1,00 USD für alle 1.000 gescannten Elemente. Jedes gescannte Bild zählt als eine Transaktion. Dies bedeutet, dass eigenständige Bilder (JPEG, JPG, PNG, BMP oder TIFF) jeweils als einzelne Transaktion zählen. Dies bedeutet auch, dass jede Seite in einer PDF-Datei separat abgerechnet wird. Wenn eine PDF-Datei beispielsweise 10 Seiten enthält, zählt eine OCR-Überprüfung der PDF-Datei als 10 separate Scans.

Hinweis

Um Ihre OCR-Kosten zu senken, fallen Gebühren für die Überprüfung jedes eindeutigen Bilds nur einmal an.

Kleine Bilder, z. B. Logos und Signaturen, die per E-Mail über Microsoft Exchange gesendet werden, werden nur einmal pro eindeutigem Bild für alle Benutzer des Mandanten gescannt und abgerechnet. Für alle nachfolgenden Instanzen werden die Ergebnisse der vorherigen Überprüfung wiederverwendet.

Darüber hinaus kann jedes gescannte Bild ohne zusätzliche Kosten in einer beliebigen Anzahl von Richtlinien für die Verhinderung von Datenverlust, Insider-Risikomanagement, automatische Bezeichnung und Datensatzverwaltung verwendet werden.

Wichtig

Informationen zu den Adobe-Anforderungen für die Verwendung von Features zur Verhinderung von Datenverlust (Data Loss Prevention, DLP) von Microsoft Purview mit PDF-Dateien finden Sie in diesem Artikel von Adobe: Microsoft Purview Information Protection Support in Acrobat.

Befolgen Sie zum Anzeigen Ihrer Rechnung die Anweisungen unter Überwachen der nutzungsbasierten Nutzung von Microsoft Syntex.

Schätzen Ihrer Rechnung

Wenn Sie ocr zum ersten Mal verwenden, beschränken Sie die Nutzung auf nur wenige Personen und anwendbare Workloads. Nach kurzer Zeit können Sie Ihre Rechnung in Azure anzeigen und die Nutzungsstatistiken & Gebühren für jeden Tag anzeigen. Von dort aus können Sie die Kosten für Ihre gesamte Gruppe von Benutzern extrapolieren. Darüber hinaus können Sie das Tag "workload" in Azure Cost Management verwenden, um die Aufschlüsselung der Nutzung pro Workload anzuzeigen.

Phase 3: Konfigurieren Ihrer OCR-Einstellungen

Wechseln Sie im Microsoft Purview-Complianceportal zu Einstellungen.
Wählen Sie Optische Zeichenerkennung (OCR) aus, um Ihre OCR-Konfigurationseinstellungen einzugeben.
Wählen Sie die Speicherorte aus, an denen Sie Bilder überprüfen möchten.
Wählen Sie die Verteilergruppen aus, die von OCR-Überprüfungen eingeschlossen oder ausgeschlossen werden sollen.
Wählen Sie Fertig aus.

Unterstützte Standorte und Lösungen sind in der folgenden Tabelle aufgeführt.

Berechtigungen

Das Konto, das Sie zum Erstellen und Bereitstellen von Richtlinien verwenden, muss Mitglied einer dieser Rollengruppen sein.

Compliance-Administrator
Compliancedatenadministrator
Globaler Administrator
Informationsschutz
Information Protection-Administrator

Hinweis

Im Allgemeinen werden OCR-Einstellungen etwa eine Stunde nach dem Einschalten wirksam.
Informationen zur OCR-Funktionalität in Microsoft Purview Communication Compliance finden Sie unter Erstellen und Verwalten von Kommunikationskonformitätsrichtlinien.

Unterstützte Standorte und Lösungen

Standort	Unterstützte Lösungen
Exchange	Verhinderung von Datenverlust Informationsschutz: Richtlinien für automatische Bezeichnungen Datensatzverwaltung: Automatisches Anwenden von Aufbewahrungsbezeichnungsrichtlinien¹
SharePoint-Websites	Verhinderung von Datenverlust Insider-Risikomanagement² Datensatzverwaltung: Automatisches Anwenden von Aufbewahrungsbezeichnungsrichtlinien¹
OneDrive-Konten	Verhinderung von Datenverlust Datensatzverwaltung: Automatisches Anwenden von Aufbewahrungsbezeichnungsrichtlinien¹
Teams-Chat- und Teams-Kanalnachrichten	Verhinderung von Datenverlust Insider-Risikomanagement²
Geräte	Verhinderung von Datenverlust Insider-Risikomanagement²

¹ Unterstützt Schlüsselwörter und Typen vertraulicher Informationen.
² Berücksichtigt vertrauliche Informationstypen und trainierbare Klassifizierer, die in Bildern für die Risikobewertung vorhanden sind.

Welche Dateitypen werden unterstützt?

Diese Funktion unterstützt das Scannen von Bildern in den folgenden Dateitypen mit den angegebenen Anforderungen:

Unterstützte Dateitypen	Bildanforderungen
JPEG, JPG, PNG, BMP, TIFF und PDF (nur Bild)	Dateigrößen: Bilddateien dürfen für Exchange und Teams nicht größer als 20 MB sein. Für SharePoint-, OneDrive- und Windows- und macOS-Endpunkte beträgt die maximale Bilddateigröße 50 MB. Bildauflösung: Die Bildauflösung muss mindestens 50 x 50 Pixel und nicht größer als 16.000 x 16.000 px sein.

Wichtig

Nur Bilder, die nach der Aktivierung von OCR hochgeladen wurden, werden gescannt.
Sowohl eingehende E-Mails (E-Mails von Benutzern außerhalb der Organisation) als auch ausgehende E-Mails (von Benutzern innerhalb der Organisation gesendete E-Mails) unterliegen der OCR-Überprüfung. Um OCR-Überprüfungen nur auf ausgehende E-Mails zu beschränken, ändern Sie die OCR-Einstellungen vom Standardbereich Alle Verteilergruppen in die spezifischen Verteilergruppen, und geben Sie die internen Verteilergruppen an, die VON OCR überprüft werden sollen. Informationen zum Ändern dieser Konfiguration finden Sie unter Phase 3: Konfigurieren Ihrer OCR-Einstellungen.
Richtlinientipps zur Verhinderung von Datenverlust werden für Bilder in Exchange nicht unterstützt.
Wenn Sie einen Pfad in den Endpunkteinstellungen zur Verhinderung von Datenverlust ausschließen, überprüft OCR keine Bilder in diesen Ordnern.
Wenn OCR für Windows- und macOS-Geräte aktiviert ist, senden die Geräte Nachrichten zur Überprüfung an die Cloud. Das Standardbandbreitenlimit beträgt 1.024 MB daten pro Gerät und Tag. OCR beendet das Scannen von Bildern, sobald dieses tagesaktuelle Limit erreicht ist. Wenn Sie mit dem Scannen von Bildern fortfahren möchten, können Sie die Bandbreitengrenze erhöhen.

Welche Sprachen werden unterstützt?

OCR-Überprüfung unterstützt mehr als 150 Sprachen.

Zusammenfassung

Um OCR verwenden zu können, müssen Sie die nutzungsbasierte Abrechnung von Microsoft Syntex einrichten. (Sie müssen Microsoft Syntex nicht selbst einrichten.)
Das Konfigurieren von OCR erfolgt auf Mandantenebene, sodass OCR nach der Konfiguration für den gesamten Microsoft Purview-Stapel verfügbar ist.
Sie müssen keine separaten Datenklassifizierer für OCR erstellen. Nach der OCR-Konfiguration scannen vorhandene Typen vertraulicher Informationen, genaue Datenüberstimmungen auf vertraulichen Informationstypen, trainierbare Klassifizierer und Fingerabdruck-SITs Bilder sowie Dokumente und E-Mails.

Freigeben über

Informationen zur optischen Zeichenerkennung in Microsoft Purview

Der Ablauf auf einen Blick

Phase 1: Voraussetzungen

Phase 2: Konfigurieren der Abrechnung

Gebühren

Schätzen Ihrer Rechnung

Phase 3: Konfigurieren Ihrer OCR-Einstellungen

Berechtigungen

Unterstützte Standorte und Lösungen

Welche Dateitypen werden unterstützt?

Welche Sprachen werden unterstützt?

Zusammenfassung

Siehe auch

Feedback

Zusätzliche Ressourcen