Informationen zur optischen Zeichenerkennung in Microsoft Purview (Vorschau)
Das Scannen der optischen Zeichenerkennung (Optical Character Recognition, OCR) ermöglicht Microsoft Purview das Scannen von Inhalten in Bildern auf vertrauliche Informationen. Als optionales Feature wird die OCR-Überprüfung zuerst auf Mandantenebene aktiviert. Nach der Aktivierung wählen Sie die Speicherorte aus, an denen Sie Bilder überprüfen möchten. Die Bildüberprüfung ist für Exchange-, SharePoint-, OneDrive-, Teams- und Windows-Geräte verfügbar. Nachdem die OCR-Einstellungen konfiguriert wurden, werden Ihre vorhandenen Richtlinien für die Verhinderung von Datenverlust (Data Loss Prevention, DLP), Datensatzverwaltung und Insider-Risikomanagement (IRM) auf Bilder und textbasierte Inhalte angewendet. Angenommen, Sie haben den Inhalt der DLP-Bedingung konfiguriert, der vertrauliche Informationen enthält und einen Datenklassifizierer wie den vertraulichen Informationstyp "Kreditkarte" (Sit) eingeschlossen hat. In diesem Fall sucht Microsoft Purview an allen ausgewählten Stellen nach Guthaben Karte Zahlen in Text und Bildern.
Wichtig
Standardmäßig können Exchange und Teams für OCR konfiguriert werden. Um OCR für SharePoint, OneDrive und Geräte zu aktivieren, registrieren Sie sich hier.
Der Ablauf auf einen Blick
Phase | Anforderungen |
---|---|
Phase 1: Erstellen eines Azure-Abonnements bei Bedarf | Wenn Ihr organization noch nicht über ein Azure-Abonnement mit nutzungsbasierter Bezahlung für Ihren Mandanten verfügt, muss Ihr globaler Administrator zunächst ein Azure-Konto erstellen. |
Phase 2: Richten Sie die nutzungsbasierte Abrechnung ein, um OCR zu aktivieren. | Ihr globaler oder SharePoint-Administrator muss die Anweisungen unter Einrichten Microsoft Syntex Abrechnung in Azure befolgen, um ein Abonnement für OCR hinzuzufügen. |
Phase 3: Konfigurieren von OCR-Scaneinstellungen | Der Complianceadministrator für Ihre organization konfiguriert die OCR-Einstellungen für Ihren Mandanten. |
Phase 1: Voraussetzungen
Um die OCR-Überprüfung verwenden zu können, muss der globale Administrator Ihres organization überprüfen, ob ein Azure-Abonnement mit nutzungsbasierter Bezahlung vorhanden ist. Andernfalls muss dies entsprechend den Anweisungen unter Erstellen Ihrer anfänglichen Azure-Abonnements eingerichtet werden.
Phase 2: Konfigurieren der Abrechnung
Wenn Sie OCR aktivieren, können alle Typen vertraulicher Informationen und trainierbaren Klassifizierer Zeichen erkennen, die sich in Bildern befinden.
Da es sich um ein optionales Feature handelt, muss Ihr globaler Administrator die abrechnungsbasierte Bezahlung einrichten, um OCR zu aktivieren. Informationen zum Hinzufügen eines Abonnements für OCR finden Sie in den Anweisungen unter Einrichten Microsoft Syntex Abrechnung in Azure.
Hinweis
Wenn Sie zur Seite Microsoft Syntex Abrechnung wechseln, um sich für Ihr OCR-Abonnement zu registrieren, müssen Sie sich nicht auch für Microsoft Syntex registrieren.
Preisinformationen zur nutzungsbasierten Bezahlung für OCR finden Sie auf der Seite Einrichten Microsoft Syntex Abrechnung in Azure.
Gebühren
Die Gebühr für die Verwendung von OCR beträgt 1,00 USD für alle 1.000 gescannten Elemente. Jedes gescannte Bild zählt als eine Transaktion. Dies bedeutet, dass eigenständige Bilder (JPEG, JPG, PNG, BMP oder TIFF) jeweils als einzelne Transaktion zählen. Dies bedeutet auch, dass jede Seite in einer PDF-Datei separat abgerechnet wird. Wenn eine PDF-Datei beispielsweise 10 Seiten enthält, zählt eine OCR-Überprüfung der PDF-Datei als 10 separate Scans.
Wichtig
Informationen zu den Adobe-Anforderungen für die Verwendung von Microsoft Purview Data Loss Prevention (DLP)-Features mit PDF-Dateien finden Sie in diesem Artikel von Adobe: Microsoft Purview Information Protection Support in Acrobat.
Befolgen Sie zum Anzeigen Ihrer Rechnung die Anweisungen unter Überwachen Ihrer Microsoft Syntex nutzungsbasierte Bezahlung.
Schätzen Ihrer Rechnung
Wenn Sie ocr zum ersten Mal verwenden, beschränken Sie die Nutzung auf nur wenige Personen und anwendbare Workloads. Nach kurzer Zeit können Sie Ihre Rechnung in Azure anzeigen und die Nutzungsstatistikgebühren & für jeden Tag anzeigen. Von dort aus können Sie die Kosten für Ihre gesamte Gruppe von Benutzern extrapolieren. Darüber hinaus können Sie das Tag "workload" in Azure Cost Management verwenden, um die Aufschlüsselung der Nutzung pro Workload anzuzeigen.
Phase 3: Konfigurieren Ihrer OCR-Einstellungen
- Wechseln Sie im Microsoft Purview-Complianceportal zu Einstellungen.
- Wählen Sie Optische Zeichenerkennung (OCR) (Vorschau) aus, um Ihre OCR-Konfigurationseinstellungen einzugeben.
- Wählen Sie die Speicherorte aus, an denen Sie Bilder überprüfen möchten. Definieren Sie dann für jeden Standort und jede Lösung den Bereich (Benutzer/Gruppen/Websites) für die OCR. Unterstützte Standorte und Lösungen sind in der folgenden Tabelle aufgeführt.
Berechtigungen
Das Konto, das Sie zum Erstellen und Bereitstellen von Richtlinien verwenden, muss Mitglied einer dieser Rollengruppen sein.
- Compliance-Administrator
- Compliancedatenadministrator
- Informationsschutz
- Information Protection-Administrator
Hinweis
Im Allgemeinen werden OCR-Einstellungen etwa eine Stunde nach dem Einschalten wirksam.
Informationen zur OCR-Funktionalität in Microsoft Purview-Kommunikationscompliance finden Sie unter Erstellen und Verwalten von Kommunikationscompliancerichtlinien.
Unterstützte Standorte und Lösungen
Standort | Unterstützte Lösungen |
---|---|
Exchange | Verhinderung von Datenverlust 1 Informationsschutz: Richtlinien für automatischeBezeichnungen 1 Datensatzverwaltung: Automatisches Anwenden von Aufbewahrungsbezeichnungsrichtlinien2 |
SharePoint-Websites | Verhinderung von Datenverlust Insider-Risikomanagement3 Datensatzverwaltung: Automatisches Anwenden von Aufbewahrungsbezeichnungsrichtlinien2 |
OneDrive-Konten | Verhinderung von Datenverlust Datensatzverwaltung: Automatisches Anwenden von Aufbewahrungsbezeichnungsrichtlinien2 |
Teams-Chat- und Teams-Kanalnachrichten | Verhinderung von Datenverlust Insider-Risikomanagement3 |
Geräte | Verhinderung von Datenverlust Insider-Risikomanagement3 |
1 Unterstützt nur ausgehende E-Mails.
2 Unterstützt Schlüsselwörter und Typen vertraulicher Informationen.
3 Berücksichtigt vertrauliche Informationstypen und trainierbare Klassifizierer, die in Bildern für die Risikobewertung vorhanden sind.
Welche Dateitypen werden unterstützt?
Diese Funktion unterstützt das Scannen von Bildern in den folgenden Dateitypen mit den angegebenen Anforderungen:
Unterstützte Dateitypen | Bildanforderungen |
---|---|
JPEG, JPG, PNG, BMP, TIFF und PDF (nur Bild) | Dateigrößen: Bilddateien dürfen für Exchange und Teams nicht größer als 20 MB sein. Für SharePoint-, OneDrive- und Windows-Endpunkte beträgt die maximale Bilddateigröße 50 MB. Bildauflösung: Die Bildauflösung muss mindestens 50 x 50 Pixel und nicht größer als 16.000 x 16.000 px sein. |
Wichtig
- Es werden nur Bilder mit computertypisiertem Text unterstützt.
- Nur Bilder, die nach der Aktivierung von OCR hochgeladen wurden, werden gescannt.
- Es werden nur eigenständige Bilder gescannt.
- SharePoint und OneDrive unterstützen nur die folgenden Dateitypen: JPEG, JPG, PNG und BMP.
- Richtlinientipps zur Verhinderung von Datenverlust werden für Bilder in Exchange nicht unterstützt.
- Das Scannen von Bildern in komprimierten/Archivdateien wird nicht unterstützt.
- Wenn Sie einen Pfad in den Endpunkteinstellungen zur Verhinderung von Datenverlust ausschließen, überprüft OCR keine Bilder in diesen Ordnern.
- Wenn OCR für Windows-Geräte aktiviert ist, beginnen die Geräte, Nachrichten zur Überprüfung an die Cloud zu senden. Das Standardbandbreitenlimit beträgt 1.024 MB daten pro Gerät und Tag. OCR beendet das Scannen von Bildern, sobald dieses tagesaktuelle Limit erreicht ist. Wenn Sie mit dem Scannen von Bildern fortfahren möchten, können Sie die Bandbreitengrenze erhöhen.
Welche Sprachen werden unterstützt?
OCR-Überprüfung unterstützt mehr als 150 Sprachen.
Zusammenfassung
- Um OCR verwenden zu können, müssen Sie Microsoft Syntex abrechnungsbasierte Bezahlung einrichten. (Sie müssen Microsoft Syntex nicht selbst einrichten.)
- Das Konfigurieren der OCR erfolgt auf Mandantenebene. Nachdem OCR konfiguriert wurde, sind sie für den gesamten Microsoft Purview-Stapel verfügbar.
- Sie müssen keine separaten Datenklassifizierer für OCR erstellen. Nach der OCR-Konfiguration scannen vorhandene Typen vertraulicher Informationen, genaue Datenüberstimmungen auf vertraulichen Informationstypen, trainierbare Klassifizierer und Fingerabdruck-SITs Bilder sowie Dokumente und E-Mails.