Informazioni sul riconoscimento ottico dei caratteri in Microsoft Purview

L'analisi OCR (Optical Character Recognition) consente a Microsoft Purview di analizzare il contenuto nelle immagini per ottenere informazioni riservate. Una funzionalità facoltativa, l'analisi OCR viene abilitata per la prima volta a livello di tenant. Una volta abilitata, si selezionano le posizioni in cui si desidera analizzare le immagini. L'analisi delle immagini è disponibile per i dispositivi Exchange, SharePoint, OneDrive, Teams e Windows. Dopo aver configurato le impostazioni OCR, i criteri esistenti per la prevenzione della perdita dei dati (DLP), la gestione dei record e la gestione dei rischi Insider (IRM) vengono applicati alle immagini e al contenuto basato su testo. Ad esempio, si supponga di aver configurato il contenuto della condizione DLP contenente informazioni riservate e incluso un classificatore di dati, ad esempio il tipo di informazioni sensibili "Carta di credito" (SIT). In questo caso, Microsoft Purview analizza i numeri di carta di credito in testo e immagini in tutte le posizioni scelte.

Flusso di lavoro in breve

Fase Cosa serve
Fase 1: Creare una sottoscrizione di Azure, se necessario Se l'organizzazione non dispone già di una sottoscrizione con pagamento in base al consumo di Azure per il tenant, l'amministratore globale deve iniziare creando un account Azure.
Fase 2: Configurare la fatturazione con pagamento in base al consumo per abilitare OCR. L'amministratore globale o di SharePoint deve seguire le istruzioni riportate in Configurare Microsoft Syntex fatturazione in Azure per aggiungere una sottoscrizione per OCR.
Fase 3: Configurare le impostazioni di analisi OCR L'amministratore della conformità per l'organizzazione configura le impostazioni OCR per il tenant.

Fase 1: Prerequisiti

Per usare l'analisi OCR, l'amministratore globale dell'organizzazione deve verificare che sia disponibile una sottoscrizione con pagamento in base al consumo di Azure. In caso contrario, è necessario configurare questa funzionalità seguendo le istruzioni riportate in Creare le sottoscrizioni di Azure iniziali

Fase 2: Configurare la fatturazione

Quando si abilita OCR, tutti i tipi di informazioni sensibili e i classificatori sottoponibili a training possono rilevare i caratteri presenti nelle immagini.

Poiché si tratta di una funzionalità facoltativa, l'amministratore globale deve configurare la fatturazione con pagamento in base al consumo per abilitare OCR. Per aggiungere una sottoscrizione per OCR, vedere le istruzioni in Configurare la fatturazione Microsoft Syntex in Azure.

Nota

Dopo aver immesso le informazioni di fatturazione in Microsoft Syntex, l'amministratore della conformità può configurare OCR in Microsoft Purview, senza requisiti aggiuntivi di configurazione o licenza.

È possibile trovare informazioni sui prezzi con pagamento in base al consumo di OCR nella pagina Configura fatturazione Microsoft Syntex in Azure.

Addebiti

L'addebito per l'uso di OCR è di $ 1,00 per ogni 1.000 elementi analizzati. Ogni immagine analizzata viene conteggiata come una transazione. Ciò significa che le immagini autonome (JPEG, JPG, PNG, BMP o TIFF) vengono conteggiate come una singola transazione. Significa anche che ogni pagina in un file PDF viene addebitata separatamente. Ad esempio, se sono presenti 10 pagine in un file PDF, un'analisi OCR del file PDF viene conteggiata come 10 scansioni separate.

Nota

Per ridurre i costi OCR, gli addebiti per l'analisi di ogni immagine univoca vengono addebitati una sola volta.

Le immagini di piccole dimensioni, ad esempio logo e firme inviate tramite posta elettronica tramite Microsoft Exchange, vengono analizzate e fatturate una sola volta per ogni immagine univoca in tutti gli utenti del tenant. Per tutte le istanze successive, i risultati dell'analisi precedente verranno riutilizzati.

Inoltre, ogni immagine analizzata può essere usata in un numero qualsiasi di criteri per la prevenzione della perdita di dati, la gestione dei rischi Insider, l'etichettatura automatica e la gestione dei record senza costi aggiuntivi.

Importante

Per informazioni sui requisiti di Adobe per l'uso delle funzionalità di Prevenzione della perdita dei dati Microsoft Purview (DLP) con file PDF, vedere questo articolo di Adobe: Microsoft Purview Information Protection Support in Acrobat.

Per visualizzare la fattura, seguire le istruzioni descritte in Monitorare l'utilizzo Microsoft Syntex con pagamento in base al consumo.

Stimare la fattura

Quando si inizia a usare OCR per la prima volta, limitare l'utilizzo a poche persone e carichi di lavoro applicabili. Dopo un breve intervallo di tempo, è possibile visualizzare la fattura in Azure e visualizzare le statistiche di utilizzo & gli addebiti per ogni giorno. Da qui è possibile estrapolare i costi per l'intero set di utenti. È anche possibile usare il tag "carico di lavoro" in Gestione costi di Azure per visualizzare la suddivisione dell'utilizzo per carico di lavoro.

Fase 3: Configurare le impostazioni OCR

  1. Nel Portale di conformità di Microsoft Purview passare a Impostazioni.
  2. Selezionare Riconoscimento ottico dei caratteri (OCR) per immettere le impostazioni di configurazione OCR.
  3. Selezionare le posizioni in cui si desidera analizzare le immagini.
  4. Selezionare i gruppi di distribuzione da includere o escludere dalle analisi OCR.
  5. Scegliere Fine

Le posizioni e le soluzioni supportate sono elencate nella tabella seguente.

Autorizzazioni

L'account usato per creare e distribuire i criteri deve essere membro di uno di questi gruppi di ruoli

  • Amministratore di conformità
  • Amministratore dati di conformità
  • Amministratore globale
  • Azure Information Protection
  • Amministratore di Information Protection

Nota

Percorsi e soluzioni supportati

Posizione Soluzioni supportate
Exchange Prevenzione della perdita dei dati

Protezione delle informazioni: criteri di etichettatura automatica

Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione1
Siti di SharePoint Prevenzione della perdita dei dati

Gestione dei rischi Insider2

Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione1
Account di OneDrive Prevenzione della perdita dei dati

Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione1
Messaggi di chat e canali di Teams Prevenzione della perdita dei dati

Gestione dei rischi Insider2
Dispositivi Prevenzione della perdita dei dati

Gestione dei rischi Insider2

1 Supporta parole chiave e tipi di informazioni sensibili.
2 Considera i tipi di informazioni sensibili e i classificatori sottoponibili a training presenti nelle immagini per l'assegnazione dei punteggi di rischio.


Quali tipi di file sono supportati?

Questa funzionalità supporta l'analisi delle immagini nei tipi di file seguenti, con i requisiti indicati:

Tipi di file supportati Requisiti delle immagini
JPEG, JPG, PNG, BMP, TIFF e PDF (solo immagine) Dimensioni dei file: I file di immagine non devono superare i 20 MB per Exchange e Teams. Per gli endpoint di SharePoint, OneDrive e Windows, la dimensione massima del file di immagine è di 50 MB.

Risoluzione dell'immagine: La risoluzione dell'immagine deve essere di almeno 50 x 50 pixel e non superiore a 16.000 x 16.000 px.

Importante

  • Vengono analizzate solo le immagini caricate dopo l'abilitazione di OCR.
  • Sia la posta elettronica in ingresso (posta elettronica proveniente da utenti esterni all'organizzazione) che quella in uscita (posta elettronica inviata dagli utenti all'interno dell'organizzazione) sono soggette all'analisi OCR. Per limitare le analisi OCR solo ai messaggi di posta elettronica in uscita, modificare le impostazioni OCR dall'ambito predefinito Tutti i gruppi di distribuzione ai gruppi di distribuzione specifici e specificare i gruppi di distribuzione interni da analizzare. Per informazioni sulla modifica di questa configurazione, vedere Fase 3: Configurare le impostazioni OCR.
  • I suggerimenti per i criteri di prevenzione della perdita dei dati non sono supportati per le immagini in Exchange.
  • Se si esclude un percorso nelle impostazioni di prevenzione della perdita dei dati dell'endpoint, OCR non analizzerà le immagini in tali cartelle.
  • Quando OCR è attivato per i dispositivi Windows, i dispositivi iniziano a inviare messaggi al cloud per l'analisi. Il limite di larghezza di banda predefinito è di 1024 MB di dati per dispositivo al giorno. OCR interrompe l'analisi delle immagini una volta raggiunto questo limite giornaliero. Se si vuole continuare a analizzare le immagini, è possibile aumentare il limite di larghezza di banda.

Quali lingue sono supportate?

L'analisi OCR supporta più di 150 lingue.

Riepilogo

Vedere anche