Informazioni sul riconoscimento ottico dei caratteri in Microsoft Purview

Articolo
04/01/2024

L'analisi OCR (Optical Character Recognition) consente a Microsoft Purview di analizzare il contenuto nelle immagini per ottenere informazioni riservate. Una funzionalità facoltativa, l'analisi OCR viene abilitata per la prima volta a livello di tenant. Una volta abilitata, si selezionano le posizioni in cui si desidera analizzare le immagini. L'analisi delle immagini è disponibile per i dispositivi Exchange, SharePoint, OneDrive, Teams e Windows. Dopo aver configurato le impostazioni OCR, i criteri esistenti per la prevenzione della perdita dei dati (DLP), la gestione dei record e la gestione dei rischi Insider (IRM) vengono applicati alle immagini e al contenuto basato su testo. Ad esempio, si supponga di aver configurato il contenuto della condizione DLP contenente informazioni riservate e incluso un classificatore di dati, ad esempio il tipo di informazioni sensibili "Carta di credito" (SIT). In questo caso, Microsoft Purview analizza i numeri di carta di credito in testo e immagini in tutte le posizioni scelte.

Flusso di lavoro in breve

Fase	Cosa serve
Fase 1: Creare una sottoscrizione di Azure, se necessario	Se l'organizzazione non dispone già di una sottoscrizione con pagamento in base al consumo di Azure per il tenant, l'amministratore globale deve iniziare creando un account Azure.
Fase 2: Configurare la fatturazione con pagamento in base al consumo per abilitare OCR.	L'amministratore globale o di SharePoint deve seguire le istruzioni riportate in Configurare Microsoft Syntex fatturazione in Azure per aggiungere una sottoscrizione per OCR.
Fase 3: Configurare le impostazioni di analisi OCR	L'amministratore della conformità per l'organizzazione configura le impostazioni OCR per il tenant.

Fase 1: Prerequisiti

Per usare l'analisi OCR, l'amministratore globale dell'organizzazione deve verificare che sia disponibile una sottoscrizione con pagamento in base al consumo di Azure. In caso contrario, è necessario configurare questa funzionalità seguendo le istruzioni riportate in Creare le sottoscrizioni di Azure iniziali

Fase 2: Configurare la fatturazione

Quando si abilita OCR, tutti i tipi di informazioni sensibili e i classificatori sottoponibili a training possono rilevare i caratteri presenti nelle immagini.

Poiché si tratta di una funzionalità facoltativa, l'amministratore globale deve configurare la fatturazione con pagamento in base al consumo per abilitare OCR. Per aggiungere una sottoscrizione per OCR, vedere le istruzioni in Configurare la fatturazione Microsoft Syntex in Azure.

Nota

Dopo aver immesso le informazioni di fatturazione in Microsoft Syntex, l'amministratore della conformità può configurare OCR in Microsoft Purview, senza requisiti aggiuntivi di configurazione o licenza.

È possibile trovare informazioni sui prezzi con pagamento in base al consumo di OCR nella pagina Configura fatturazione Microsoft Syntex in Azure.

Addebiti

L'addebito per l'uso di OCR è di $ 1,00 per ogni 1.000 elementi analizzati. Ogni immagine analizzata viene conteggiata come una transazione. Ciò significa che le immagini autonome (JPEG, JPG, PNG, BMP o TIFF) vengono conteggiate come una singola transazione. Significa anche che ogni pagina in un file PDF viene addebitata separatamente. Ad esempio, se sono presenti 10 pagine in un file PDF, un'analisi OCR del file PDF viene conteggiata come 10 scansioni separate.

Nota

Per ridurre i costi OCR, gli addebiti per l'analisi di ogni immagine univoca vengono addebitati una sola volta.

Le immagini di piccole dimensioni, ad esempio logo e firme inviate tramite posta elettronica tramite Microsoft Exchange, vengono analizzate e fatturate una sola volta per ogni immagine univoca in tutti gli utenti del tenant. Per tutte le istanze successive, i risultati dell'analisi precedente verranno riutilizzati.

Inoltre, ogni immagine analizzata può essere usata in un numero qualsiasi di criteri per la prevenzione della perdita di dati, la gestione dei rischi Insider, l'etichettatura automatica e la gestione dei record senza costi aggiuntivi.

Importante

Per informazioni sui requisiti di Adobe per l'uso delle funzionalità di Prevenzione della perdita dei dati Microsoft Purview (DLP) con file PDF, vedere questo articolo di Adobe: Microsoft Purview Information Protection Support in Acrobat.

Per visualizzare la fattura, seguire le istruzioni descritte in Monitorare l'utilizzo Microsoft Syntex con pagamento in base al consumo.

Stimare la fattura

Quando si inizia a usare OCR per la prima volta, limitare l'utilizzo a poche persone e carichi di lavoro applicabili. Dopo un breve intervallo di tempo, è possibile visualizzare la fattura in Azure e visualizzare le statistiche di utilizzo & gli addebiti per ogni giorno. Da qui è possibile estrapolare i costi per l'intero set di utenti. È anche possibile usare il tag "carico di lavoro" in Gestione costi di Azure per visualizzare la suddivisione dell'utilizzo per carico di lavoro.

Fase 3: Configurare le impostazioni OCR

Nel Portale di conformità di Microsoft Purview passare a Impostazioni.
Selezionare Riconoscimento ottico dei caratteri (OCR) per immettere le impostazioni di configurazione OCR.
Selezionare le posizioni in cui si desidera analizzare le immagini.
Selezionare i gruppi di distribuzione da includere o escludere dalle analisi OCR.
Scegliere Fine

Le posizioni e le soluzioni supportate sono elencate nella tabella seguente.

Autorizzazioni

L'account usato per creare e distribuire i criteri deve essere membro di uno di questi gruppi di ruoli

Amministratore di conformità
Amministratore dati di conformità
Amministratore globale
Azure Information Protection
Amministratore di Information Protection

Nota

In generale, le impostazioni OCR diventano effettive circa un'ora dopo l'attivazione.
Per informazioni sulla funzionalità OCR in Conformità delle comunicazioni Microsoft Purview, vedere Creare e gestire i criteri di conformità delle comunicazioni.

Percorsi e soluzioni supportati

Posizione	Soluzioni supportate
Exchange	Prevenzione della perdita dei dati Protezione delle informazioni: criteri di etichettatura automatica Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione¹
Siti di SharePoint	Prevenzione della perdita dei dati Gestione dei rischi Insider² Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione¹
Account di OneDrive	Prevenzione della perdita dei dati Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione¹
Messaggi di chat e canali di Teams	Prevenzione della perdita dei dati Gestione dei rischi Insider²
Dispositivi	Prevenzione della perdita dei dati Gestione dei rischi Insider²

¹ Supporta parole chiave e tipi di informazioni sensibili.
² Considera i tipi di informazioni sensibili e i classificatori sottoponibili a training presenti nelle immagini per l'assegnazione dei punteggi di rischio.

Quali tipi di file sono supportati?

Questa funzionalità supporta l'analisi delle immagini nei tipi di file seguenti, con i requisiti indicati:

Tipi di file supportati	Requisiti delle immagini
JPEG, JPG, PNG, BMP, TIFF e PDF (solo immagine)	Dimensioni dei file: I file di immagine non devono superare i 20 MB per Exchange e Teams. Per gli endpoint di SharePoint, OneDrive e Windows, la dimensione massima del file di immagine è di 50 MB. Risoluzione dell'immagine: La risoluzione dell'immagine deve essere di almeno 50 x 50 pixel e non superiore a 16.000 x 16.000 px.

Importante

Vengono analizzate solo le immagini caricate dopo l'abilitazione di OCR.
Sia la posta elettronica in ingresso (posta elettronica proveniente da utenti esterni all'organizzazione) che quella in uscita (posta elettronica inviata dagli utenti all'interno dell'organizzazione) sono soggette all'analisi OCR. Per limitare le analisi OCR solo ai messaggi di posta elettronica in uscita, modificare le impostazioni OCR dall'ambito predefinito Tutti i gruppi di distribuzione ai gruppi di distribuzione specifici e specificare i gruppi di distribuzione interni da analizzare. Per informazioni sulla modifica di questa configurazione, vedere Fase 3: Configurare le impostazioni OCR.
I suggerimenti per i criteri di prevenzione della perdita dei dati non sono supportati per le immagini in Exchange.
Se si esclude un percorso nelle impostazioni di prevenzione della perdita dei dati dell'endpoint, OCR non analizzerà le immagini in tali cartelle.
Quando OCR è attivato per i dispositivi Windows, i dispositivi iniziano a inviare messaggi al cloud per l'analisi. Il limite di larghezza di banda predefinito è di 1024 MB di dati per dispositivo al giorno. OCR interrompe l'analisi delle immagini una volta raggiunto questo limite giornaliero. Se si vuole continuare a analizzare le immagini, è possibile aumentare il limite di larghezza di banda.

Quali lingue sono supportate?

L'analisi OCR supporta più di 150 lingue.

Riepilogo

Per usare OCR, è necessario configurare Microsoft Syntex fatturazione con pagamento in base al consumo. Non è necessario configurare Microsoft Syntex stesso.
La configurazione di OCR avviene a livello di tenant, quindi una volta configurato OCR, è disponibile per l'intero stack di Microsoft Purview.
Non è necessario creare classificatori di dati separati per OCR. Dopo aver configurato OCR, i tipi di informazioni sensibili esistenti, i tipi di informazioni sensibili basati sulla corrispondenza dei dati esatti, i classificatori sottoponibili a training e i SIT di impronta digitale analizzano immagini, documenti e messaggi di posta elettronica.

Informazioni sul riconoscimento ottico dei caratteri in Microsoft Purview

Flusso di lavoro in breve

Fase 1: Prerequisiti

Fase 2: Configurare la fatturazione

Addebiti

Stimare la fattura

Fase 3: Configurare le impostazioni OCR

Autorizzazioni

Percorsi e soluzioni supportati

Quali tipi di file sono supportati?

Quali lingue sono supportate?

Riepilogo

Vedere anche

Commenti e suggerimenti

Commenti e suggerimenti

Risorse aggiuntive