Informazioni sul riconoscimento ottico dei caratteri in Microsoft Purview

L'analisi OCR (Optical Character Recognition) consente a Microsoft Purview di analizzare le immagini alla ricerca di informazioni riservate. L'analisi OCR è una funzionalità facoltativa e deve essere abilitata a livello di tenant. Una volta abilitata, si selezionano le posizioni in cui si desidera analizzare le immagini. L'analisi delle immagini è disponibile per i dispositivi Exchange, SharePoint, OneDrive, Teams, Windows e macOS. Dopo aver configurato le impostazioni OCR, i criteri esistenti per la prevenzione della perdita dei dati (DLP), la gestione dei record e la gestione dei rischi Insider (IRM) vengono applicati alle immagini e al contenuto basato su testo. Ad esempio, si supponga di aver configurato il contenuto della condizione DLP contenente informazioni riservate e incluso un classificatore di dati, ad esempio il tipo di informazioni sensibili della carta di credito (SIT). In questo caso, Microsoft Purview analizza i numeri di carta di credito in testo e immagini in tutte le posizioni scelte.

Flusso di lavoro in breve

Fase	Cosa serve
Creare una sottoscrizione di Azure, se necessario	Se l'organizzazione non dispone già di una sottoscrizione con pagamento in base al consumo di Azure per il tenant, l'amministratore globale deve iniziare creando un account Azure.
Stimare gli addebiti per l'analisi OCR	Usare lo strumento di stima dei costi OCR per stimare gli addebiti previsti per i casi d'uso specifici.
Configurare la fatturazione con pagamento in base al consumo per abilitare OCR.	L'amministratore globale o di SharePoint deve seguire le istruzioni riportate in Configurare Microsoft Syntex fatturazione in Azure per aggiungere una sottoscrizione per OCR.
Configurare le impostazioni di analisi OCR	L'amministratore della conformità per l'organizzazione configura le impostazioni OCR per il tenant.

Prerequisiti

Per usare l'analisi OCR, l'amministratore globale dell'organizzazione deve verificare che sia disponibile una sottoscrizione con pagamento in base al consumo di Azure. In caso contrario, è necessario configurare questa funzionalità seguendo le istruzioni riportate in Creare le sottoscrizioni di Azure iniziali

Configurare la fatturazione

Quando si abilita OCR, tutti i tipi di informazioni sensibili e i classificatori sottoponibili a training possono rilevare i caratteri presenti nelle immagini.

Poiché si tratta di una funzionalità facoltativa, l'amministratore globale deve configurare la fatturazione con pagamento in base al consumo per abilitare OCR. Per aggiungere una sottoscrizione per OCR, vedere le istruzioni in Configurare la fatturazione Microsoft Syntex in Azure.

Nota

Dopo aver immesso le informazioni di fatturazione in Microsoft Syntex, l'amministratore della conformità può configurare OCR in Microsoft Purview, senza requisiti aggiuntivi di configurazione o licenza.

È possibile trovare informazioni sui prezzi con pagamento in base al consumo di OCR nella pagina Configura fatturazione Microsoft Syntex in Azure.

Stimare gli addebiti per l'analisi OCR

L'addebito per l'uso di OCR è di $ 1,00 per ogni 1.000 elementi analizzati. Ogni immagine analizzata viene conteggiata come una transazione. Ciò significa che le immagini autonome (JPEG, JPG, PNG, BMP o TIFF) vengono conteggiate come una singola transazione. Significa anche che ogni pagina in un file PDF viene addebitata separatamente. Ad esempio, se sono presenti 10 pagine in un file PDF, un'analisi OCR del file PDF viene conteggiata come 10 scansioni separate. Per informazioni sull'uso dello strumento di stima dei costi OCR, vedere Stima dei costi OCR.

Nota

Per ridurre i costi del registro OCR, sono disponibili i meccanismi di memorizzazione nella cache seguenti: le immagini di piccole dimensioni, ad esempio logo e firme inviate tramite posta elettronica tramite Microsoft Exchange, vengono analizzate e fatturate una sola volta per ogni immagine univoca in tutti gli utenti del tenant per una finestra mobile di cinque giorni. Per Endpoint, la cache viene mantenuta per 30 giorni. La memorizzazione nella cache è locale per ogni dispositivo endppoint e vengono archiviati solo i classifer identificati nell'hash dell'immagine e dell'immagine, i dati dei clienti non vengono archiviati. Non esiste alcun meccanismo di memorizzazione nella cache per le immagini autonome in Sharepoint e Onedrive. Tuttavia, nei tipi di file incorporati, se viene aggiornato solo il testo, le immagini non verranno analizzate di nuovo.

Vengono controllati più parametri, tra cui l'hash del flusso di immagini, le dimensioni dell'immagine per verificare se la cache può essere usata o meno. Se un parametro non corrisponde, l'immagine viene nuovamente OCRed.

Inoltre, ogni immagine analizzata può essere usata in un numero qualsiasi di criteri per la prevenzione della perdita di dati, la gestione dei rischi Insider, l'etichettatura automatica e la gestione dei record senza costi aggiuntivi.

Importante

Per informazioni sui requisiti di Adobe per l'uso delle funzionalità di Prevenzione della perdita dei dati Microsoft Purview (DLP) con file PDF, vedere questo articolo di Adobe: Microsoft Purview Information Protection Support in Acrobat.

Configurare le impostazioni OCR

Accedere al portale di Microsoft Purview.
Selezionare Impostazioni.
Selezionare Riconoscimento ottico dei caratteri (OCR) per immettere le impostazioni di configurazione OCR.
Selezionare le posizioni in cui si desidera analizzare le immagini.
Selezionare i gruppi da includere o escludere dalle analisi OCR.
Selezionare Fine

Le posizioni e le soluzioni supportate sono elencate nella tabella seguente.

Autorizzazioni

L'account usato per creare e distribuire i criteri deve essere membro di uno di questi gruppi di ruoli

Amministratore di conformità
Amministratore dati di conformità
Amministratore globale
Azure Information Protection
Amministratore di Information Protection

Nota

In generale, le impostazioni OCR diventano effettive circa un'ora dopo l'attivazione.
Per informazioni sulla funzionalità OCR in Conformità delle comunicazioni Microsoft Purview, vedere Creare e gestire i criteri di conformità delle comunicazioni.

Posizioni e soluzioni supportate

Posizione	Soluzioni supportate
Exchange	Prevenzione della perdita dei dati Protezione delle informazioni: criteri di etichettatura automatica Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione¹
Siti di SharePoint	Prevenzione della perdita dei dati Gestione dei rischi Insider² Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione¹
Account di OneDrive	Prevenzione della perdita dei dati Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione¹
Messaggi di chat e canali di Teams	Prevenzione della perdita dei dati Gestione dei rischi Insider²
Dispositivi	Prevenzione della perdita dei dati Gestione dei rischi Insider²

¹ Supporta parole chiave e tipi di informazioni sensibili.
² Considera i tipi di informazioni sensibili e i classificatori sottoponibili a training presenti nelle immagini per l'assegnazione dei punteggi di rischio.

Tipi di file supportati

Questa funzionalità supporta l'analisi delle immagini nei tipi di file seguenti, con i requisiti indicati:

Posizioni	Tipi di file supportati
Exchange	JPEG, JPG, PNG, BMP, TIFF e PDF (analizzati). Immagini incorporate in PDF DOCX, PPTX, XLSX, RAR, TAR, ZIP, 7z e ibridi (contenenti testo e immagini ricercabili) con un limite di 20 immagini incorporate analizzate per file.
SharePoint e OneDrive	BMP, PNG, JPEG, JPG, JFIF, ARW, CR2, CRW, FUNZ.ERRORE, GIF, MEF, MRW, NEF, NRW, ORF, PEF, RAW, RW2, RW1, SR2, TIF, TIFF, HEIC, HEIF, ARI, BAY, CAP, CR3, DCS, DCR, DRF, EIP, FFF, IIQ, K25, KDC, MOS, PTX, PXN, RAF, RWL, SRF, SRW, X3F, DNG, PDF (digitalizzato e ibrido contenente testo e immagini ricercabili) Immagini incorporate in DOCX, PPTX, XLSX
Teams, Windows e l'endpoint macOS	JPEG, JPG, PNG, BMP, TIFF e PDF (solo immagine)

Requisiti delle immagini

Dimensioni dei file: I file di immagine non devono superare i 20 MB per Exchange e Teams. Per gli endpoint di SharePoint, OneDrive e Windows e macOS, le dimensioni massime del file di immagine sono di 50 MB.

Risoluzione dell'immagine: La risoluzione dell'immagine deve essere di almeno 50 x 50 pixel e non superiore a 16.000 x 16.000 px.

Importante

Vengono analizzate solo le immagini caricate dopo l'abilitazione di OCR.
OCR estrae solo i primi 2 milioni di caratteri di testo.
Per impostazione predefinita, la posta elettronica in ingresso (posta elettronica proveniente da utenti esterni all'organizzazione), le e-mail interne (e-mail condivise all'interno degli utenti dell'organizzazione) e la posta elettronica in uscita (posta elettronica inviata agli utenti esterni all'organizzazione) sono soggette all'analisi OCR. Per escludere i messaggi in ingresso dall'analisi OCR, modificare le impostazioni OCR dall'ambito predefinito Tutti i gruppi di mittenti in Gruppi di mittenti specifici e specificare i gruppi interni da analizzare. Per limitare le analisi OCR solo ai messaggi inviati all'esterno dell'organizzazione, selezionare l'opzione in Impostazione avanzata (solo Exchange). Dopo aver selezionato questa casella di controllo, né i messaggi di posta in arrivo né le comunicazioni interne verranno ocRed. Per informazioni sulla modifica delle configurazioni, vedere Configurare le impostazioni OCR.
I suggerimenti per i criteri di prevenzione della perdita dei dati non sono supportati per le immagini in Exchange.
Se si esclude un percorso nelle impostazioni di prevenzione della perdita dei dati dell'endpoint, OCR non analizzerà le immagini in tali cartelle.
Quando OCR è attivato per i dispositivi Windows e macOS, i dispositivi iniziano a inviare messaggi al cloud per l'analisi. Il limite di larghezza di banda predefinito è di 1.024 MB di dati per dispositivo al giorno. OCR interrompe l'analisi delle immagini una volta raggiunto questo limite giornaliero. Se si vuole continuare a analizzare le immagini, è possibile aumentare il limite di larghezza di banda.
Per dispositivo endpoint, è necessario assicurarsi che le impostazioni di rete non ostacolino il registro OCR e che sia presente un carattere jolly che consenta blob.core.windows.net endpoint
Per Exchange, le immagini incorporate in DOCX, PPTX, XLSX, RAR, TAR, ZIP, 7z e PDF ibridi (contenenti testo e immagini ricercabili) sono supportate con un limite di 20 immagini incorporate analizzate per file

Lingue supportate

L'analisi OCR supporta più di 150 lingue.

Riepilogo

Per usare OCR, è necessario configurare Microsoft Syntex fatturazione con pagamento in base al consumo. Non è necessario configurare Microsoft Syntex stesso.
La configurazione di OCR avviene a livello di tenant, quindi una volta configurato OCR, è disponibile per l'intero stack di Microsoft Purview.
Non è necessario creare classificatori di dati separati per OCR. Dopo aver configurato OCR, i tipi di informazioni sensibili esistenti, i tipi di informazioni sensibili basati sulla corrispondenza dei dati esatti, i classificatori sottoponibili a training e i SIT di impronta digitale analizzano immagini, documenti e messaggi di posta elettronica.

Vedere anche

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-06-19

Condividi tramite

Informazioni sul riconoscimento ottico dei caratteri in Microsoft Purview

Flusso di lavoro in breve

Prerequisiti

Configurare la fatturazione

Stimare gli addebiti per l'analisi OCR

Configurare le impostazioni OCR

Autorizzazioni

Posizioni e soluzioni supportate

Tipi di file supportati

Requisiti delle immagini

Lingue supportate

Riepilogo

Vedere anche

Commenti e suggerimenti

Risorse aggiuntive