Informazioni sul riconoscimento ottico dei caratteri in Microsoft Purview
L'analisi OCR (Optical Character Recognition) consente a Microsoft Purview di analizzare le immagini alla ricerca di informazioni riservate. L'analisi OCR è una funzionalità facoltativa e deve essere abilitata a livello di tenant. Una volta abilitata, si selezionano le posizioni in cui si desidera analizzare le immagini. L'analisi delle immagini è disponibile per i dispositivi Exchange, SharePoint, OneDrive, Teams, Windows e macOS. Dopo aver configurato le impostazioni OCR, i criteri esistenti per la prevenzione della perdita dei dati (DLP), la gestione dei record e la gestione dei rischi Insider (IRM) vengono applicati alle immagini e al contenuto basato su testo. Ad esempio, si supponga di aver configurato il contenuto della condizione DLP contenente informazioni riservate e incluso un classificatore di dati, ad esempio il tipo di informazioni sensibili della carta di credito (SIT). In questo caso, Microsoft Purview analizza i numeri di carta di credito in testo e immagini in tutte le posizioni scelte.
Flusso di lavoro in breve
Fase | Cosa serve |
---|---|
Creare una sottoscrizione di Azure, se necessario | Se l'organizzazione non dispone già di una sottoscrizione con pagamento in base al consumo di Azure per il tenant, l'amministratore globale deve iniziare creando un account Azure. |
Stimare gli addebiti per l'analisi OCR | Usare lo strumento di stima dei costi OCR per stimare gli addebiti previsti per i casi d'uso specifici. |
Configurare la fatturazione con pagamento in base al consumo per abilitare OCR. | L'amministratore globale o di SharePoint deve seguire le istruzioni riportate in Configurare Microsoft Syntex fatturazione in Azure per aggiungere una sottoscrizione per OCR. |
Configurare le impostazioni di analisi OCR | L'amministratore della conformità per l'organizzazione configura le impostazioni OCR per il tenant. |
Prerequisiti
Per usare l'analisi OCR, l'amministratore globale dell'organizzazione deve verificare che sia disponibile una sottoscrizione con pagamento in base al consumo di Azure. In caso contrario, è necessario configurare questa funzionalità seguendo le istruzioni riportate in Creare le sottoscrizioni di Azure iniziali
Configurare la fatturazione
Quando si abilita OCR, tutti i tipi di informazioni sensibili e i classificatori sottoponibili a training possono rilevare i caratteri presenti nelle immagini.
Poiché si tratta di una funzionalità facoltativa, l'amministratore globale deve configurare la fatturazione con pagamento in base al consumo per abilitare OCR. Per aggiungere una sottoscrizione per OCR, vedere le istruzioni in Configurare la fatturazione Microsoft Syntex in Azure.
Nota
Dopo aver immesso le informazioni di fatturazione in Microsoft Syntex, l'amministratore della conformità può configurare OCR in Microsoft Purview, senza requisiti aggiuntivi di configurazione o licenza.
È possibile trovare informazioni sui prezzi con pagamento in base al consumo di OCR nella pagina Configura fatturazione Microsoft Syntex in Azure.
Stimare gli addebiti per l'analisi OCR
L'addebito per l'uso di OCR è di $ 1,00 per ogni 1.000 elementi analizzati. Ogni immagine analizzata viene conteggiata come una transazione. Ciò significa che le immagini autonome (JPEG, JPG, PNG, BMP o TIFF) vengono conteggiate come una singola transazione. Significa anche che ogni pagina in un file PDF viene addebitata separatamente. Ad esempio, se sono presenti 10 pagine in un file PDF, un'analisi OCR del file PDF viene conteggiata come 10 scansioni separate. Per informazioni sull'uso dello strumento di stima dei costi OCR, vedere Stima dei costi OCR.
Nota
Per ridurre i costi OCR, gli addebiti per l'analisi di ogni immagine univoca vengono addebitati una sola volta.
Le immagini di piccole dimensioni, ad esempio logo e firme inviate tramite posta elettronica tramite Microsoft Exchange, vengono analizzate e fatturate una sola volta per ogni immagine univoca in tutti gli utenti del tenant. Per tutte le istanze successive, i risultati dell'analisi precedente verranno riutilizzati.
Inoltre, ogni immagine analizzata può essere usata in un numero qualsiasi di criteri per la prevenzione della perdita di dati, la gestione dei rischi Insider, l'etichettatura automatica e la gestione dei record senza costi aggiuntivi.
Importante
Per informazioni sui requisiti di Adobe per l'uso delle funzionalità di Prevenzione della perdita dei dati Microsoft Purview (DLP) con file PDF, vedere questo articolo di Adobe: Microsoft Purview Information Protection Support in Acrobat.
Configurare le impostazioni OCR
Selezionare la scheda appropriata per il portale in uso. Per altre informazioni sul portale di Microsoft Purview, vedere Portale di Microsoft Purview. Per altre informazioni sul portale di conformità, vedere Portale di conformità di Microsoft Purview.
- Accedere al portale di Microsoft Purview.
- Selezionare Impostazioni.
- Selezionare Riconoscimento ottico dei caratteri (OCR) per immettere le impostazioni di configurazione OCR.
- Selezionare le posizioni in cui si desidera analizzare le immagini.
- Selezionare i gruppi di distribuzione da includere o escludere dalle analisi OCR.
- Selezionare Fine
Le posizioni e le soluzioni supportate sono elencate nella tabella seguente.
Autorizzazioni
L'account usato per creare e distribuire i criteri deve essere membro di uno di questi gruppi di ruoli
- Amministratore di conformità
- Amministratore dati di conformità
- Amministratore globale
- Azure Information Protection
- Amministratore di Information Protection
Nota
In generale, le impostazioni OCR diventano effettive circa un'ora dopo l'attivazione.
Per informazioni sulla funzionalità OCR in Conformità delle comunicazioni Microsoft Purview, vedere Creare e gestire i criteri di conformità delle comunicazioni.
Posizioni e soluzioni supportate
Posizione | Soluzioni supportate |
---|---|
Exchange | Prevenzione della perdita dei dati Protezione delle informazioni: criteri di etichettatura automatica Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione1 |
Siti di SharePoint | Prevenzione della perdita dei dati Gestione dei rischi Insider2 Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione1 |
Account di OneDrive | Prevenzione della perdita dei dati Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione1 |
Messaggi di chat e canali di Teams | Prevenzione della perdita dei dati Gestione dei rischi Insider2 |
Dispositivi | Prevenzione della perdita dei dati Gestione dei rischi Insider2 |
1 Supporta parole chiave e tipi di informazioni sensibili.
2 Considera i tipi di informazioni sensibili e i classificatori sottoponibili a training presenti nelle immagini per l'assegnazione dei punteggi di rischio.
Tipi di file supportati
Questa funzionalità supporta l'analisi delle immagini nei tipi di file seguenti, con i requisiti indicati:
Tipi di file supportati | Requisiti delle immagini |
---|---|
JPEG, JPG, PNG, BMP, TIFF e PDF (solo immagine) |
Dimensioni dei file: I file di immagine non devono superare i 20 MB per Exchange e Teams. Per gli endpoint di SharePoint, OneDrive e Windows e macOS, le dimensioni massime del file di immagine sono di 50 MB. Risoluzione dell'immagine: La risoluzione dell'immagine deve essere di almeno 50 x 50 pixel e non superiore a 16.000 x 16.000 px. |
Importante
- Vengono analizzate solo le immagini caricate dopo l'abilitazione di OCR.
- Sia la posta elettronica in ingresso (posta elettronica proveniente da utenti esterni all'organizzazione) che quella in uscita (posta elettronica inviata dagli utenti all'interno dell'organizzazione) sono soggette all'analisi OCR. Per limitare le analisi OCR solo ai messaggi di posta elettronica in uscita, modificare le impostazioni OCR dall'ambito predefinito Tutti i gruppi di distribuzione ai gruppi di distribuzione specifici e specificare i gruppi di distribuzione interni da analizzare. Per informazioni sulla modifica di questa configurazione, vedere Configurare le impostazioni OCR.
- I suggerimenti per i criteri di prevenzione della perdita dei dati non sono supportati per le immagini in Exchange.
- Se si esclude un percorso nelle impostazioni di prevenzione della perdita dei dati dell'endpoint, OCR non analizzerà le immagini in tali cartelle.
- Quando OCR è attivato per i dispositivi Windows e macOS, i dispositivi iniziano a inviare messaggi al cloud per l'analisi. Il limite di larghezza di banda predefinito è di 1024 MB di dati per dispositivo al giorno. OCR interrompe l'analisi delle immagini una volta raggiunto questo limite giornaliero. Se si vuole continuare a analizzare le immagini, è possibile aumentare il limite di larghezza di banda.
Lingue supportate
L'analisi OCR supporta più di 150 lingue.
Riepilogo
- Per usare OCR, è necessario configurare Microsoft Syntex fatturazione con pagamento in base al consumo. Non è necessario configurare Microsoft Syntex stesso.
- La configurazione di OCR avviene a livello di tenant, quindi una volta configurato OCR, è disponibile per l'intero stack di Microsoft Purview.
- Non è necessario creare classificatori di dati separati per OCR. Dopo aver configurato OCR, i tipi di informazioni sensibili esistenti, i tipi di informazioni sensibili basati sulla corrispondenza dei dati esatti, i classificatori sottoponibili a training e iSIT di impronta digitale analizzano immagini, documenti e messaggi di posta elettronica.