Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Usando l'analisi OCR (Optical Character Recognition), Microsoft Purview può analizzare le immagini per individuare informazioni riservate. L'analisi OCR è una funzionalità facoltativa che è necessario abilitare a livello di tenant. Dopo l'abilitazione, selezionare le posizioni in cui si desidera analizzare le immagini. È possibile analizzare le immagini nei dispositivi Exchange, SharePoint, OneDrive, Teams, Windows e macOS. Quando si configurano le impostazioni OCR, Microsoft Purview applica i criteri esistenti per la prevenzione della perdita dei dati , la gestione dei record e la gestione dei rischi Insider (IRM) alle immagini e al contenuto basato su testo. Ad esempio, se si configura il contenuto della condizione DLP contiene informazioni riservate e si include un classificatore di dati, ad esempio SIT ( Credit Card Sensitive Information Type), Microsoft Purview analizza i numeri di carta di credito sia in testo che in immagini in tutte le posizioni scelte.
Flusso di lavoro in breve
| Fase | Cosa serve |
|---|---|
| Creare Azure sottoscrizione, se necessario | Se l'organizzazione non dispone già di una sottoscrizione Azure con pagamento in base al consumo per il tenant, l'amministratore globale deve iniziare creando un account Azure. |
| Stimare gli addebiti per l'analisi OCR | Usare lo strumento di stima dei costi OCR per stimare gli addebiti previsti per i casi d'uso specifici. |
| Configurare la fatturazione con pagamento in base al consumo per abilitare OCR. | L'amministratore globale o di SharePoint deve seguire le istruzioni riportate in Configurare Microsoft Syntex fatturazione in Azure per aggiungere una sottoscrizione per OCR. |
| Configurare le impostazioni di analisi OCR | L'amministratore della conformità per l'organizzazione configura le impostazioni OCR per il tenant. |
Prerequisiti
Per usare l'analisi OCR, l'amministratore globale dell'organizzazione deve verificare che sia disponibile una sottoscrizione con pagamento in base al consumo Azure. In caso contrario, è necessario configurare la sottoscrizione seguendo le istruzioni riportate in Creare le sottoscrizioni Azure iniziali.
Configurare la fatturazione
Quando si abilita OCR, tutti i tipi di informazioni sensibili e i classificatori sottoponibili a training possono rilevare i caratteri presenti nelle immagini.
Poiché si tratta di una funzionalità facoltativa, l'amministratore globale deve configurare la fatturazione con pagamento in base al consumo per abilitare OCR. Fare riferimento alle istruzioni in Configurare Microsoft Syntex fatturazione in Azure per aggiungere una sottoscrizione per OCR.
Nota
Dopo aver immesso le informazioni di fatturazione in Microsoft Syntex, l'amministratore della conformità può configurare OCR in Microsoft Purview senza requisiti aggiuntivi di configurazione o licenza.
È possibile trovare le informazioni sui prezzi con pagamento in base al consumo di OCR nella pagina Configura Microsoft Syntex fatturazione in Azure.
Stimare gli addebiti per l'analisi OCR
Ogni immagine analizzata viene conteggiata come una transazione. Questo prezzo significa che le immagini autonome (JPEG, JPG, PNG, BMP o TIFF) vengono conteggiate come una singola transazione. Significa anche che ogni pagina in un file PDF viene addebitata separatamente. Ad esempio, se sono presenti 10 pagine in un file PDF, un'analisi OCR del file PDF viene conteggiata come 10 scansioni separate. Per informazioni sull'uso dello strumento di stima dei costi OCR, vedere Stima dei costi OCR.
Nota
Per ridurre i costi OCR, il servizio usa i meccanismi di memorizzazione nella cache seguenti: le immagini di piccole dimensioni, ad esempio logo e firme inviate tramite posta elettronica tramite Microsoft Exchange, vengono analizzate e fatturate una sola volta per ogni immagine univoca in tutti gli utenti del tenant per una finestra mobile di cinque giorni. Per Endpoint, la cache viene mantenuta per 30 giorni. La memorizzazione nella cache è locale per ogni dispositivo endpoint e vengono archiviati solo i classificatori identificati nell'hash dell'immagine e dell'immagine. I dati dei clienti non vengono archiviati. Non esiste alcun meccanismo di memorizzazione nella cache per le immagini autonome in SharePoint e OneDrive. Tuttavia, nei tipi di file incorporati, se viene aggiornato solo il testo, le immagini non vengono analizzate di nuovo.
Il servizio controlla più parametri, tra cui l'hash del flusso di immagini e le dimensioni dell'immagine, per verificare se può usare la cache. Se un parametro non corrisponde, il servizio esegue di nuovo l'operazione OCR sull'immagine.
Inoltre, è possibile usare ogni immagine analizzata in un numero qualsiasi di criteri per la prevenzione della perdita di dati, la gestione dei rischi Insider, l'etichettatura automatica e la gestione dei record senza costi aggiuntivi.
Importante
Per informazioni sui requisiti di Adobe per l'uso delle funzionalità di Prevenzione della perdita dei dati Microsoft Purview (DLP) con file PDF, vedere questo articolo di Adobe: Microsoft Purview Information Protection Support in Acrobat.
Configurare le impostazioni OCR
Per configurare l'analisi OCR per il tenant, seguire questa procedura:
- Accedere al portale di Microsoft Purview.
- Selezionare Impostazioni.
- Selezionare Riconoscimento ottico dei caratteri (OCR) per immettere le impostazioni di configurazione OCR.
- Selezionare le posizioni in cui si desidera analizzare le immagini.
- Selezionare i gruppi da includere o escludere dalle analisi OCR.
- Scegliere Fine.
Per l'elenco completo delle posizioni in cui OCR analizza le immagini e le soluzioni che agiscono sui risultati, vedere Posizioni e soluzioni supportate.
Autorizzazioni
Per creare e distribuire criteri, l'account deve essere membro di uno di questi gruppi di ruoli:
- Amministratore di conformità
- Amministratore dati di conformità
- Amministratore globale
- Azure Information Protection
- Amministratore di Information Protection
Nota
In generale, le impostazioni OCR diventano effettive circa un'ora dopo l'attivazione.
Nota
Per informazioni sulla funzionalità OCR in Conformità delle comunicazioni Microsoft Purview, vedere Creare e gestire i criteri di conformità delle comunicazioni.
Posizioni e soluzioni supportate
| Posizione | Soluzioni supportate |
|---|---|
| Exchange | Prevenzione della perdita dei dati Protezione delle informazioni: criteri di etichettatura automatica Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione1 |
| Siti di SharePoint | Prevenzione della perdita dei dati Gestione dei rischi Insider2 Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione1 |
| Account di OneDrive | Prevenzione della perdita dei dati Gestione dei record: applicare automaticamente i criteri delle etichette di conservazione1 |
| Messaggi di chat e canali di Teams | Prevenzione della perdita dei dati Gestione dei rischi Insider2 |
| Dispositivi | Prevenzione della perdita dei dati Gestione dei rischi Insider2 |
1 Supporta parole chiave e tipi di informazioni sensibili.
2 Considera i tipi di informazioni sensibili e i classificatori sottoponibili a training presenti nelle immagini per l'assegnazione dei punteggi di rischio.
Tipi di file supportati
Questa funzionalità supporta l'analisi delle immagini nei tipi di file seguenti, con i requisiti indicati:
| Posizioni | Tipi di file supportati |
|---|---|
| Exchange | JPEG, JPG, PNG, BMP, TIFF e PDF (analizzati). Immagini incorporate in PDF DOCX, PPTX, XLSX, RAR, TAR, ZIP, 7z e ibridi (contenenti testo e immagini ricercabili) con un limite di 20 immagini incorporate analizzate per file. |
| SharePoint e OneDrive | BMP, PNG, JPEG, JPG, JFIF, ARW, CR2, CRW, ERF, GIF, MEF, MRW, NEF, NRW, ORF, PEF, RAW, RW2, RW1, SR2, TIF, TIFF, HEIC, HEIF, ARI, BAY, CAP, CR3, DCS, DCR, DRF, EIP, FFF, IIQ, K25, KDC, MOS, PTX, PXN, RAF, RWL, SRF, SRW, X3F, DNG, PDF (digitalizzato e ibrido contenente testo e immagini ricercabili) Immagini incorporate in DOCX, PPTX, XLSX |
| Teams, Windows e l'endpoint macOS | JPEG, JPG, PNG, BMP, TIFF e PDF (solo immagine) |
Requisiti delle immagini
| Requisito | Limite |
|---|---|
| Dimensioni del file (Exchange, Teams) | 20 MB max |
| Dimensioni del file (endpoint SharePoint, OneDrive, Windows e macOS) | 50 MB max |
| Risoluzione dell'immagine | 50 × 50 px minimo, 16.000 × 16.000 px massimo |
Importante
- Vengono analizzate solo le immagini caricate dopo l'abilitazione di OCR.
- OCR estrae solo i primi 2 milioni di caratteri di testo.
- Per impostazione predefinita, la posta elettronica in ingresso (posta elettronica proveniente da utenti esterni all'organizzazione), le e-mail interne (e-mail condivise all'interno degli utenti dell'organizzazione) e la posta elettronica in uscita (posta elettronica inviata agli utenti esterni all'organizzazione) sono soggette all'analisi OCR. Per escludere i messaggi in ingresso dall'analisi OCR, modificare le impostazioni OCR dall'ambito predefinito Tutti i gruppi di mittenti in Gruppi di mittenti specifici e specificare i gruppi interni da analizzare. Per limitare le analisi OCR solo ai messaggi inviati all'esterno dell'organizzazione, selezionare l'opzione in Impostazione avanzata (solo Exchange). Dopo aver selezionato questa casella di controllo, né i messaggi di posta in arrivo né le comunicazioni interne sono OCRed. Per informazioni sulla modifica delle configurazioni, vedere Configurare le impostazioni OCR.
- I suggerimenti per i criteri di prevenzione della perdita dei dati non sono supportati per le immagini in Exchange.
- Se si esclude un percorso nelle impostazioni di prevenzione della perdita dei dati dell'endpoint, OCR non analizza le immagini in tali cartelle.
- Quando OCR è attivato per i dispositivi Windows e macOS, i dispositivi iniziano a inviare messaggi al cloud per l'analisi. Il limite di larghezza di banda predefinito è di 1.024 MB di dati per dispositivo al giorno. OCR interrompe l'analisi delle immagini una volta raggiunto questo limite giornaliero. Se si vuole continuare a analizzare le immagini, è possibile aumentare il limite di larghezza di banda.
- Per Dispositivo endpoint, assicurarsi che le impostazioni di rete non ostacolino il registro OCR e che sia presente un carattere jolly che consenta blob.core.windows.net endpoint.
- Per Exchange, la funzionalità supporta immagini incorporate in FILE PDF DOCX, PPTX, XLSX, RAR, TAR, ZIP, 7z e ibridi (contenenti testo e immagini ricercabili) con un limite di 20 immagini incorporate analizzate per file.
Lingue supportate
L'analisi OCR supporta più di 150 lingue.
Riepilogo
- Per usare OCR, configurare Microsoft Syntex fatturazione con pagamento in base al consumo. Non è necessario configurare Microsoft Syntex stesso.
- Configurare OCR a livello di tenant, quindi una volta configurato OCR, è disponibile per l'intero stack di Microsoft Purview.
- Non è necessario creare classificatori di dati separati per OCR. Dopo aver configurato OCR, i tipi di informazioni sensibili esistenti, i tipi di informazioni sensibili basati sulla corrispondenza dei dati esatti, i classificatori sottoponibili a training e iSIT di impronta digitale analizzano immagini, documenti e messaggi di posta elettronica.
- Microsoft Purview eDiscovery supporta OCR a livello di case. Per altre informazioni, vedere Impostazioni di ricerca e analisi in eDiscovery.