Panoramica del riconoscimento ottico dei caratteri

Nota

Fino a giugno 2026, è possibile provare gratuitamente una quantità limitata di riconoscimento ottico dei caratteri e altri servizi di contenuti selezionati se è stata configurata la fatturazione con pagamento in base al consumo . Per informazioni e limitazioni, vedere Provare i servizi con pagamento in base al consumo.

Il servizio OCR (Optical Character Recognition) in SharePoint consente di estrarre testo stampato o scritto a mano da immagini e documenti. Esempi di immagini includono poster, disegni ed etichette di prodotto. Esempi di documenti includono articoli, report, moduli e fatture.

Il testo viene in genere estratto come parole, righe di testo e paragrafi o blocchi di testo, consentendo l'accesso alla versione digitale del testo analizzato. Le informazioni estratte vengono indicizzate nella ricerca e possono essere rese disponibili per le funzionalità di conformità, ad esempio la prevenzione della perdita dei dati.The extracted information is indexed in search and can be made available for compliance features like data loss prevention (DLP).

Ad esempio, si abilita il servizio OCR e quindi si aggiungono file di immagine alla raccolta documenti. La funzionalità analizza automaticamente i file di immagine, estrae il testo pertinente e rende il testo dalle immagini disponibili per la ricerca e l'indicizzazione. Questa funzionalità consente di trovare rapidamente e accuratamente le parole chiave e le frasi che si sta cercando.

Requisiti e limitazioni

Questo servizio è disponibile solo per i siti di SharePoint, inclusi i siti hub, i siti associati a un sito hub e il sito primario di una raccolta siti. I siti secondari non sono supportati.

Tipi di file supportati

Endpoint	Tipi di file supportati
SharePoint e OneDrive	`.bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf (scanned and hybrid)` Le immagini incorporate in `docx, pptx, xlsx` vengono estratte e analizzate
Exchange	`.jpeg, .jpg, .png, .bmp, .tiff, and PDFs (scanned and hybrid)` . Immagini incorporate in `docx, pptx, xlsx, rar, tar, zip, 7z`
Teams, Windows e l'endpoint macOS	`.jpeg, .jpg, .png, .bmp, .tiff, and PDF (image only)`

Oltre al PDF basato su immagini, SharePoint OCR supporta pdf ibrido (pdf di testo più immagine). I PDF ibridi appena caricati verranno elaborati dal servizio OCR.

Nota

Quando si applica OCR a un file di immagine, il testo viene archiviato nella colonna Metadati di testo estratto . Quando si applica OCR a un file PDF o TIFF, il testo estratto viene indicizzato nella ricerca ma non disponibile nella colonna dei metadati.

Supporto dei file di Office in SharePoint

SharePoint supporta ora il registro OCR per i file di Microsoft 365 Office, inclusi i documenti di Word, PowerPoint ed Excel. Tutte le immagini aggiunte a questi file verranno analizzate automaticamente tramite OCR e il testo estratto verrà indicizzato a scopo di ricerca e integrato nelle soluzioni di conformità. SharePoint ha inoltre implementato processi di deduplicazione per verificare la presenza di immagini univoche per evitare addebiti duplicati per le stesse immagini.

Lingue supportate

Il servizio OCR supporta più di 150 lingue.

Posizioni e soluzioni supportate

Il servizio OCR supporta più soluzioni, come illustrato nella tabella seguente. Per informazioni dettagliate sulle soluzioni di conformità, vedere Posizioni e soluzioni supportate in Microsoft Purview.

Posizione	Soluzione supportata
Exchange	Il testo è disponibile per le soluzioni basate su ricerca e ricerca degli utenti finali. Il testo è disponibile per le soluzioni di conformità.
Siti di SharePoint	Il testo è disponibile per le soluzioni basate su ricerca e ricerca degli utenti finali. Il testo è disponibile per le soluzioni di conformità.
Account di OneDrive	Il testo è disponibile per le soluzioni basate su ricerca e ricerca degli utenti finali. Il testo è disponibile per le soluzioni di conformità.
Messaggio di chat e canale di Teams	Il testo è disponibile per le soluzioni di conformità.
Dispositivi	Il testo è disponibile per le soluzioni di conformità.

Limitazioni relative ai file

Le immagini devono essere inferiori a 50 MB.
Le immagini devono essere di almeno 50 x 50 pixel e non superiori a 16.000 x 16.000 pixel.
Le immagini caricate dopo l'abilitazione di OCR sono le uniche immagini analizzate.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2025-12-20