Översikt över optisk teckenigenkänning i Microsoft Syntex

Obs!

Till och med juni 2024 kan du prova optisk teckenigenkänning och andra valda Syntex-tjänster utan kostnad om du har konfigurerat fakturering med betala per användning. Information och begränsningar finns i Prova Microsoft Syntex och utforska dess tjänster.

Med tjänsten optisk teckenigenkänning (OCR) i Microsoft Syntex kan du extrahera tryckt eller handskriven text från bilder och dokument. Exempel på bilder är affischer, ritningar och produktetiketter. Exempel på dokument är artiklar, rapporter, formulär och fakturor.

Texten extraheras vanligtvis som ord, textrader och stycken eller textblock, vilket ger åtkomst till digital version av den skannade texten. Den extraherade informationen indexeras i sökningen och kan göras tillgänglig för efterlevnadsfunktioner som dataförlustskydd (DLP).

Du kan till exempel aktivera OCR-tjänsten och sedan lägga till bildfiler i dokumentbiblioteket. Microsoft Syntex söker igenom bildfilerna automatiskt, extraherar relevant text och gör texten från bilderna tillgänglig för sökning och indexering. Med den här funktionen kan du snabbt och korrekt hitta de nyckelord och fraser som du letar efter.

Krav och begränsningar

Filtyper som stöds

Slutpunkt Filtyper som stöds
SharePoint och OneDrive .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff och .pdf (endast bild)
Teams-, Exchange- och Windows-enheter .bmp, .png, .jpeg, .jpg, .tiff och .pdf (endast bild)

Obs!

När du tillämpar OCR på en bildfil lagras texten i kolumnen Extraherade textmetadata . När du tillämpar OCR på en PDF- eller TIFF-fil indexeras den extraherade texten i sökningen men är inte tillgänglig i metadatakolumnen.

Språk som stöds

OCR-tjänsten stöder mer än 150 språk.

Platser och lösningar som stöds

OCR-tjänsten stöder flera lösningar, enligt följande tabell. Mer information om efterlevnadslösningar finns i Platser och lösningar som stöds i Microsoft Purview.

Plats Lösning som stöds
Exchange Text är tillgänglig för slutanvändarsökning och sökdrivna lösningar.
Text är tillgänglig för efterlevnadslösningar.
SharePoint-webbplatser Text är tillgänglig för slutanvändarsökning och sökdrivna lösningar.
Text är tillgänglig för efterlevnadslösningar.
OneDrive-konton Text är tillgänglig för slutanvändarsökning och sökdrivna lösningar.
Text är tillgänglig för efterlevnadslösningar.
Teams chatt- och kanalmeddelande Text är tillgänglig för efterlevnadslösningar.
Enheter Text är tillgänglig för efterlevnadslösningar.

Filbegränsningar

  • Avbildningar måste vara mindre än 50 MB.

  • Bilderna måste vara minst 50 x 50 bildpunkter och inte större än 16 000 x 16 000 bildpunkter.

  • Bilder som laddas upp när OCR har aktiverats är de enda bilder som genomsöks.

  • Bilder som är inbäddade i Office-dokument stöds inte.