Az optikai karakterfelismerés áttekintése Microsoft Syntex
Megjegyzés:
2025 júniusában díjmentesen kipróbálhatja az optikai karakterfelismerést és más kiválasztott Syntex-szolgáltatásokat, ha használatalapú fizetéses számlázást állított be. További információ és korlátozások: Próbálja ki Microsoft Syntex és fedezze fel a szolgáltatásait.
A Microsoft Syntex optikai karakterfelismerési (OCR) szolgáltatásával nyomtatott vagy kézzel írt szöveget nyerhet ki képekből és dokumentumokból. Képek például plakátok, rajzok és termékcímkék. A dokumentumok közé tartoznak például cikkek, jelentések, űrlapok és számlák.
A szöveget általában szavak, szövegsorok, bekezdések vagy szövegblokkok formájában nyerik ki, így hozzáférést biztosítanak a beolvasott szöveg digitális verziójához. A kinyert információkat a rendszer indexeli a keresésben, és elérhetővé tehető olyan megfelelőségi funkciókhoz, mint az adatveszteség-megelőzés (DLP).
Engedélyezheti például az OCR szolgáltatást, majd képfájlokat adhat hozzá a dokumentumtárhoz. Microsoft Syntex automatikusan megvizsgálja a képfájlokat, kinyeri a megfelelő szöveget, és elérhetővé teszi a képek szövegét kereséshez és indexeléshez. Ezzel a funkcióval gyorsan és pontosan megtalálhatja a keresett kulcsszavakat és kifejezéseket.
Követelmények és korlátozások
Támogatott fájltípusok
Végpont | Támogatott fájltípusok |
---|---|
SharePoint és OneDrive | .bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf |
Teams-, Exchange- és Windows-eszközök | .bmp, .png, .jpeg, .jpg, .tiff, and .pdf |
A képalapú PDF mellett a Syntex OCR 2024 novemberétől támogatja a hibrid PDF -t (szöveg és kép PDF) is. Ezután az újonnan feltöltött hibrid PDF-fájlokat az OCR szolgáltatás dolgozza fel.
Megjegyzés:
Amikor OCR-t alkalmaz egy képfájlra, a szöveg a Kinyert szöveg metaadatai oszlopban lesz tárolva. Ha OCR-t alkalmaz egy PDF- vagy TIFF-fájlra, a kinyert szöveg indexelve lesz a keresésben, de nem érhető el a metaadatok oszlopában.
Támogatott nyelvek
Az OCR szolgáltatás több mint 150 nyelvet támogat.
Támogatott helyek és megoldások
Az OCR szolgáltatás több megoldást is támogat az alábbi táblázatban látható módon. A megfelelőségi megoldásokkal kapcsolatos részletekért lásd: Támogatott helyek és megoldások a Microsoft Purview-ban.
Hely | Támogatott megoldás |
---|---|
Exchange | A szöveg a végfelhasználói kereséshez és a keresésalapú megoldásokhoz érhető el. A megfelelőségi megoldásokhoz szöveg érhető el. |
SharePoint-webhelyek | A szöveg a végfelhasználói kereséshez és a keresésalapú megoldásokhoz érhető el. A megfelelőségi megoldásokhoz szöveg érhető el. |
OneDrive-fiókok | A szöveg a végfelhasználói kereséshez és a keresésalapú megoldásokhoz érhető el. A megfelelőségi megoldásokhoz szöveg érhető el. |
Teams-csevegés és -csatornaüzenet | A megfelelőségi megoldásokhoz szöveg érhető el. |
Eszközök | A megfelelőségi megoldásokhoz szöveg érhető el. |
Fájlkorlátozások
A képeknek 50 MB-nál kisebbnek kell lenniük.
A képeknek legalább 50 x 50 képpontnak kell lenniük, és nem lehetnek nagyobbak 16 000 x 16 000 képpontnál.
Az OCR engedélyezése után feltöltött képek az egyetlen beolvasott képek.
Az Office-dokumentumokba beágyazott képek nem támogatottak.