Yleiskatsaus optisen merkintunnistuksen Microsoft Syntex

Artikkeli
10/23/2024

Huomautus

Kesäkuuhun 2025 asti voit kokeilla optisen merkintunnistuksen ja muita valittuja Syntex-palveluita maksutta, jos käytön mukaan laskuttaminen on valmis. Lisätietoja ja rajoituksia on kohdassa Microsoft Syntex kokeileminen ja tutustuminen sen palveluihin.

Microsoft Syntex optisen tekstintunnistuspalvelun avulla voit poimia tulostettua tai käsinkirjoitettua tekstiä kuvista ja asiakirjoista. Esimerkkejä kuvista ovat julisteet, piirustukset ja tuote-etiketit. Esimerkkejä asiakirjoista ovat artikkelit, raportit, lomakkeet ja laskut.

Teksti poimitaan yleensä sanoiksi, tekstiriveiksi ja kappaleiksi tai tekstilohkoiksi, mikä mahdollistaa skannatun tekstin digitaalisen version käyttämisen. Poimitut tiedot on indeksoitu haussa, ja ne voidaan antaa yhteensopivuusominaisuuksien, kuten tietojen menetyksen estämisen (DLP) käyttöön.

Voit esimerkiksi ottaa OCR-palvelun käyttöön ja lisätä sitten kuvatiedostoja tiedostokirjastoosi. Microsoft Syntex tarkistaa kuvatiedostot automaattisesti, purkaa asianmukaisen tekstin ja asettaa kuvien tekstin haun ja indeksoimisen käytettäväksi. Tämän ominaisuuden avulla löydät etsimäsi avainsanat ja lauseet nopeasti ja tarkasti.

Vaatimukset ja rajoitukset

Tuetut tiedostotyypit

Päätepiste	Tuetut tiedostotyypit
SharePoint ja OneDrive	`.bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf`
Teams-, Exchange- ja Windows-laitteet	`.bmp, .png, .jpeg, .jpg, .tiff, and .pdf`

Kuvapohjaisen PDF-tiedoston lisäksi Syntex OCR tukee hybridi-PDF:ää (teksti ja kuva PDF) marraskuusta 2024 alkaen. Tämän jälkeen OCR-palvelu käsittelee juuri ladatut hybridi-PDF:t.

Huomautus

Kun käytät OCR-tekstintunnistusta kuvatiedostossa, teksti tallennetaan Poimitun tekstin metatiedot -sarakkeeseen. Kun otat OCR-tekstintunnistuksen käyttöön PDF- tai TIFF-tiedostossa, poimittu teksti indeksoidaan haussa, mutta se ei ole käytettävissä metatietosarakkeessa.

Tuetut kielet

OCR-palvelu tukee yli 150 kieltä.

Tuetut sijainnit ja ratkaisut

OCR-palvelu tukee useita ratkaisuja, kuten seuraavassa taulukossa esitetään. Lisätietoja yhteensopivuusratkaisuista on artikkelissa Microsoft Purview'n tuetut sijainnit ja ratkaisut.

Sijainti	Tuettu ratkaisu
Exchange	Teksti on käytettävissä loppukäyttäjän haku- ja hakupohjaisissa ratkaisuissa. Teksti on saatavilla yhteensopivuusratkaisuille.
SharePoint-sivustot	Teksti on käytettävissä loppukäyttäjän haku- ja hakupohjaisissa ratkaisuissa. Teksti on saatavilla yhteensopivuusratkaisuille.
OneDrive-tilit	Teksti on käytettävissä loppukäyttäjän haku- ja hakupohjaisissa ratkaisuissa. Teksti on saatavilla yhteensopivuusratkaisuille.
Teams-keskustelu- ja kanavaviesti	Teksti on saatavilla yhteensopivuusratkaisuille.
Laitteet	Teksti on saatavilla yhteensopivuusratkaisuille.

Tiedostorajoitukset

Kuvien on oltava pienempiä kuin 50 Mt.
Kuvien on oltava vähintään 50 x 50 kuvapistettä, eivätkä ne saa olla suurempia kuin 16 000 x 16 000 kuvapistettä.
OCR-tekstintunnistuksen käyttöönoton jälkeen ladatut kuvat ovat ainoita skannattuja kuvia.
Office-asiakirjoihin upotettuja kuvia ei tueta.

Jaa