Overzicht van optische tekenherkenning in Microsoft Syntex

Artikel
10/23/2024

Opmerking

Tot juni 2025 kunt u gratis een beperkt aantal optische tekenherkenning en andere geselecteerde Syntex-services uitproberen als u betalen per gebruik-facturering hebt ingesteld. Zie Microsoft Syntex uitproberen en de services ervan verkennen voor informatie en beperkingen.

Met de OCR-service (Optical Character Recognition) in Microsoft Syntex kunt u gedrukte of handgeschreven tekst extraheren uit afbeeldingen en documenten. Voorbeelden van afbeeldingen zijn posters, tekeningen en productlabels. Voorbeelden van documenten zijn artikelen, rapporten, formulieren en facturen.

De tekst wordt meestal geëxtraheerd als woorden, tekstregels en alinea's of tekstblokken, zodat u toegang hebt tot de digitale versie van de gescande tekst. De geëxtraheerde informatie wordt geïndexeerd in de zoekfunctie en kan beschikbaar worden gesteld voor nalevingsfuncties, zoals preventie van gegevensverlies (DLP).

U schakelt bijvoorbeeld de OCR-service in en voegt vervolgens afbeeldingsbestanden toe aan uw documentbibliotheek. Microsoft Syntex scant de afbeeldingsbestanden automatisch, extraheert de relevante tekst en maakt de tekst uit de afbeeldingen beschikbaar voor zoeken en indexeren. Met deze functie kunt u snel en nauwkeurig de trefwoorden en woordgroepen vinden die u zoekt.

Vereisten en beperkingen

Ondersteunde bestandstypen

Eindpunt	Ondersteunde bestandstypen
SharePoint en OneDrive	`.bmp, .png, .jpeg, .jpg, .jfif, .arw, .cr2, .crw, .erf, .gif, .mef, .mrw, .nef, .nrw, .orf, .pef, .raw, .rw2, .rw1, .sr2, .tif, .tiff, .heic, .heif, .ari, .bay, .cap, .cr3, .dcs, .dcr, .drf, .eip, .fff, .iiq, .k25, .kdc, .mef, .mos, .ptx, .pxn, .raf, .rwl, .sr2, .srf, .srw, .x3f, .dng, .tiff, and .pdf`
Teams-, Exchange- en Windows-apparaten	`.bmp, .png, .jpeg, .jpg, .tiff, and .pdf`

Naast PDF op basis van afbeeldingen ondersteunt Syntex OCR vanaf november 2024 hybride PDF (tekst plus afbeelding PDF). Na die tijd worden nieuw geüploade hybride PDF-bestanden verwerkt door de OCR-service.

Opmerking

Wanneer u OCR toepast op een afbeeldingsbestand, wordt de tekst opgeslagen in de kolom Geëxtraheerde tekstmetagegevens . Wanneer u OCR toepast op een PDF- of TIFF-bestand, wordt de geëxtraheerde tekst geïndexeerd in de zoekfunctie, maar niet beschikbaar in de kolom met metagegevens.

Ondersteunde talen

De OCR-service ondersteunt meer dan 150 talen.

Ondersteunde locaties en oplossingen

De OCR-service ondersteunt meerdere oplossingen, zoals wordt weergegeven in de volgende tabel. Zie Ondersteunde locaties en oplossingen in Microsoft Purview voor meer informatie over nalevingsoplossingen.

Locatie	Ondersteunde oplossing
Exchange	Tekst is beschikbaar voor zoek- en zoekgestuurde oplossingen voor eindgebruikers. Tekst is beschikbaar voor nalevingsoplossingen.
SharePoint-sites	Tekst is beschikbaar voor zoek- en zoekgestuurde oplossingen voor eindgebruikers. Tekst is beschikbaar voor nalevingsoplossingen.
OneDrive-accounts	Tekst is beschikbaar voor zoek- en zoekgestuurde oplossingen voor eindgebruikers. Tekst is beschikbaar voor nalevingsoplossingen.
Chat- en kanaalbericht van Teams	Tekst is beschikbaar voor nalevingsoplossingen.
Apparaten	Tekst is beschikbaar voor nalevingsoplossingen.

Bestandbeperkingen

Afbeeldingen moeten kleiner zijn dan 50 MB.
Afbeeldingen moeten ten minste 50 x 50 pixels en niet groter zijn dan 16.000 x 16.000 pixels.
Afbeeldingen die zijn geüpload nadat OCR is ingeschakeld, zijn de enige afbeeldingen die worden gescand.
Afbeeldingen die zijn ingesloten in Office-documenten, worden niet ondersteund.

Delen via