OCR - Optische tekenherkenning

Artikel
06/26/2024

OCR of Optical Character Recognition wordt ook wel tekstherkenning of tekstextractie genoemd. Met OCR-technieken op basis van machine learning kunt u gedrukte of handgeschreven tekst halen uit afbeeldingen, zoals posters, straatborden en productlabels, evenals documenten zoals artikelen, rapporten, formulieren en facturen. De tekst wordt meestal geëxtraheerd als woorden, tekstregels en alinea's of tekstblokken, waardoor de toegang tot de digitale versie van de gescande tekst mogelijk is. Dit elimineert of vermindert de noodzaak van handmatige gegevensinvoer.

OCR engine

De lees-OCR-engine van Microsoft bestaat uit meerdere geavanceerde machine learning-modellen die wereldwijde talen ondersteunen. Het kan gedrukte en handgeschreven tekst extraheren, waaronder gemengde talen en schrijfstijlen. Lezen is beschikbaar als cloudservice en on-premises container voor implementatieflexibiliteit. Het is ook beschikbaar als een synchrone API voor enkele scenario's zonder document, alleen-afbeeldingen met prestatieverbeteringen waarmee ocr-ondersteunde gebruikerservaringen eenvoudiger kunnen worden geïmplementeerd.

Waarschuwing

De verouderde OCR-API van Azure AI Vision in v3.2 en RecognizeText-API in v2.1-bewerkingen worden niet aanbevolen voor gebruik.

OCR-edities (Lezen)

Belangrijk

Selecteer de Read-editie die het beste past bij uw vereisten.

Invoer	Voorbeelden	Leeseditie	Voordeel
Afbeeldingen: Algemeen, in-the-wild afbeeldingen	labels, straatborden en posters	OCR voor installatiekopieën (versie 4.0)	Geoptimaliseerd voor algemene, niet-documentafbeeldingen met een synchrone API met verbeterde prestaties, waardoor ocr eenvoudiger kan worden ingesloten in uw gebruikerservaringsscenario's.
Documenten: Digitaal en gescand, inclusief afbeeldingen	boeken, artikelen en rapporten	Document Intelligence-leesmodel	Geoptimaliseerd voor tekstzware gescande en digitale documenten met een asynchrone API om intelligente documentverwerking op schaal te automatiseren.

Algemene beschikbaarheid van Azure AI Vision v3.2

Bent u op zoek naar de meest recente algemene beschikbaarheid van Azure AI Vision v3.2? Alle toekomstige verbeteringen voor lees-OCR maken deel uit van de twee services die eerder zijn vermeld. Er zijn geen verdere updates voor Azure AI Visie v3.2. Zie Voor meer informatie de Lees-API en quickstart van Azure AI Vision 3.2 aanroepen: Lees-API voor Azure AI Vision v3.2.

Intelligent Document Processing (IDP) maakt gebruik van OCR als basistechnologie om structuur, relaties, sleutelwaarden, entiteiten en andere documentgerichte inzichten te extraheren met een geavanceerde ai-service op basis van machine learning, zoals Document Intelligence. Document Intelligence bevat een voor documenten geoptimaliseerde versie van Read als OCR-engine en delegeren aan andere modellen voor inzichten die hoger zijn. Als u tekst uit gescande en digitale documenten extraheert, gebruikt u Document Intelligence Read OCR.

OCR gebruiken

Probeer OCR uit met behulp van Vision Studio. Volg vervolgens een van de koppelingen naar de Read-editie die het beste aan uw vereisten voldoet.

Vision Studio uitproberen

Schermopname: OCR-demo lezen in Vision Studio.

Ondersteunde OCR-talen

Beide leesversies die momenteel beschikbaar zijn in Azure AI Vision ondersteunen verschillende talen voor afgedrukte en handgeschreven tekst. OCR voor gedrukte tekst bevat ondersteuning voor Engels, Frans, Duits, Italiaans, Portugees, Spaans, Chinees, Japans, Koreaans, Russisch, Arabisch, Hindi en andere internationale talen die gebruikmaken van Latijnse, Cyrillische, Arabische en Devanagari-scripts. OCR voor handgeschreven tekst bevat ondersteuning voor Engels, Vereenvoudigd Chinees, Frans, Duits, Italiaans, Japans, Koreaans, Portugees en Spaans.

Raadpleeg de volledige lijst met talen die door OCR worden ondersteund.

Algemene OCR-functies

Het READ OCR-model is beschikbaar in Azure AI Vision en Document Intelligence met algemene basislijnmogelijkheden en optimaliseert voor de respectieve scenario's. De volgende lijst bevat een overzicht van de algemene functies:

Gedrukte en handgeschreven tekstextractie in ondersteunde talen
Pagina's, tekstregels en woorden met locatie- en betrouwbaarheidsscores
Ondersteuning voor gemengde talen, gemengde modus (afdrukken en handgeschreven)
Beschikbaar als Distroless Docker-container voor on-premises implementatie

De OCR-cloud-API's gebruiken of on-premises implementeren

De cloud-API's zijn de voorkeursoptie voor de meeste klanten vanwege hun gemak van integratie en snelle productiviteit. Azure en de Azure AI Vision-service verwerken schaal-, prestatie-, gegevensbeveiligings- en nalevingsbehoeften terwijl u zich richt op het voldoen aan de behoeften van uw klanten.

Voor on-premises implementatie kunt u met de Read Docker-container de algemeen beschikbare OCR-mogelijkheden van Azure AI Vision v3.2 implementeren in uw eigen lokale omgeving. Containers zijn ideaal voor specifieke vereisten voor beveiliging en gegevensbeheer.

OCR-gegevensprivacy en -beveiliging

Net als bij alle Azure AI-services moeten ontwikkelaars die de Azure AI Vision-service gebruiken, rekening houden met het beleid van Microsoft voor klantgegevens. Zie de pagina Azure AI-services in het Vertrouwenscentrum van Microsoft voor meer informatie.

Volgende stappen

OCR voor algemene (niet-document)afbeeldingen: probeer de quickstart over de REST API voor afbeeldingsanalyse van Azure AI Vision 4.0.
OCR voor PDF-, Office- en HTML-documenten en documentafbeeldingen: begin met Document Intelligence Lezen.
Zoekt u de vorige GA-versie? Raadpleeg de quickstarts voor de ALGEMENE SDK of REST API van Azure AI Vision 3.2.

Delen via

OCR - Optische tekenherkenning

OCR engine

OCR-edities (Lezen)

OCR gebruiken

Ondersteunde OCR-talen

Algemene OCR-functies

De OCR-cloud-API's gebruiken of on-premises implementeren

OCR-gegevensprivacy en -beveiliging

Volgende stappen

Feedback

Feedback

Aanvullende resources

Delen via

OCR - Optische tekenherkenning

OCR engine

OCR-edities (Lezen)

Hoe is OCR gerelateerd aan Intelligent Document Processing (IDP)?

OCR gebruiken

Ondersteunde OCR-talen

Algemene OCR-functies

De OCR-cloud-API's gebruiken of on-premises implementeren

OCR-gegevensprivacy en -beveiliging

Volgende stappen

Feedback

Feedback

Aanvullende resources