Optische tekenherkenning (OCR)-inzichten verkrijgen
Optische tekenherkenning (OCR)
OCR extraheert tekst uit afbeeldingen, zoals afbeeldingen, straatborden en producten in mediabestanden om inzichten te creëren.
OCR extraheert inzichten uit afgedrukte en handgeschreven tekst in meer dan 50 talen, waaronder uit een afbeelding met tekst in meerdere talen. Zie ondersteunde OCR-talen voor meer informatie.
Zie OCR-technologie voor meer informatie over OCR.
OCR-gebruiksvoorbeelden
- Diep zoeken naar mediabeelden voor afbeeldingen met borden, straatnamen of autolicentieplaten, bijvoorbeeld in rechtshandhaving.
- Tekst extraheren uit afbeeldingen in mediabestanden en deze vervolgens omzetten in meerdere talen in labels voor toegankelijkheid, bijvoorbeeld in media of entertainment.
- Merknamen in afbeeldingen detecteren en taggen voor vertaaldoeleinden, bijvoorbeeld in reclame en huisstijl.
- Tekst extraheren in afbeeldingen die vervolgens automatisch worden gelabeld en gecategoriseerd voor toegankelijkheid en toekomstig gebruik, bijvoorbeeld om inhoud te genereren bij een nieuwsbureau.
- Tekst extraheren in waarschuwingen in online instructies en vervolgens de tekst vertalen om te voldoen aan de lokale normen, bijvoorbeeld e-learning-instructies voor het gebruik van apparatuur.
De inzicht-JSON weergeven met de webportal
Zodra u een video hebt geüpload en geïndexeerd, zijn inzichten beschikbaar in JSON-indeling voor downloaden met behulp van de webportal.
- Selecteer het tabblad Bibliotheek .
- Selecteer media waarmee u wilt werken.
- Selecteer Downloaden en de Inzichten (JSON). Het JSON-bestand wordt geopend op een nieuw browsertabblad.
- Zoek naar het sleutelpaar dat wordt beschreven in het voorbeeldantwoord.
De API gebruiken
- Gebruik de aanvraag Video Index ophalen. We raden u aan door te geven
&includeSummarizedInsights=false
. - Zoek naar de sleutelparen die worden beschreven in het voorbeeldantwoord.
Voorbeeld van een antwoord
"ocr": [
{
"id": 1,
"text": "2017 Ruler",
"confidence": 0.4365,
"left": 901,
"top": 3,
"width": 80,
"height": 23,
"angle": 0,
"language": "en-US",
"instances": [
{
"adjustedStart": "0:00:45.5",
"adjustedEnd": "0:00:46",
"start": "0:00:45.5",
"end": "0:00:46"
},
{
"adjustedStart": "0:00:55",
"adjustedEnd": "0:00:55.5",
"start": "0:00:55",
"end": "0:00:55.5"
}
]
},
{
"id": 2,
"text": "2017 Ruler postppu - PowerPoint",
"confidence": 0.4712,
"left": 899,
"top": 4,
"width": 262,
"height": 48,
"angle": 0,
"language": "en-US",
"instances": [
{
"adjustedStart": "0:00:44.5",
"adjustedEnd": "0:00:45",
"start": "0:00:44.5",
"end": "0:00:45"
}
]
}
Belangrijk
Het is belangrijk om het overzicht van de transparantienotitie voor alle VI-functies te lezen. Elk inzicht heeft ook eigen transparantienotities:
OCR-notities
- Video Indexer heeft een OCR-limiet van 50.000 woorden per geïndexeerde video. Zodra de limiet is bereikt, worden er geen extra OCR-resultaten gegenereerd.
- Houd zorgvuldig rekening met de nauwkeurigheid van de resultaten, om nauwkeurigere detecties te bevorderen, controleer de kwaliteit van de afbeelding, afbeeldingen met lage kwaliteit kunnen van invloed zijn op de gedetecteerde inzichten.
- Houd zorgvuldig rekening met het gebruik van rechtshandhaving. OCR kan delen van de tekst verkeerd lezen of niet detecteren. Om eerlijke en hoogwaardige VI-bepaling te garanderen, combineert u ocr-gebaseerde automatisering met menselijk toezicht.
- Vermijd bij het extraheren van handgeschreven tekst de OCR-resultaten van handtekeningen die moeilijk te lezen zijn voor zowel mensen als machines. Een betere manier om OCR te gebruiken is door deze te gebruiken voor het detecteren van de aanwezigheid van een handtekening voor verdere analyse.
- Gebruik OCR niet voor beslissingen die ernstige nadelige gevolgen kunnen hebben voor personen of groepen. Machine learning-modellen die tekst extraheren, kunnen leiden tot niet-gedetecteerde of onjuiste tekstuitvoer. Beslissingen op basis van onjuiste uitvoer kunnen ernstige nadelige gevolgen hebben die moeten worden vermeden. U moet altijd menselijke beoordeling van beslissingen opnemen die het potentieel voor ernstige gevolgen voor personen hebben.
OCR-onderdelen
Tijdens de OCR-procedure worden tekstafbeeldingen in een mediabestand als volgt verwerkt:
Onderdeel | Definitie |
---|---|
Bronbestand | De gebruiker uploadt het bronbestand voor indexering. |
Model lezen | Afbeeldingen worden gedetecteerd in het mediabestand en de tekst en vervolgens geëxtraheerd en geanalyseerd door Azure AI-services. |
Model met leesresultaten ophalen | De uitvoer van de geëxtraheerde tekst wordt weergegeven in een JSON-bestand. |
Betrouwbaarheidswaarde | Het geschatte betrouwbaarheidsniveau van elk woord wordt berekend als een bereik van 0 tot 1. De betrouwbaarheidsscore vertegenwoordigt de zekerheid in de nauwkeurigheid van het resultaat. Een 82% zekerheid wordt bijvoorbeeld weergegeven als een score van 0,82. |