Delen via


Optische tekenherkenning (OCR)-inzichten verkrijgen

Waarschuwing

In het afgelopen jaar kondigde Azure AI Video Indexer (VI) de verwijdering aan van de afhankelijkheid van Azure Media Services (AMS) vanwege de buitengebruikstelling. Er zijn aanpassingen en wijzigingen van functies aangekondigd en er is een migratiehandleiding gegeven.

De deadline voor het voltooien van de migratie was 30 juni 2024. VI heeft de deadline voor het bijwerken/migreren verlengd, zodat u uw VI-account kunt bijwerken en u kunt aanmelden voor de migratie van AMS VI-assets tot en met 15 juli 2024. Als u de AMS VI-assetmigratie wilt gebruiken, moet u uw AMS-account ook uitbreiden tot juli. Navigeer naar uw AMS-account in Azure Portal en selecteer Klik hier om uit te breiden.

Als u na 30 juni uw VI-account niet hebt bijgewerkt, kunt u echter geen nieuwe video's indexeren en kunt u ook geen video's afspelen die niet zijn gemigreerd. Als u uw account na 30 juni bijwerkt, kunt u de indexering onmiddellijk hervatten, maar kunt u video's die zijn geïndexeerd niet afspelen vóór de accountupdate totdat ze zijn gemigreerd via de AMS VI-migratie.

Optische tekenherkenning (OCR)

OCR extraheert tekst uit afbeeldingen, zoals afbeeldingen, straatborden en producten in mediabestanden om inzichten te creëren.

OCR extraheert inzichten uit afgedrukte en handgeschreven tekst in meer dan 50 talen, waaronder uit een afbeelding met tekst in meerdere talen. Zie ondersteunde OCR-talen voor meer informatie.

Zie OCR-technologie voor meer informatie over OCR.

OCR-gebruiksvoorbeelden

  • Diep zoeken naar mediabeelden voor afbeeldingen met borden, straatnamen of autolicentieplaten, bijvoorbeeld in rechtshandhaving.
  • Tekst extraheren uit afbeeldingen in mediabestanden en deze vervolgens omzetten in meerdere talen in labels voor toegankelijkheid, bijvoorbeeld in media of entertainment.
  • Merknamen in afbeeldingen detecteren en taggen voor vertaaldoeleinden, bijvoorbeeld in reclame en huisstijl.
  • Tekst extraheren in afbeeldingen die vervolgens automatisch worden gelabeld en gecategoriseerd voor toegankelijkheid en toekomstig gebruik, bijvoorbeeld om inhoud te genereren bij een nieuwsbureau.
  • Tekst extraheren in waarschuwingen in online instructies en vervolgens de tekst vertalen om te voldoen aan de lokale normen, bijvoorbeeld e-learning-instructies voor het gebruik van apparatuur.

De inzicht-JSON weergeven met de webportal

Zodra u een video hebt geüpload en geïndexeerd, zijn inzichten beschikbaar in JSON-indeling voor downloaden met behulp van de webportal.

  1. Selecteer het tabblad Bibliotheek .
  2. Selecteer media waarmee u wilt werken.
  3. Selecteer Downloaden en de Inzichten (JSON). Het JSON-bestand wordt geopend op een nieuw browsertabblad.
  4. Zoek naar het sleutelpaar dat wordt beschreven in het voorbeeldantwoord.

De API gebruiken

  1. Gebruik de aanvraag Video Index ophalen. We raden u aan door te geven &includeSummarizedInsights=false.
  2. Zoek naar het sleutelpaar dat wordt beschreven in het voorbeeldantwoord.
    "ocr": [
        {
          "id": 1,
          "text": "2017 Ruler",
          "confidence": 0.4365,
          "left": 901,
          "top": 3,
          "width": 80,
          "height": 23,
          "angle": 0,
          "language": "en-US",
          "instances": [
            {
              "adjustedStart": "0:00:45.5",
              "adjustedEnd": "0:00:46",
              "start": "0:00:45.5",
              "end": "0:00:46"
            },
            {
              "adjustedStart": "0:00:55",
              "adjustedEnd": "0:00:55.5",
              "start": "0:00:55",
              "end": "0:00:55.5"
            }
          ]
        },
        {
          "id": 2,
          "text": "2017 Ruler postppu - PowerPoint",
          "confidence": 0.4712,
          "left": 899,
          "top": 4,
          "width": 262,
          "height": 48,
          "angle": 0,
          "language": "en-US",
          "instances": [
            {
              "adjustedStart": "0:00:44.5",
              "adjustedEnd": "0:00:45",
              "start": "0:00:44.5",
              "end": "0:00:45"
            }
          ]
        }