Optik karakter tanıma (OCR) içgörüleri alma

2025-06-05

OCR, içgörüler oluşturmak için medya dosyalarındaki resimler, sokak işaretleri ve ürünler gibi görüntülerden metin ayıklar.

OCR, birden çok dilde metin içeren bir resim de dahil olmak üzere 50'den fazla dilde yazdırılan ve el yazısı metinlerden içgörüler ayıklar. Daha fazla bilgi için bkz . Desteklenen OCR dilleri.

OCR hakkında daha fazla bilgi için bkz . OCR teknolojisi.

OCR kullanım örnekleri

Medya görüntülerini derinlemesine arayarak işaretler, sokak adları veya araç plakaları içeren resimler bulmak, örneğin kolluk kuvvetlerinde.
Medya dosyalarındaki görüntülerden metin ayıklama ve ardından bunları erişilebilirlik etiketlerindeki birden çok dile (örneğin medya veya eğlence) çevirme.
Görüntülerdeki marka adlarını algılama ve reklam ve markalama gibi çeviri amacıyla etiketleme.
Daha sonra otomatik olarak etiketlenen ve erişilebilirlik ve gelecekteki kullanım için kategorilere ayrılmış görüntülerdeki metinleri ayıklama ( örneğin, bir haber ajansında içerik oluşturmak için).
Çevrimiçi yönergelerde uyarılardaki metinleri ayıklama ve ardından yerel standartlara uyacak şekilde metni çevirme( örneğin, ekipman kullanımına yönelik e-öğrenme yönergeleri).

Web portalı ile içgörü JSON'unu görüntüleme

Videoyu karşıya yükleyip dizine ekledikten sonra web portalından JSON biçiminde içgörüler indirin.

Kitaplık sekmesini seçin.
İstediğiniz medyayı seçin.
İndir'i ve ardından İçgörüler (JSON) öğesini seçin. JSON dosyası yeni bir tarayıcı sekmesinde açılır.
Örnek yanıtta açıklanan anahtar çiftini bulun.

API’yi kullanma

Video Dizini Al isteği kullanın. geçirin &includeSummarizedInsights=false.
Örnek yanıtta açıklanan anahtar çiftlerini bulun.

Örnek yanıt

    "ocr": [
        {
          "id": 1,
          "text": "2017 Ruler",
          "confidence": 0.4365,
          "left": 901,
          "top": 3,
          "width": 80,
          "height": 23,
          "angle": 0,
          "language": "en-US",
          "instances": [
            {
              "adjustedStart": "0:00:45.5",
              "adjustedEnd": "0:00:46",
              "start": "0:00:45.5",
              "end": "0:00:46"
            },
            {
              "adjustedStart": "0:00:55",
              "adjustedEnd": "0:00:55.5",
              "start": "0:00:55",
              "end": "0:00:55.5"
            }
          ]
        },
        {
          "id": 2,
          "text": "2017 Ruler postppu - PowerPoint",
          "confidence": 0.4712,
          "left": 899,
          "top": 4,
          "width": 262,
          "height": 48,
          "angle": 0,
          "language": "en-US",
          "instances": [
            {
              "adjustedStart": "0:00:44.5",
              "adjustedEnd": "0:00:45",
              "start": "0:00:44.5",
              "end": "0:00:45"
            }
          ]
        }

Önemli

Tüm VI özellikleri için saydamlık notunun genel bakışını okuyun. Her içgörü ayrıca kendi saydamlık notlarına sahiptir.

OCR notları

Video Indexer,dizinlenmiş video başına 50.000 sözcük OCR sınırına sahiptir. Sınıra ulaşıldığında ek OCR sonucu oluşturulmaz.
Sonuçların doğruluğunu dikkatle değerlendirin, daha doğru algılamaları teşvik edin, görüntünün kalitesini kontrol edin, düşük kaliteli görüntüler algılanan içgörüleri etkileyebilir.
Kolluk kuvvetleri için kullanırken dikkatli bir şekilde göz önünde bulundurun. OCR metnin bölümlerini yanlış okuyabilir veya algılamayabilir. Adil ve yüksek kaliteli VI belirlemeleri sağlamak için OCR tabanlı otomasyonu insan gözetimiyle birleştirin.
El yazısı metin ayıklarken, hem insanlar hem de makineler için okunması zor imzaların OCR sonuçlarını kullanmaktan kaçının. OCR'yi kullanmanın daha iyi bir yolu, daha fazla analiz için imzanın varlığını algılamak için kullanmaktır.
Kişiler veya gruplar üzerinde ciddi olumsuz etkileri olabilecek kararlar için OCR kullanmayın. Metin ayıklayan makine öğrenmesi modelleri algılanmamış veya yanlış metin çıkışına neden olabilir. Yanlış çıkışa dayalı kararlar, kaçınılması gereken ciddi olumsuz etkilere neden olabilir. Bireyler üzerinde ciddi etkilere neden olabilecek kararların insan tarafından gözden geçirilmesini her zaman dahil etmelisiniz.

OCR bileşenleri

OCR yordamı sırasında, medya dosyasındaki metin görüntüleri aşağıdaki gibi işlenir:

Bileşen	Tanım
Kaynak dosya	Kullanıcı dizin oluşturmak için kaynak dosyayı karşıya yükler.
Modeli okuma	Medya dosyasında ve metinde görüntüler algılanır, ardından Azure AI hizmetleri tarafından ayıklanır ve analiz edilir.
Okuma sonuçları modelini al	Ayıklanan metnin çıktısı bir JSON dosyasında görüntülenir.
Güvenilirlik değeri	Her sözcüğün tahmini güvenilirlik düzeyi 0 ile 1 arasında bir aralık olarak hesaplanır. Güvenilirlik puanı, sonucun doğruluğundaki kesinliği temsil eder. Örneğin, %82'lik bir kesinlik 0,82 puanı olarak gösterilir.

Örnek kod

VI için tüm örneklere bakın