Aracılığıyla paylaş


Optik karakter tanıma (OCR)

Önemli

Azure Media Services kullanımdan kaldırma duyurusu nedeniyle Azure AI Video Indexer, Azure AI Video Indexer özelliklerinde yapılan ayarlamaları duyurur. Bunun Azure AI Video Indexer hesabınız için ne anlama geldiğini anlamak için bkz . Azure Media Service 'in (AMS) kullanımdan kaldırılmasıyla ilgili değişiklikler. AMS'yi kullanımdan kaldırmaya hazırlanma: VI güncelleştirme ve geçiş kılavuzuna bakın.

Optik karakter tanıma (OCR), içgörüler oluşturmak için medya dosyalarındaki resimler, sokak işaretleri ve ürünler gibi görüntülerden metin ayıklayan bir Azure AI Video Indexer AI özelliğidir.

OCR şu anda birden çok dilde metin içeren bir resim de dahil olmak üzere 50'den fazla dilde basılı ve el yazısı metinden içgörüler ayıklar. Daha fazla bilgi için bkz . Desteklenen OCR dilleri.

Önkoşullar

Saydamlık notunu gözden geçirme genel bakış

İçgörüleri görüntüleme

Web sitesinde çalışırken içgörüler Zaman Çizelgesi sekmesinde görüntülenir. Ayrıca kimlik, döküm metni, süre ve güvenilirlik puanını içeren bir JSON dosyasındaki kategorilere ayrılmış bir listede de oluşturulabilirler.

Web sitesindeki örnekleri görmek için aşağıdakileri yapın:

  1. Görüntüle'ye gidin ve OCR'yi denetleyin.
  2. Ayıklanan metni görüntülemek için Zaman Çizelgesi'ni seçin.

İçgörüler, kimlik, dil, metin ile birlikte her örneğin güvenilirlik puanını içeren bir JSON dosyasındaki kategorilere ayrılmış bir listede de oluşturulabilir.

JSON dosyasındaki içgörüleri görmek için aşağıdakileri yapın:

  1. İndir -> İçgörü (JSON) seçeneğini belirleyin.

  2. ocr öğesini insightsaltında kopyalayın ve çevrimiçi JSON görüntüleyicinize yapıştırın.

    "ocr": [
        {
          "id": 1,
          "text": "2017 Ruler",
          "confidence": 0.4365,
          "left": 901,
          "top": 3,
          "width": 80,
          "height": 23,
          "angle": 0,
          "language": "en-US",
          "instances": [
            {
              "adjustedStart": "0:00:45.5",
              "adjustedEnd": "0:00:46",
              "start": "0:00:45.5",
              "end": "0:00:46"
            },
            {
              "adjustedStart": "0:00:55",
              "adjustedEnd": "0:00:55.5",
              "start": "0:00:55",
              "end": "0:00:55.5"
            }
          ]
        },
        {
          "id": 2,
          "text": "2017 Ruler postppu - PowerPoint",
          "confidence": 0.4712,
          "left": 899,
          "top": 4,
          "width": 262,
          "height": 48,
          "angle": 0,
          "language": "en-US",
          "instances": [
            {
              "adjustedStart": "0:00:44.5",
              "adjustedEnd": "0:00:45",
              "start": "0:00:44.5",
              "end": "0:00:45"
            }
          ]
        },
    

JSON dosyasını API aracılığıyla indirmek için Azure AI Video Indexer geliştirici portalını kullanın.

OCR bileşenleri

OCR yordamı sırasında, medya dosyasındaki metin görüntüleri aşağıdaki gibi işlenir:

Bileşen Tanım
Kaynak dosya Kullanıcı dizin oluşturmak için kaynak dosyayı karşıya yükler.
Modeli okuma Medya dosyasında görüntüler algılanır ve metin daha sonra Azure AI hizmetleri tarafından ayıklanır ve analiz edilir.
Okuma sonuçları modeli alma Ayıklanan metnin çıkışı bir JSON dosyasında görüntülenir.
Güvenilirlik değeri Her sözcüğün tahmini güvenilirlik düzeyi 0 ile 1 arasında bir aralık olarak hesaplanır. Güvenilirlik puanı, sonucun doğruluğundaki kesinliği temsil eder. Örneğin, %82 kesinlik 0,82 puan olarak gösterilir.

Daha fazla bilgi için bkz . OCR teknolojisi.

Kullanım örnekleri

  • Medyada, örneğin kolluk kuvvetlerinde tabelalar, sokak adları veya araç plakaları olan görüntüler için ayrıntılı arama.
  • Medya dosyalarındaki görüntülerden metin ayıklama ve ardından bunları erişilebilirlik etiketlerindeki birden çok dile (örneğin medya veya eğlence) çevirme.
  • Görüntülerdeki marka adlarını algılama ve reklam ve markalama gibi çeviri amacıyla etiketleme.
  • Daha sonra otomatik olarak etiketlenen ve erişilebilirlik ve gelecekteki kullanım için kategorilere ayrılmış görüntülerdeki metinleri ayıklama ( örneğin, bir haber ajansında içerik oluşturmak için).
  • Çevrimiçi yönergelerde uyarılardaki metinleri ayıklama ve ardından yerel standartlara uyacak şekilde metni çevirme( örneğin, ekipman kullanımına yönelik e-öğrenme yönergeleri).

Kullanım örneği seçerken dikkat edilmesi gerekenler ve sınırlamalar

  • Video Indexer,dizinlenmiş video başına 50.000 sözcük OCR sınırına sahiptir. Sınıra ulaşıldıktan sonra ek OCR sonucu oluşturulmaz.
  • Sonuçların doğruluğunu dikkatle değerlendirin, daha doğru algılamaları teşvik edin, görüntünün kalitesini kontrol edin, düşük kaliteli görüntüler algılanan içgörüleri etkileyebilir.
  • OCR'nin metnin bazı bölümlerini yanlış okuyabileceğini veya algılamayabileceğini kolluk kuvvetleri için kullanırken dikkatli bir şekilde göz önünde bulundurun. Adil ve yüksek kaliteli kararlar almak için OCR tabanlı otomasyonu insan gözetimiyle birleştirin.
  • El yazısı metin ayıklarken, hem insanlar hem de makineler için okunması zor imzaların OCR sonuçlarını kullanmaktan kaçının. OCR'yi kullanmanın daha iyi bir yolu, daha fazla analiz için imzanın varlığını algılamak için kullanmaktır.
  • Ciddi olumsuz etkileri olabilecek kararlar için OCR kullanmayın. Metin ayıklayan makine öğrenmesi modelleri algılanmamış veya yanlış metin çıkışına neden olabilir. Yanlış çıkışa dayalı kararlar ciddi olumsuz etkilere neden olabilir. Ayrıca, bireyler üzerinde ciddi etkilere neden olabilecek kararların insan tarafından gözden geçirilmesi önerilir.

OCR hakkında daha fazla bilgi edinin