Optik karakter tanıma (OCR) içgörüleri alma

Makale
10/09/2024

Optik karakter tanıma (OCR)

OCR, içgörüler oluşturmak için medya dosyalarındaki resimler, sokak işaretleri ve ürünler gibi görüntülerden metin ayıklar.

OCR, birden çok dilde metin içeren bir resim de dahil olmak üzere 50'den fazla dilde yazdırılan ve el yazısı metinlerden içgörüler ayıklar. Daha fazla bilgi için bkz . Desteklenen OCR dilleri.

OCR hakkında daha fazla bilgi için bkz . OCR teknolojisi.

OCR kullanım örnekleri

Medyada, örneğin kolluk kuvvetlerinde tabelalar, sokak adları veya araç plakaları olan görüntüler için ayrıntılı arama.
Medya dosyalarındaki görüntülerden metin ayıklama ve ardından bunları erişilebilirlik etiketlerindeki birden çok dile (örneğin medya veya eğlence) çevirme.
Görüntülerdeki marka adlarını algılama ve reklam ve markalama gibi çeviri amacıyla etiketleme.
Daha sonra otomatik olarak etiketlenen ve erişilebilirlik ve gelecekteki kullanım için kategorilere ayrılmış görüntülerdeki metinleri ayıklama ( örneğin, bir haber ajansında içerik oluşturmak için).
Çevrimiçi yönergelerde uyarılardaki metinleri ayıklama ve ardından yerel standartlara uyacak şekilde metni çevirme( örneğin, ekipman kullanımına yönelik e-öğrenme yönergeleri).

Web portalı ile içgörü JSON'unu görüntüleme

Bir videoyu karşıya yükleyip dizine ekledikten sonra, web portalını kullanarak indirmek için JSON biçiminde içgörüler sağlanır.

Kitaplık sekmesini seçin.
Çalışmak istediğiniz medyayı seçin.
İndir'i ve İçgörüler 'i (JSON) seçin. JSON dosyası yeni bir tarayıcı sekmesinde açılır.
Örnek yanıtta açıklanan anahtar çiftini arayın.

API’yi kullanma

Video Dizini Al isteğini kullanın. geçirmenizi &includeSummarizedInsights=falseöneririz.
Örnek yanıtta açıklanan anahtar çiftlerini arayın.

Örnek yanıt

    "ocr": [
        {
          "id": 1,
          "text": "2017 Ruler",
          "confidence": 0.4365,
          "left": 901,
          "top": 3,
          "width": 80,
          "height": 23,
          "angle": 0,
          "language": "en-US",
          "instances": [
            {
              "adjustedStart": "0:00:45.5",
              "adjustedEnd": "0:00:46",
              "start": "0:00:45.5",
              "end": "0:00:46"
            },
            {
              "adjustedStart": "0:00:55",
              "adjustedEnd": "0:00:55.5",
              "start": "0:00:55",
              "end": "0:00:55.5"
            }
          ]
        },
        {
          "id": 2,
          "text": "2017 Ruler postppu - PowerPoint",
          "confidence": 0.4712,
          "left": 899,
          "top": 4,
          "width": 262,
          "height": 48,
          "angle": 0,
          "language": "en-US",
          "instances": [
            {
              "adjustedStart": "0:00:44.5",
              "adjustedEnd": "0:00:45",
              "start": "0:00:44.5",
              "end": "0:00:45"
            }
          ]
        }

Önemli

Tüm VI özellikleri için saydamlık notunun genel bakışını okumak önemlidir. Her içgörüde kendi saydamlık notları da vardır:

OCR notları

Video Indexer,dizinlenmiş video başına 50.000 sözcük OCR sınırına sahiptir. Sınıra ulaşıldığında ek OCR sonucu oluşturulmaz.
Sonuçların doğruluğunu dikkatle değerlendirin, daha doğru algılamaları teşvik edin, görüntünün kalitesini kontrol edin, düşük kaliteli görüntüler algılanan içgörüleri etkileyebilir.
Kolluk kuvvetleri için kullanırken dikkatli bir şekilde göz önünde bulundurun. OCR metnin bölümlerini yanlış okuyabilir veya algılamayabilir. Adil ve yüksek kaliteli VI belirlemeleri sağlamak için OCR tabanlı otomasyonu insan gözetimiyle birleştirin.
El yazısı metin ayıklarken, hem insanlar hem de makineler için okunması zor imzaların OCR sonuçlarını kullanmaktan kaçının. OCR'yi kullanmanın daha iyi bir yolu, daha fazla analiz için imzanın varlığını algılamak için kullanmaktır.
Kişiler veya gruplar üzerinde ciddi olumsuz etkileri olabilecek kararlar için OCR kullanmayın. Metin ayıklayan makine öğrenmesi modelleri algılanmamış veya yanlış metin çıkışına neden olabilir. Yanlış çıkışa dayalı kararlar, kaçınılması gereken ciddi olumsuz etkilere neden olabilir. Bireyler üzerinde ciddi etkilere neden olabilecek kararların insan tarafından gözden geçirilmesini her zaman dahil etmelisiniz.

OCR bileşenleri

OCR yordamı sırasında, medya dosyasındaki metin görüntüleri aşağıdaki gibi işlenir:

Bileşen	Tanım
Kaynak dosya	Kullanıcı dizin oluşturmak için kaynak dosyayı karşıya yükler.
Modeli okuma	Medya dosyasında ve metinde görüntüler algılanır, ardından Azure AI hizmetleri tarafından ayıklanır ve analiz edilir.
Okuma sonuçları modeli alma	Ayıklanan metnin çıkışı bir JSON dosyasında görüntülenir.
Güvenilirlik değeri	Her sözcüğün tahmini güvenilirlik düzeyi 0 ile 1 arasında bir aralık olarak hesaplanır. Güvenilirlik puanı, sonucun doğruluğundaki kesinliği temsil eder. Örneğin, %82'lik bir kesinlik 0,82 puanı olarak gösterilir.

Örnek kod

VI için tüm örneklere bakın

Aracılığıyla paylaş

Optik karakter tanıma (OCR) içgörüleri alma