OCR - Optik Karakter Tanıma

OCR veya Optik Karakter Tanıma, metin tanıma veya metin ayıklama olarak da adlandırılır. Makine öğrenmesi tabanlı OCR teknikleri posterler, sokak işaretleri ve ürün etiketleri gibi görüntülerin yanı sıra makaleler, raporlar, formlar ve faturalar gibi belgelerden basılı veya el yazısı metinleri ayıklamanıza olanak sağlar. Metin genellikle sözcükler, metin satırları ve paragraflar veya metin blokları olarak ayıklanır ve taranan metnin dijital sürümüne erişim sağlanır. Bu, el ile veri girişi gereksinimini ortadan kaldırır veya önemli ölçüde azaltır.

Akıllı Belge İşleme (IDP), Belge Zekası gibi gelişmiş makine öğrenmesi tabanlı yapay zeka hizmetiyle yapı, ilişkiler, anahtar-değerler, varlıklar ve diğer belge merkezli içgörüleri ayıklamak için temel teknolojisi olarak OCR'yi kullanır. Belge Zekası, daha üst düzey içgörüler için diğer modellere temsilci eklerken OCR altyapısı olarak Read'in belge için iyileştirilmiş bir sürümünü içerir. Taranmış ve dijital belgelerden metin ayıklanıyorsanız, Belge Zekası Okuma OCR'yi kullanın.

OCR altyapısı

Microsoft'un Read OCR altyapısı, genel dilleri destekleyen birden fazla gelişmiş makine öğrenmesi tabanlı modelden oluşur. Karışık diller ve yazma stilleri dahil olmak üzere yazdırılan ve el yazısı metinleri ayıklayabilir. Okuma , dağıtım esnekliği için bulut hizmeti ve şirket içi kapsayıcı olarak kullanılabilir. En son önizleme ile, OCR destekli kullanıcı deneyimlerini uygulamayı kolaylaştıran performans geliştirmelerine sahip tek, belge dışı, yalnızca görüntü senaryoları için zaman uyumlu API olarak da kullanılabilir.

Uyarı

v3.2'deki Azure AI Vision eski OCR API'si ve v2.1 işlemlerinde RecognizeText API'sinin kullanılması önerilmez.

OCR (Okuma) sürümleri

Önemli

Gereksinimlerinize en uygun Okuma sürümünü seçin.

Girdi Örnekler Okuma sürümü Avantaj
Görüntüler: Genel, vahşi görüntüler etiketler, sokak işaretleri ve posterler Görüntüler için OCR (sürüm 4.0) Kullanıcı deneyimi senaryolarınıza OCR eklemeyi kolaylaştıran, performans açısından geliştirilmiş zaman uyumlu API'ye sahip genel, belge dışı görüntüler için iyileştirilmiştir.
Belgeler: Resimler de dahil olmak üzere dijital ve taranmış kitaplar, makaleler ve raporlar Belge Zekası okuma modeli Akıllı belge işlemeyi büyük ölçekte otomatikleştirmeye yardımcı olmak için zaman uyumsuz API ile metin ağırlıklı taranmış ve dijital belgeler için iyileştirilmiştir.

Azure AI Vision v3.2 GA Okuma hakkında

En son Azure AI Vision v3.2 GA Okumasını mı arıyorsunuz? Gelecekteki tüm Okuma OCR geliştirmeleri, daha önce listelenen iki hizmetin bir parçasıdır. Azure AI Vision v3.2'de başka güncelleştirme yok. Daha fazla bilgi için bkz . Azure AI Vision 3.2 GA Okuma API'sini çağırma ve Hızlı Başlangıç: Azure AI Vision v3.2 GA Okuma.

OCR'yi kullanma

Vision Studio'yu kullanarak OCR'i deneyin. Ardından, gereksinimlerinizi en iyi karşılayan Read sürümünün bağlantılarından birini izleyin.

Screenshot: Read OCR demo in Vision Studio.

OCR tarafından desteklenen diller

Bugün Azure AI Vision'da kullanılabilen her iki Okuma sürümü de yazdırılan ve el yazısı metinler için çeşitli dilleri destekler. Yazdırılan metinler için OCR, İngilizce, Fransızca, Almanca, İtalyanca, Portekizce, İspanyolca, Çince, Japonca, Korece, Rusça, Arapça, Hintçe ve Latin, Kiril, Arapça ve Devanagari betikleri kullanan diğer uluslararası diller için destek içerir. El yazısı metin için OCR, İngilizce, Basitleştirilmiş Çince, Fransızca, Almanca, İtalyanca, Japonca, Korece, Portekizce ve İspanyolca dilleri için destek içerir.

OCR tarafından desteklenen dillerin tam listesine bakın.

OCR ortak özellikleri

Okuma OCR modeli, Azure AI Görüntü İşleme ve Belge Zekası'nda, ilgili senaryolar için iyileştirme yaparken ortak temel özelliklerle kullanılabilir. Aşağıdaki listede ortak özellikler özetlenmiştir:

  • Desteklenen dillerde basılı ve el yazısı metin ayıklama
  • Konum ve güvenilirlik puanlarına sahip sayfalar, metin satırları ve sözcükler
  • Karma diller, karma mod (yazdırma ve el yazısı) desteği
  • Şirket içi dağıtım için Distroless Docker kapsayıcısı olarak kullanılabilir

OCR bulut API'lerini kullanma veya şirket içi dağıtma

Bulut API'leri, tümleştirme kolaylığı ve hızlı üretkenlik özellikleri sayesinde çoğu müşteri için tercih edilen seçenektir. Siz müşterilerinizin ihtiyaçlarını karşılamaya odaklanırken Azure ve Azure AI Vision hizmeti ölçek, performans, veri güvenliği ve uyumluluk gereksinimlerini ele alır.

Şirket içi dağıtım için Read Docker kapsayıcısı, Azure AI Vision v3.2 genel kullanıma sunulan OCR özelliklerini kendi yerel ortamınızda dağıtmanıza olanak tanır. Kapsayıcılar, belirli güvenlik ve veri idare gereksinimleri için çok kullanışlıdır.

OCR veri gizliliği ve güvenliği

Tüm Azure yapay zeka hizmetlerinde olduğu gibi, Azure AI Vision hizmetini kullanan geliştiriciler de Microsoft'un müşteri verilerine yönelik ilkelerinin farkında olmalıdır. Daha fazla bilgi edinmek için Microsoft Güven Merkezi'nin Azure AI hizmetleri sayfasına bakın.

Sonraki adımlar