OCR - Optik Karakter Tanıma

Uyarı

Döküm Araçları'ndaki Azure Vision eski OCR API'si v3.2 ve RecognizeText API v2.1 dahil olmak üzere bu hizmetin kullanılmasını önermiyoruz.

OCR (Okuma) sürümleri

Önemli

Gereksinimlerinize en uygun Okuma sürümünü seçin.

Giriş	Örnekler	Basımı Oku	Avantaj
Görüntüler: Genel, vahşi görüntüler	etiketler, sokak işaretleri ve posterler	Görüntüler için OCR (sürüm 4.0)	Kullanıcı deneyimi senaryolarınıza OCR eklemeyi kolaylaştıran, performans açısından geliştirilmiş zaman uyumlu API'ye sahip genel, belge dışı görüntüler için iyileştirilmiştir.
Belgeler: Resimler de dahil olmak üzere dijital ve taranmış	kitaplar, makaleler ve raporlar	Belge Zekası okuma modeli	Metin ağırlıklı taranmış ve dijital belgeler için, büyük ölçekte akıllı belge işlemeyi otomatikleştirmeye yardımcı olacak zaman uyumsuz bir API ile optimize edilmiştir.

Azure Vision v3.2 GA Hakkında Bilgilendirme

En son Azure Vision v3.2 GA Read'i mi arıyorsunuz? Gelecekteki tüm Okuma OCR geliştirmeleri, daha önce listelenen iki hizmetin bir parçasıdır. Azure Vision v3.2'de başka güncelleştirme yok. Daha fazla bilgi için bkz. Azure Vision 3.2 GA Okuma API'sini çağırma ve Hızlı Başlangıç: Azure Vision v3.2 GA Okuma.

OCR veya Optik Karakter Tanıma, metin tanıma veya metin ayıklama olarak da adlandırılır. Makine öğrenmesi tabanlı OCR teknikleri posterler, sokak işaretleri ve ürün etiketleri gibi görüntülerin yanı sıra makaleler, raporlar, formlar ve faturalar gibi belgelerden yazdırılan veya el yazısı metinleri ayıklamanıza olanak sağlar. Metin genellikle sözcükler, metin satırları ve paragraflar veya metin blokları olarak ayıklanır ve taranan metnin dijital sürümüne erişim sağlanır. Bu özellik, el ile veri girişi gereksinimini ortadan kaldırır veya önemli ölçüde azaltır.

OCR altyapısı

Microsoft'un Read OCR altyapısı , genel dilleri destekleyen birden çok gelişmiş makine öğrenmesi modeli kullanır. Karışık diller ve yazma stilleri de dahil olmak üzere basılı ve el yazısı metinleri ayıklar. Okuma özelliğini bir bulut hizmeti olarak veya esnek dağıtım için şirket içi kapsayıcı olarak kullanabilirsiniz. API aynı zamanda, OCR destekli kullanıcı deneyimlerini uygulamayı basitleştiren performans iyileştirmelerine sahip, tekli, belgedışı, yalnızca görüntü senaryoları için senkron bir API olarak da kullanılabilir.

Akıllı Belge İşleme (IDP), Belge Zekası gibi gelişmiş makine öğrenmesi tabanlı yapay zeka hizmetiyle yapı, ilişkiler, anahtar-değerler, varlıklar ve diğer belge merkezli içgörüleri ayıklamak için temel teknolojisi olarak OCR kullanır. Belge Zekası, OCR altyapısı olarak belge için iyileştirilmiş bir sürümünü kullandığı Read'i içerirken daha üst düzey içgörüler için diğer modelleri devreye sokar. Taranmış ve dijital belgelerden metin ayıklarsanız , Belge Zekası Okuma OCR'yi kullanın.

OCR tarafından desteklenen diller

Bugün Azure Vision'da kullanılabilen her iki Okuma sürümü de yazdırılan ve el yazısı metinler için çeşitli dilleri destekler. Yazdırılan metin için OCR, İngilizce, Fransızca, Almanca, İtalyanca, Portekizce, İspanyolca, Çince, Japonca, Korece, Rusça, Arapça, Hintçe ve Latin, Kiril, Arapça ve Devanagari betikleri kullanan diğer uluslararası dilleri destekler. El yazısı metin için OCR İngilizce, Basitleştirilmiş Çince, Fransızca, Almanca, İtalyanca, Japonca, Korece, Portekizce ve İspanyolca dillerini destekler.

OCR tarafından desteklenen dillerin tam listesine bakın.

OCR ortak özellikleri

Okuma OCR modeli, Azure Görüntü İşleme ve Belge Zekası'nda, ilgili senaryolar için iyileştirilirken ortak temel özelliklerle kullanılabilir. Aşağıdaki listede ortak özellikler özetlenmiştir:

Desteklenen dillerde basılı ve el yazısı metin ayıklama
Konum ve güvenilirlik puanlarına sahip sayfalar, metin satırları ve sözcükler
Karma diller, karma mod (yazdırma ve el yazısı) desteği
Şirket içi dağıtım için Distroless Docker kapsayıcısı olarak kullanılabilir

OCR bulut API'lerini kullanma veya şirket içi dağıtma

Müşterilerin çoğu bulut API'lerini tercih eder çünkü kolayca tümleştirilip hızlı üretkenlik sunarlar. Siz müşterilerinizin gereksinimlerini karşılamaya odaklanırken Azure ve Azure Vision hizmeti ölçek, performans, veri güvenliği ve uyumluluk gereksinimlerini karşılar.

Şirket içi dağıtım için Read Docker kapsayıcısı , Azure Vision v3.2 genel olarak kullanılabilir OCR özelliklerini kendi yerel ortamınızda dağıtmanıza olanak tanır. Kapsayıcılar, belirli güvenlik ve veri idare gereksinimleri için çok kullanışlıdır.

Giriş gereksinimleri

Okuma API'si, görüntüleri ve belgeleri giriş olarak alır. Görüntüler ve belgeler aşağıdaki gereksinimleri karşılamalıdır:

Desteklenen dosya biçimleri JPEG, PNG, BMP, PDF ve TIFF'dir.
PDF ve TIFF dosyaları için en fazla 2.000 sayfa işlenir (ücretsiz katmanın yalnızca ilk iki sayfası).
Görüntülerin dosya boyutu en az 50 x 50 piksel ve en fazla 10.000 x 10.000 piksel boyuta sahip 500 MB'tan az (ücretsiz katman için 4 MB) olmalıdır. PDF dosyalarında boyut sınırı yoktur.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 resim için 12 pikseldir ve bu da 150 DPI'daki yaklaşık 8 noktalı yazı tipi metnine karşılık gelir.

Not

Metin satırları için resmi kırpmanız gerekmez. Görüntünün tamamını Okuma API'sine gönderir ve tüm metinleri tanır.

OCR veri gizliliği ve güvenliği

Tüm Döküm Araçları'nda olduğu gibi Azure Vision hizmetini kullanan geliştiriciler de Microsoft'un müşteri verilerine yönelik ilkelerinin farkında olmalıdır. Daha fazla bilgi edinmek için Microsoft Güven Merkezi'nin Döküm Araçları sayfasına bakın.

Sonraki adımlar

Genel (belge olmayan) görüntüler içeren OCR için Azure Vision 4.0 önizleme Görüntü Analizi REST API'si hızlı başlangıcını deneyin.
PDF, Office ve HTML belgeleriyle OCR'nin yanı sıra belge görüntüleri için Belge Zekası Okuma ile başlayın.
Önceki GA sürümü için bkz. Azure Vision 3.2 GA SDK veya REST API hızlı başlangıçları.

Geri Bildirim

Bu sayfayı yararlı buldunuz mu?

Last updated on 2025-11-21