OCR - Optik Karakter Tanıma
OCR veya Optik Karakter Tanıma, metin tanıma veya metin ayıklama olarak da adlandırılır. Makine öğrenmesi tabanlı OCR teknikleri posterler, sokak işaretleri ve ürün etiketleri gibi görüntülerin yanı sıra makaleler, raporlar, formlar ve faturalar gibi belgelerden basılı veya el yazısı metinleri ayıklamanıza olanak sağlar. Metin genellikle sözcükler, metin satırları ve paragraflar veya metin blokları olarak ayıklanır ve taranan metnin dijital sürümüne erişim sağlanır. Bu, el ile veri girişi gereksinimini ortadan kaldırır veya önemli ölçüde azaltır.
OCR altyapısı
Microsoft'un Read OCR altyapısı, genel dilleri destekleyen birden fazla gelişmiş makine öğrenmesi tabanlı modelden oluşur. Karışık diller ve yazma stilleri dahil olmak üzere yazdırılan ve el yazısı metinleri ayıklayabilir. Okuma , dağıtım esnekliği için bulut hizmeti ve şirket içi kapsayıcı olarak kullanılabilir. Ayrıca, OCR destekli kullanıcı deneyimlerini uygulamayı kolaylaştıran performans geliştirmelerine sahip tek, belge dışı, yalnızca görüntü senaryoları için zaman uyumlu BIR API olarak da kullanılabilir.
Uyarı
v3.2'deki Azure AI Vision eski OCR API'si ve v2.1 işlemlerinde RecognizeText API'sinin kullanılması önerilmez.
OCR (Okuma) sürümleri
Önemli
Gereksinimlerinize en uygun Okuma sürümünü seçin.
Giriş | Örnekler | Okuma sürümü | Avantaj |
---|---|---|---|
Görüntüler: Genel, vahşi görüntüler | etiketler, sokak işaretleri ve posterler | Görüntüler için OCR (sürüm 4.0) | Kullanıcı deneyimi senaryolarınıza OCR eklemeyi kolaylaştıran, performans açısından geliştirilmiş zaman uyumlu API'ye sahip genel, belge dışı görüntüler için iyileştirilmiştir. |
Belgeler: Resimler de dahil olmak üzere dijital ve taranmış | kitaplar, makaleler ve raporlar | Belge Zekası okuma modeli | Akıllı belge işlemeyi büyük ölçekte otomatikleştirmeye yardımcı olmak için zaman uyumsuz API ile metin ağırlıklı taranmış ve dijital belgeler için iyileştirilmiştir. |
Azure AI Vision v3.2 GA Okuma hakkında
En son Azure AI Vision v3.2 GA Okumasını mı arıyorsunuz? Gelecekteki tüm Okuma OCR geliştirmeleri, daha önce listelenen iki hizmetin bir parçasıdır. Azure AI Vision v3.2'de başka güncelleştirme bulunmamaktadır. Daha fazla bilgi için bkz . Azure AI Vision 3.2 GA Okuma API'sini çağırma ve Hızlı Başlangıç: Azure AI Vision v3.2 GA Okuma.
OCR'nin Akıllı Belge İşleme (IDP) ile ilişkisi nedir?
Akıllı Belge İşleme (IDP), Belge Zekası gibi gelişmiş makine öğrenmesi tabanlı yapay zeka hizmetiyle yapı, ilişkiler, anahtar-değerler, varlıklar ve diğer belge merkezli içgörüleri ayıklamak için temel teknolojisi olarak OCR'yi kullanır. Belge Zekası, daha üst düzey içgörüler için diğer modellere temsilci eklerken OCR altyapısı olarak Read'in belge için iyileştirilmiş bir sürümünü içerir. Taranmış ve dijital belgelerden metin ayıklanıyorsanız, Belge Zekası Okuma OCR'yi kullanın.
OCR'yi kullanma
Vision Studio'yu kullanarak OCR'i deneyin. Ardından, gereksinimlerinizi en iyi karşılayan Read sürümünün bağlantılarından birini izleyin.
OCR tarafından desteklenen diller
Bugün Azure AI Vision'da kullanılabilen her iki Okuma sürümü de yazdırılan ve el yazısı metinler için çeşitli dilleri destekler. Yazdırılan metinler için OCR, İngilizce, Fransızca, Almanca, İtalyanca, Portekizce, İspanyolca, Çince, Japonca, Korece, Rusça, Arapça, Hintçe ve Latin, Kiril, Arapça ve Devanagari betikleri kullanan diğer uluslararası diller için destek içerir. El yazısı metin için OCR, İngilizce, Basitleştirilmiş Çince, Fransızca, Almanca, İtalyanca, Japonca, Korece, Portekizce ve İspanyolca dilleri için destek içerir.
OCR tarafından desteklenen dillerin tam listesine bakın.
OCR ortak özellikleri
Okuma OCR modeli, Azure AI Görüntü İşleme ve Belge Zekası'nda, ilgili senaryolar için iyileştirme yaparken ortak temel özelliklerle kullanılabilir. Aşağıdaki listede ortak özellikler özetlenmiştir:
- Desteklenen dillerde basılı ve el yazısı metin ayıklama
- Konum ve güvenilirlik puanlarına sahip sayfalar, metin satırları ve sözcükler
- Karma diller, karma mod (yazdırma ve el yazısı) desteği
- Şirket içi dağıtım için Distroless Docker kapsayıcısı olarak kullanılabilir
OCR bulut API'lerini kullanma veya şirket içi dağıtma
Bulut API'leri, tümleştirme kolaylığı ve hızlı üretkenlik özellikleri sayesinde çoğu müşteri için tercih edilen seçenektir. Siz müşterilerinizin ihtiyaçlarını karşılamaya odaklanırken Azure ve Azure AI Vision hizmeti ölçek, performans, veri güvenliği ve uyumluluk gereksinimlerini ele alır.
Şirket içi dağıtım için Read Docker kapsayıcısı, Azure AI Vision v3.2 genel kullanıma sunulan OCR özelliklerini kendi yerel ortamınızda dağıtmanıza olanak tanır. Kapsayıcılar, belirli güvenlik ve veri idare gereksinimleri için çok kullanışlıdır.
Giriş gereksinimleri
Okuma API'si giriş olarak görüntüleri ve belgeleri alır. Görüntüler ve belgeler aşağıdaki gereksinimleri karşılamalıdır:
- Desteklenen dosya biçimleri JPEG, PNG, BMP, PDF ve TIFF'dir.
- PDF ve TIFF dosyaları için en fazla 2.000 sayfa (ücretsiz katmanda yalnızca ilk iki sayfa) işlenir.
- Görüntülerin dosya boyutu en az 50 x 50 piksel ve en fazla 10.000 x 10.000 piksel boyuta sahip 500 MB'tan (ücretsiz katman için 4 MB) küçük olmalıdır. PDF dosyalarında boyut sınırı yoktur.
- Ayıklanacak metnin en düşük yüksekliği 1024 x 768 resim için 12 pikseldir ve bu da 150 DPI'daki yaklaşık 8 noktalı yazı tipi metnine karşılık gelir.
Not
Metin satırları için resmi kırpmanız gerekmez. Görüntünün tamamını Okuma API'sine gönderir ve tüm metinleri tanır.
OCR veri gizliliği ve güvenliği
Tüm Azure yapay zeka hizmetlerinde olduğu gibi, Azure AI Vision hizmetini kullanan geliştiriciler de Microsoft'un müşteri verilerine yönelik ilkelerinin farkında olmalıdır. Daha fazla bilgi edinmek için Microsoft Güven Merkezi'nin Azure AI hizmetleri sayfasına bakın.
Sonraki adımlar
- Genel (belge olmayan) görüntüler için OCR: Azure AI Vision 4.0 önizlemesi Görüntü Analizi REST API'si hızlı başlangıcını deneyin.
- PDF, Office ve HTML belgeleri ve belge görüntüleri için OCR: Belge Zekası Okuma ile başlayın.
- Önceki GA sürümünü mü arıyorsunuz? Azure AI Vision 3.2 GA SDK veya REST API hızlı başlangıçlarına bakın.