OCR - Optik Karakter Tanıma

Makale
06/26/2024

OCR veya Optik Karakter Tanıma, metin tanıma veya metin ayıklama olarak da adlandırılır. Makine öğrenmesi tabanlı OCR teknikleri posterler, sokak işaretleri ve ürün etiketleri gibi görüntülerin yanı sıra makaleler, raporlar, formlar ve faturalar gibi belgelerden basılı veya el yazısı metinleri ayıklamanıza olanak sağlar. Metin genellikle sözcükler, metin satırları ve paragraflar veya metin blokları olarak ayıklanır ve taranan metnin dijital sürümüne erişim sağlanır. Bu, el ile veri girişi gereksinimini ortadan kaldırır veya önemli ölçüde azaltır.

OCR altyapısı

Microsoft'un Read OCR altyapısı, genel dilleri destekleyen birden fazla gelişmiş makine öğrenmesi tabanlı modelden oluşur. Karışık diller ve yazma stilleri dahil olmak üzere yazdırılan ve el yazısı metinleri ayıklayabilir. Okuma , dağıtım esnekliği için bulut hizmeti ve şirket içi kapsayıcı olarak kullanılabilir. Ayrıca, OCR destekli kullanıcı deneyimlerini uygulamayı kolaylaştıran performans geliştirmelerine sahip tek, belge dışı, yalnızca görüntü senaryoları için zaman uyumlu BIR API olarak da kullanılabilir.

Uyarı

v3.2'deki Azure AI Vision eski OCR API'si ve v2.1 işlemlerinde RecognizeText API'sinin kullanılması önerilmez.

OCR (Okuma) sürümleri

Önemli

Gereksinimlerinize en uygun Okuma sürümünü seçin.

Giriş	Örnekler	Okuma sürümü	Avantaj
Görüntüler: Genel, vahşi görüntüler	etiketler, sokak işaretleri ve posterler	Görüntüler için OCR (sürüm 4.0)	Kullanıcı deneyimi senaryolarınıza OCR eklemeyi kolaylaştıran, performans açısından geliştirilmiş zaman uyumlu API'ye sahip genel, belge dışı görüntüler için iyileştirilmiştir.
Belgeler: Resimler de dahil olmak üzere dijital ve taranmış	kitaplar, makaleler ve raporlar	Belge Zekası okuma modeli	Akıllı belge işlemeyi büyük ölçekte otomatikleştirmeye yardımcı olmak için zaman uyumsuz API ile metin ağırlıklı taranmış ve dijital belgeler için iyileştirilmiştir.

Azure AI Vision v3.2 GA Okuma hakkında

En son Azure AI Vision v3.2 GA Okumasını mı arıyorsunuz? Gelecekteki tüm Okuma OCR geliştirmeleri, daha önce listelenen iki hizmetin bir parçasıdır. Azure AI Vision v3.2'de başka güncelleştirme bulunmamaktadır. Daha fazla bilgi için bkz . Azure AI Vision 3.2 GA Okuma API'sini çağırma ve Hızlı Başlangıç: Azure AI Vision v3.2 GA Okuma.

Akıllı Belge İşleme (IDP), Belge Zekası gibi gelişmiş makine öğrenmesi tabanlı yapay zeka hizmetiyle yapı, ilişkiler, anahtar-değerler, varlıklar ve diğer belge merkezli içgörüleri ayıklamak için temel teknolojisi olarak OCR'yi kullanır. Belge Zekası, daha üst düzey içgörüler için diğer modellere temsilci eklerken OCR altyapısı olarak Read'in belge için iyileştirilmiş bir sürümünü içerir. Taranmış ve dijital belgelerden metin ayıklanıyorsanız, Belge Zekası Okuma OCR'yi kullanın.

OCR'yi kullanma

Vision Studio'yu kullanarak OCR'i deneyin. Ardından, gereksinimlerinizi en iyi karşılayan Read sürümünün bağlantılarından birini izleyin.

Vision Studio'yu deneyin

Ekran görüntüsü: Vision Studio'da OCR tanıtımını okuyun.

OCR tarafından desteklenen diller

Bugün Azure AI Vision'da kullanılabilen her iki Okuma sürümü de yazdırılan ve el yazısı metinler için çeşitli dilleri destekler. Yazdırılan metinler için OCR, İngilizce, Fransızca, Almanca, İtalyanca, Portekizce, İspanyolca, Çince, Japonca, Korece, Rusça, Arapça, Hintçe ve Latin, Kiril, Arapça ve Devanagari betikleri kullanan diğer uluslararası diller için destek içerir. El yazısı metin için OCR, İngilizce, Basitleştirilmiş Çince, Fransızca, Almanca, İtalyanca, Japonca, Korece, Portekizce ve İspanyolca dilleri için destek içerir.

OCR tarafından desteklenen dillerin tam listesine bakın.

OCR ortak özellikleri

Okuma OCR modeli, Azure AI Görüntü İşleme ve Belge Zekası'nda, ilgili senaryolar için iyileştirme yaparken ortak temel özelliklerle kullanılabilir. Aşağıdaki listede ortak özellikler özetlenmiştir:

Desteklenen dillerde basılı ve el yazısı metin ayıklama
Konum ve güvenilirlik puanlarına sahip sayfalar, metin satırları ve sözcükler
Karma diller, karma mod (yazdırma ve el yazısı) desteği
Şirket içi dağıtım için Distroless Docker kapsayıcısı olarak kullanılabilir

OCR bulut API'lerini kullanma veya şirket içi dağıtma

Bulut API'leri, tümleştirme kolaylığı ve hızlı üretkenlik özellikleri sayesinde çoğu müşteri için tercih edilen seçenektir. Siz müşterilerinizin ihtiyaçlarını karşılamaya odaklanırken Azure ve Azure AI Vision hizmeti ölçek, performans, veri güvenliği ve uyumluluk gereksinimlerini ele alır.

Şirket içi dağıtım için Read Docker kapsayıcısı, Azure AI Vision v3.2 genel kullanıma sunulan OCR özelliklerini kendi yerel ortamınızda dağıtmanıza olanak tanır. Kapsayıcılar, belirli güvenlik ve veri idare gereksinimleri için çok kullanışlıdır.

OCR veri gizliliği ve güvenliği

Tüm Azure yapay zeka hizmetlerinde olduğu gibi, Azure AI Vision hizmetini kullanan geliştiriciler de Microsoft'un müşteri verilerine yönelik ilkelerinin farkında olmalıdır. Daha fazla bilgi edinmek için Microsoft Güven Merkezi'nin Azure AI hizmetleri sayfasına bakın.

Sonraki adımlar

Genel (belge olmayan) görüntüler için OCR: Azure AI Vision 4.0 önizlemesi Görüntü Analizi REST API'si hızlı başlangıcını deneyin.
PDF, Office ve HTML belgeleri ve belge görüntüleri için OCR: Belge Zekası Okuma ile başlayın.
Önceki GA sürümünü mü arıyorsunuz? Azure AI Vision 3.2 GA SDK veya REST API hızlı başlangıçlarına bakın.

Aracılığıyla paylaş

OCR - Optik Karakter Tanıma

OCR altyapısı

OCR (Okuma) sürümleri

OCR'yi kullanma

OCR tarafından desteklenen diller

OCR ortak özellikleri

OCR bulut API'lerini kullanma veya şirket içi dağıtma

OCR veri gizliliği ve güvenliği

Sonraki adımlar

Geri Bildirim

Geri Bildirim

Ek kaynaklar

Aracılığıyla paylaş

OCR - Optik Karakter Tanıma

OCR altyapısı

OCR (Okuma) sürümleri

OCR'nin Akıllı Belge İşleme (IDP) ile ilişkisi nedir?

OCR'yi kullanma

OCR tarafından desteklenen diller

OCR ortak özellikleri

OCR bulut API'lerini kullanma veya şirket içi dağıtma

OCR veri gizliliği ve güvenliği

Sonraki adımlar

Geri Bildirim

Geri Bildirim

Ek kaynaklar