Azure Belge Zekası nedir?
Tavsiye
Daha fazla ayrıntı için Metin ve resimler sekmesine bakın!
Azure Document Intelligence , Microsoft Foundry'de belgelerden metin, anahtar-değer çiftleri, seçim işaretleri ve tabloları ayıklamak için OCR ve derin öğrenme modellerini kullanan bulut tabanlı bir yapay zeka hizmetidir.
OCR, görüntüde algılanan nesnelerin çevresinde sınırlayıcı kutular oluşturarak belge yapısını yakalar. Sınırlayıcı kutuların konumları, sayfanın geri kalanıyla ilişkili olarak koordinat olarak kaydedilir. Azure Belge Zekası, sınırlayıcı kutu verilerini ve diğer bilgileri özgün belgedeki ilişkileri koruyan yapılandırılmış bir JSON biçiminde döndürür.
Sıfırdan yüksek doğrulukta bir belge ayıklama modeli oluşturmak için derin öğrenme uzmanlığı, büyük miktarlarda işlem ve uzun eğitim süreleri gerekir. Azure Belge Zekası, binlerce form örneği üzerinde zaten eğitilmiş temel modeller sağlar, böylece en az çabayla yüksek doğrulukta veri ayıklama elde edebilirsiniz.
Belge Yönetim Bilgileri hizmeti bileşenleri
Azure Belge Zekası üç model kategorisinden oluşur:
Belge çözümleme modelleri: Belgelerden metin, yapı, tablo ve seçim işaretlerini ayıklayın. Okuma modeli metin ayıklar ve dilleri algılarken, düzen modeli tablo ve yapı ayıklama ekler. Bu modelleri önceden oluşturulmuş modelleri kullanma ünitesinde ayrıntılı olarak keşfedeceksiniz.
Önceden oluşturulmuş modeller: Herhangi bir eğitime gerek kalmadan faturalar, makbuzlar, vergi formları, kimlik belgeleri ve daha fazlası gibi yaygın belge türlerinden bilgileri ayıklayın. Önceden oluşturulmuş modelleri kullan ünitesinde önceden oluşturulmuş kullanılabilir modellerin tam listesini görürsünüz.
Özel modeller: Kendi etiketli veri kümelerinizi kullanarak işletmenize özgü formlardan veri ayıklayın. Seçenekler arasında özel şablon modelleri (sabit düzenler için hızlı ve uygun maliyetli), özel sinir modelleri (değişen düzenler için daha yüksek doğruluk), oluşturulan modeller ve özel sınıflandırıcılar bulunur. Özel modelleri eğitip kullanma ünitesinde özel modelleri eğitip kullanma hakkında bilgi edineceksiniz.
Belge Yönetim Bilgileri hizmetlerine erişme
Azure Document Intelligence'a çeşitli yollarla erişebilirsiniz:
- REST API: HTTP isteklerini kullanarak hizmeti doğrudan çağırın.
- İstemci kitaplığı SDK'ları: Python, C#, Java ve JavaScript için SDK'ları kullanın.
- Document Intelligence Studio: Belge Zekası çözümlerini görsel olarak keşfetmeye, test etmeye ve oluşturmaya yönelik çevrimiçi bir araç.
- Microsoft Foundry portalı: Belge Zekası'nı diğer Dökümhane araçlarıyla tümleştirin.
Tavsiye
Bu modülün alıştırması Python SDK'sını ele alır. Altta yatan REST hizmetleri herhangi bir dil ile kullanılabilir.
Belge Yönetim Bilgileri kaynağı oluşturma
Azure Document Intelligence'ı kullanmak için bir Azure kaynağı gerekir. Aşağıdakilerden birini kullanabilirsiniz:
- Foundry platformu: Tek bir uç nokta ve anahtar altında birden fazla yapay zeka hizmetine erişim sağlayan çoklu hizmet aboneliği.
- Azure Belge Yönetim Bilgileri kaynağı: Yalnızca Belge Zekası ile kullanılan tek hizmetli bir kaynak.
Uyarı
Tek bir uç nokta ve anahtar altında birden fazla Foundry aracına erişmeyi planlıyorsanız bir Foundry kaynağı oluşturun. Yalnızca Belge Yönetim Bilgileri erişimi için ayrılmış bir Belge Yönetim Bilgileri kaynağı oluşturun.
Giriş gereksinimleri
Azure Belge Zekası, şu gereksinimleri karşılayan giriş belgeleri üzerinde çalışır:
- Biçim JPEG, PNG, BMP, PDF (metin veya taranmış) veya TIFF olmalıdır. Okuma modeli, Microsoft Office dosya biçimlerini de kabul eder.
- Dosya boyutu standart katman için 500 MB'tan az, ücretsiz katman için ise 4 MB olmalıdır.
- Görüntü boyutları 50 x 50 piksel ile 10.000 x 10.000 piksel arasında olmalıdır.
- PDF belgelerinin boyutları 17 x 17 inçten (A3 kağıt boyutu) küçük olmalıdır.
- PDF belgeleri parola korumalı olmamalıdır.