Belge işleme modelleri
Önemli
- Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
- Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
- Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
- Doğu ABD
- Batı ABD2
- Batı Avrupa
- Orta Kuzey ABD
Bu içerik şunlar için geçerlidir: v4.0 (önizleme) | Önceki sürümler: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Bu içerik şunlar için geçerlidir: v3.1 (GA) | En son sürüm: v4.0 (önizleme) | Önceki sürümler: v3.0 v2.1
Bu içerik şunlar için geçerlidir: v3.0 (GA) | En son sürümler: v4.0 (önizleme) v3.1 | Önceki sürüm: v2.1
Bu içerik şunlar için geçerlidir: v2.1 | En son sürüm: v4.0 (önizleme)
Azure AI Belge Zekası, uygulamalarınıza ve akışlarınıza akıllı belge işleme eklemenize olanak tanıyan çok çeşitli modelleri destekler. Önceden oluşturulmuş etki alanına özgü bir model kullanabilir veya özel iş ihtiyaçlarınıza ve kullanım örneklerinize göre uyarlanmış özel bir model eğitebilirsiniz. Belge Zekası REST API veya Python, C#, Java ve JavaScript istemci kitaplıklarıyla kullanılabilir.
Not
- Finansal veriler, korumalı sağlık verileri, kişisel veriler veya yüksek oranda hassas veriler içeren belge işleme projeleri dikkatli bir şekilde dikkat gerektirir.
- Ulusal/bölgesel ve sektöre özgü tüm gereksinimlere uyladığınızdan emin olun.
Modele genel bakış
Aşağıdaki tabloda, her geçerli önizleme ve kararlı API için kullanılabilir modeller gösterilmektedir:
Model Türü | Model | • 2024-02-29-preview • 2023-10-31-preview |
2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
---|---|---|---|---|---|
Belge çözümleme modelleri | Okuma | ✔️ | ✔️ | ✔️ | yok |
Belge çözümleme modelleri | Düzen | ✔️ | ✔️ | ✔️ | ✔️ |
Belge çözümleme modelleri | Genel belge | düzene taşındı** | ✔️ | ✔️ | yok |
Önceden oluşturulmuş modeller | Banka Çeki | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | Banka Ekstresi | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | Paystub | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | Sözleşme | ✔️ | ✔️ | yok | yok |
Önceden oluşturulmuş modeller | Sağlık sigortası kartı | ✔️ | ✔️ | ✔️ | yok |
Önceden oluşturulmuş modeller | Kimlik belgesi | ✔️ | ✔️ | ✔️ | ✔️ |
Önceden oluşturulmuş modeller | Fatura | ✔️ | ✔️ | ✔️ | ✔️ |
Önceden oluşturulmuş modeller | Makbuz | ✔️ | ✔️ | ✔️ | ✔️ |
Önceden oluşturulmuş modeller | ABD Birleşik Vergisi* | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | US 1040 Tax* | ✔️ | ✔️ | yok | yok |
Önceden oluşturulmuş modeller | US 1098 Tax* | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD 1099 Vergisi* | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD W2 Vergisi | ✔️ | ✔️ | ✔️ | yok |
Önceden oluşturulmuş modeller | ABD Mortgage 1003 URLA | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD Mortgage 1004 URAR | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD Mortgage 1005 | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD Mortgage 1008 Özeti | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD Mortgage kapanış açıklaması | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | Evlilik sertifikası | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | Kredi kartı | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | Kartvizit | kullanım dışı | ✔️ | ✔️ | ✔️ |
Özel sınıflandırma modeli | Özel sınıflandırıcı | ✔️ | ✔️ | yok | yok |
Özel Oluşturucu Model | Özel Oluşturucu Model | ✔️ | yok | yok | yok |
Özel ayıklama modeli | Özel nöral | ✔️ | ✔️ | ✔️ | yok |
Özel ifade modeli | Özel şablon | ✔️ | ✔️ | ✔️ | ✔️ |
Özel ayıklama modeli | Özel oluşturulmuş | ✔️ | ✔️ | ✔️ | ✔️ |
Tüm modeller | Eklenti özellikleri | ✔️ | ✔️ | yok | yok |
* - Alt modelleri içerir. Desteklenen çeşitlemeler ve alt türleri için modele özgü bilgilere bakın.
Gecikme süresi
Gecikme süresi, bir API sunucusunun gelen isteği işlemesi ve işlemesi ve giden yanıtı istemciye teslim etme süresidir. Belgeyi analiz etme süresi, her sayfadaki boyuta (ör. sayfa sayısı) ve ilişkili içeriğe bağlıdır. Belge Zekası, benzer belgeler için gecikme süresinin karşılaştırılabilir olduğu ancak her zaman aynı olmadığı çok kiracılı bir hizmettir. Gecikme süresi ve performansta zaman zaman değişkenlik, görüntüleri ve büyük belgeleri büyük ölçekte işleyen mikro hizmet tabanlı, durum bilgisi olmayan, zaman uyumsuz hizmetlerde geçerlidir. Donanım ve kapasite ile ölçeklendirme özelliklerini sürekli olarak artırıyor olsak da, çalışma zamanında gecikme sorunları yaşamaya devam edebilirsiniz.
Eklenti Özelliği | Eklenti/Ücretsiz | • 2024-02-29-preview &bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-v4.0%20(2024-07-31-preview)&preserve-view=true |
2023-07-31 (GA) |
2022-08-31 (GA) |
v2.1 (GA) |
---|---|---|---|---|---|
Yazı tipi özelliği ayıklama | Eklenti | ✔️ | ✔️ | yok | yok |
Formül ayıklama | Eklenti | ✔️ | ✔️ | yok | yok |
Yüksek çözünürlüklü ayıklama | Eklenti | ✔️ | ✔️ | yok | yok |
Barkod ayıklama | Ücretsiz | ✔️ | ✔️ | yok | yok |
Dil algılama | Ücretsiz | ✔️ | ✔️ | yok | yok |
Anahtar değer çiftleri | Ücretsiz | ✔️ | yok | yok | yok |
Sorgu alanları | Eklenti* | ✔️ | yok | yok | yok |
Aranabilir pdf | Eklenti* | ✔️ | yok | yok | yok |
Model analizi özellikleri
Model Kimliği | İçerik Ayıklama | Sorgu alanları | Paragraf | Paragraf Rolleri | Seçim İşaretleri | Tablolar | Anahtar-Değer Çiftleri | Diller | Barkodlar | Belge Analizi | Formül* | Stil Yazı Tipi* | Yüksek Çözünürlük* | Aranabilir PDF |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
önceden oluşturulmuş okuma | ✓ | O | O | O | O | O | ✓ | |||||||
önceden oluşturulmuş düzen | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |||
önceden oluşturulmuş belge | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
önceden oluşturulmuş businessCard | ✓ | ✓ | ✓ | |||||||||||
önceden oluşturulmuş sözleşme | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
önceden oluşturulmuş fatura | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
önceden oluşturulmuş makbuz | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
önceden oluşturulmuş creditCard | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-bankStatement | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
önceden oluşturulmuş-mortgage.us.1004 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
önceden oluşturulmuş-mortgage.us.1005 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
önceden oluşturulmuş tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099(çeşitlemeler) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1040(çeşitlemeler) | ✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Etkin
O - İsteğe bağlı
* - Premium özellikler ekstra maliyetler doğurabilir
Eklenti* - Sorgu alanlarının fiyatı diğer eklenti özelliklerinden farklıdır. Ayrıntılar için fiyatlandırmaya bakın.
Sınırlayıcı kutu ve çokgen koordinatları
Sınırlayıcı kutu (polygon
v3.0 ve sonraki sürümlerde), nesne algılama için başvuru noktası olarak kullanılan bir belgedeki metin öğelerini çevreleyen soyut bir dikdörtgendir.
Sınırlayıcı kutu, dört sayısal çiftten oluşan bir dizide sunulan x ve y koordinat düzlemi kullanılarak konumu belirtir. Her çift, kutunun bir köşesini şu sırayla temsil eder: sol üst, sağ üst, sağ alt, sol alt.
Görüntü koordinatları piksel cinsinden gösterilir. PDF için koordinatlar inç olarak sunulur.
Kartvizit modeli dışındaki tüm modellerde, Belge Zekası artık daha gelişmiş analizlere olanak sağlamak için eklenti özelliklerini destekliyor. Bu isteğe bağlı özellikler, belge ayıklama senaryosuna bağlı olarak etkinleştirilebilir ve devre dışı bırakılabilir. (GA) ve sonraki API sürümü için 2023-07-31
yedi eklenti özelliği vardır:
ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
(2024-02-29-preview, 2023-10-31-preview)queryFields
(2024-02-29-preview, 2023-10-31-preview)Not available with the US.Tax models
searchablePDF
(2024-07-31-preview)Only available for Read Model
Dil desteği
Belge Zekası'ndaki derin öğrenme tabanlı evrensel modeller, karma dillere sahip metin satırları da dahil olmak üzere resimlerinizden ve belgelerinizden çok dilli metin ayıklayan birçok dili destekler. Dil desteği, Belge Zekası hizmeti işlevselliğine göre değişir. Tam liste için aşağıdaki makalelere bakın:
- Dil desteği: belge çözümleme modelleri
- Dil desteği: önceden oluşturulmuş modeller
- Dil desteği: özel modeller
Bölgesel kullanılabilirlik
Belge Zekası genel olarak 60'ın üzeri Azure genel altyapı bölgesinde kullanılabilir.
Daha fazla bilgi için, sizin ve müşterileriniz için en uygun bölgeyi seçmenize yardımcı olmak için Azure coğrafyaları sayfamıza bakın.
Model ayrıntıları
Bu bölümde, her modelden bekleyebileceğiniz çıkış açıklanmaktadır. Eklenti özellikleriyle çoğu modelin çıkışını genişletebilirsiniz.
OCR okuma
Okuma API'si, algılanırsa satırları, sözcükleri, bunların konumlarını, algılanan dilleri ve el yazısı stilini analiz eder ve ayıklar.
Document Intelligence Studio kullanılarak işlenen örnek belge:
Düzen analizi
Düzen çözümleme modeli metinleri, tabloları, seçim işaretlerini ve başlıklar, bölüm başlıkları, sayfa üst bilgileri, sayfa alt bilgileri ve daha fazlası gibi diğer yapı öğelerini analiz eder ve ayıklar.
Document Intelligence Studio kullanılarak işlenen örnek belge:
Sağlık sigortası kartı
Sağlık sigortası kartı modeli, ABD sağlık sigortası kartlarından önemli bilgileri analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini derin öğrenme modelleri ile birleştirir.
Document Intelligence Studio kullanılarak işlenen örnek ABD sağlık sigortası kartı:
ABD vergi belgeleri
ABD vergi belgesi modelleri, belirli bir vergi belgesi grubundaki önemli alanları ve satır öğelerini analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD vergi belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:
Model | Açıklama | ModelKimliği |
---|---|---|
ABD Vergisi W-2 | Vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. | prebuilt-tax.us.w2 |
ABD Vergisi 1040 | ipotek faizi ayrıntılarını ayıklayın. | prebuilt-tax.us.1040(çeşitlemeler) |
ABD Vergisi 1098 | ipotek faizi ayrıntılarını ayıklayın. | prebuilt-tax.us.1098(çeşitlemeler) |
ABD Vergisi 1099 | İşveren dışındaki kaynaklardan alınan geliri ayıklayın. | prebuilt-tax.us.1099(çeşitlemeler) |
Document Intelligence Studio kullanılarak işlenen örnek W-2 belgesi:
ABD ipotek belgeleri
ABD ipotek belgesi modelleri, belirli bir ipotek belgesi grubundan ödünç alan, kredi ve mülk bilgileri dahil olmak üzere önemli alanları analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD ipotek belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:
Model | Açıklama | ModelKimliği |
---|---|---|
1003 Son Kullanıcı Lisans Sözleşmesi (EULA) | Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. | prebuilt-mortgage.us.1003 |
1008 Özet belgesi | Ödünç almacı, satıcı, mülk, ipotek ve altına yazan ayrıntıları ayıklayın. | prebuilt-mortgage.us.1008 |
Kapanış açıklaması | Kapanış, işlem maliyetleri ve kredi ayrıntılarını ayıklayın. | prebuilt-mortgage.us.closingDisclosure |
Evlilik sertifikası | Ortak kredi başvuru sahipleri için evlilik bilgileri bilgilerini ayıklayın. | önceden oluşturulmuş evlilikSertifika |
ABD Vergisi W-2 | Gelir doğrulaması için vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. | prebuilt-tax.us.w2 |
Document Intelligence Studio kullanılarak işlenen Örnek Kapanış açıklama belgesi:
Contract
Sözleşme modeli, taraflar, yargı alanları, sözleşme kimliği ve unvan dahil olmak üzere sözleşme sözleşmelerindeki önemli alanları ve satır öğelerini analiz eder ve ayıklar. Model şu anda İngilizce sözleşme belgelerini desteklemektedir.
Document Intelligence Studio kullanılarak işlenen örnek sözleşme:
Fatura
Fatura modeli, müşteri adını, fatura adresini, son tarihi ve vadesi gelen tutarı, satır öğelerini ve diğer önemli verileri ayıklamak için faturaların işlenmesini otomatikleştirir. Model şu anda İngilizce, İspanyolca, Almanca, Fransızca, İtalyanca, Portekizce ve Felemenkçe faturaları desteklemektedir.
Document Intelligence Studio kullanılarak işlenen örnek fatura:
Makbuz
Satış makbuzlarını basılı ve el yazısı makbuzlardan satıcı adı, tarihler, satır öğeleri, miktarlar ve toplamlar için taramak için makbuz modelini kullanın. v3.0 sürümü, tek sayfalı otel makbuzu işlemeyi de destekler.
Document Intelligence Studio kullanılarak işlenen örnek alındı bilgisi:
Kimlik belgesi (Kimlik)
Anahtar alanları ayıklamak için ABD Sürücü Lisanslarını (50 eyaletin tamamı ve Columbia Bölgesi) ve uluslararası pasaportlardan biyografik sayfaları (vize ve diğer seyahat belgeleri hariç) işlemek için Kimlik belgesi (KIMLIK) modelini kullanın.
Document Intelligence Studio kullanılarak işlenen örnek ABD Sürücü Lisansı:
Evlilik sertifikası
Bireyler, tarih ve konum gibi önemli alanları ayıklamak üzere ABD evlilik sertifikalarını işlemek için evlilik sertifikası modelini kullanın.
Document Intelligence Studio kullanılarak işlenen örnek ABD evlilik sertifikası:
Kredi kartı
Anahtar alanlarını ayıklamak üzere kredi ve banka kartlarını işlemek için kredi kartı modelini kullanın.
Document Intelligence Studio kullanılarak işlenen örnek kredi kartı:
Özel modeller
Özel modeller geniş bir şekilde iki türe sınıflandırılabilir. Belirli bir belge türünden tanımlı şema ayıklayan "belge türü" sınıflandırması ve özel ayıklama modellerini destekleyen özel sınıflandırma modelleri.
Özel belge modelleri, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. Bunlar, ayrı içeriğinizdeki form alanlarını tanır ve anahtar-değer çiftlerini ve tablo verilerini ayıklar. Başlamak için form türünün yalnızca bir örneğine ihtiyacınız vardır.
Sürüm v3.0 ve üzeri özel modeller, özel şablonda (form) imza algılamayı ve hem şablon hem de sinir modellerindeki çapraz sayfa tablolarını destekler. İmza algılama , belgeyi imzalayan kişinin kimliğini değil, imzanın varlığını arar. Model imza algılama için imzasız döndürürse, model tanımlı alanda imza bulamadı.
Document Intelligence Studio kullanılarak işlenen örnek özel şablon:
Özel ayıklama
Özel ayıklama modeli, özel şablon veya özel sinir olmak üzere iki türden biri olabilir. Özel ayıklama modeli oluşturmak için, bir belge veri kümesini ayıklanmasını istediğiniz değerlerle etiketleyip etiketlenmiş veri kümesinde modeli eğitin. Başlamak için aynı form veya belge türünün yalnızca beş örneğine ihtiyacınız vardır.
Document Intelligence Studio kullanılarak işlenen örnek özel ayıklama:
Özel sınıflandırıcı
Özel sınıflandırma modeli, ayıklama modelini çağırmadan önce belge türünü tanımlamanızı sağlar. Sınıflandırma modeli API'den 2023-07-31 (GA)
başlayarak kullanılabilir. Özel sınıflandırma modelini eğiterek en az iki ayrı sınıf ve sınıf başına en az beş örnek gerekir.
Oluşturulan modeller
Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle adlı bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir oluşturulmuş modele en fazla 200 eğitilmiş özel model atayabilirsiniz.
Document Intelligence Studio'da oluşturulan model iletişim kutusu penceresi:
Giriş gereksinimleri
Desteklenen dosya biçimleri:
Model PDF Resim: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLOkundu ✔ ✔ ✔ Düzen ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Genel Belge ✔ ✔ Önceden oluşturulmuş ✔ ✔ Özel ayıklama ✔ ✔ Özel sınıflandırma ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve
4
ücretsiz (F0) katman için MB'tır.Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir
8
.Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve
1
sinir modeli için GB'tır.Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır
1
. 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır2
.
Not
Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.
Sürüm geçişi
Belge Zekası v3.1 geçiş kılavuzumuzu izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenin
Model | Açıklama |
---|---|
Belge analizi | |
Düzen | Belgelerden metin ve düzen bilgilerini ayıklama. |
Önceden oluşturulmuş | |
Fatura | İngilizce ve İspanyolca faturalardan önemli bilgileri ayıklayın. |
Makbuz | İngilizce makbuzlardan önemli bilgileri ayıklayın. |
Kimlik belgesi | ABD sürücü lisanslarından ve uluslararası pasaportlardan önemli bilgileri ayıklayın. |
Kartvizit | İngilizce kartvizitlerden önemli bilgileri ayıklayın. |
Özel | |
Özel | İşletmenize özgü formlardan ve belgelerden veri ayıklama. Özel modeller, ayrı verileriniz ve kullanım örnekleriniz için eğitilir. |
Oluşan | Özel modellerden oluşan bir koleksiyon oluşturup bunları form türlerinizden oluşturulan tek bir modele atayın. |
Düzen
Düzen API'si belgelerden metin, tablo ve üst bilgiler, seçim işaretleri ve yapı bilgilerini analiz eder ve ayıklar.
Örnek Etiketleme aracı kullanılarak işlenen örnek belge:
Fatura
Fatura modeli, satış faturalarından önemli bilgileri analiz eder ve ayıklar. API faturaları çeşitli biçimlerde analiz eder ve müşteri adı, fatura adresi, son tarih ve son ödeme tutarı gibi önemli bilgileri ayıklar.
Örnek Etiketleme aracı kullanılarak işlenen örnek fatura:
Makbuz
- Makbuz modeli, yazdırılan ve el yazısı satış makbuzlarından önemli bilgileri analiz eder ve ayıklar.
Örnek Etiketleme aracı kullanılarak işlenen örnek alındı bilgisi:
Kimlik belgesi
Kimlik belgesi modeli, aşağıdaki belgelerden önemli bilgileri analiz eder ve ayıklar:
ABD Sürücü Lisansları (50 eyaletin tamamı ve Columbia Bölgesi)
Uluslararası pasaportlardan biyografik sayfalar (vize ve diğer seyahat belgeleri hariç). API, kimlik belgelerini analiz eder ve ayıklar
Örnek Etiketleme aracı kullanılarak işlenen örnek ABD Sürücü Lisansı:
Kartvizit
Kartvizit modeli, kartvizit görüntülerindeki önemli bilgileri analiz eder ve ayıklar.
Örnek Etiketleme aracı kullanılarak işlenen örnek kartvizit:
Özel
- Özel modeller, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. API, ayrı içeriğinizdeki form alanlarını tanımak ve anahtar-değer çiftleri ile tablo verilerini ayıklamak için eğitilmiş bir makine öğrenmesi programıdır. Başlamak için aynı form türüne yalnızca beş örnek gerekir ve özel modeliniz etiketli veri kümeleriyle veya etiketsiz olarak eğitilebilir.
Örnek Etiketleme aracını kullanarak örnek özel model işleme:
Oluşturulan özel model
Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle adlı bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir birleşik modele en fazla 100 eğitilmiş özel model atayabilirsiniz.
Örnek Etiketleme aracını kullanarak oluşturulan model iletişim kutusu penceresi:
Model veri ayıklama
Model | Metin ayıklama | Dil algılama | Seçim İşaretleri | Tablolar | Paragraf | Paragraf rolleri | Anahtar-Değer çiftleri | Alanlar |
---|---|---|---|---|---|---|---|---|
Düzen | ✓ | ✓ | ✓ | ✓ | ✓ | |||
Fatura | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Makbuz | ✓ | ✓ | ✓ | |||||
Kimlik Belgesi | ✓ | ✓ | ✓ | |||||
Kartvizit | ✓ | ✓ | ✓ | |||||
Özel Form | ✓ | ✓ | ✓ | ✓ | ✓ |
Giriş gereksinimleri
Desteklenen dosya biçimleri:
Model PDF Resim: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLOkundu ✔ ✔ ✔ Düzen ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Genel Belge ✔ ✔ Önceden oluşturulmuş ✔ ✔ Özel ayıklama ✔ ✔ Özel sınıflandırma ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve
4
ücretsiz (F0) katman için MB'tır.Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir
8
.Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve
1
sinir modeli için GB'tır.Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır
1
. 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır2
.
Not
Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.
Sürüm geçişi
Belge Zekası v3.1 geçiş kılavuzumuzu izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenebilirsiniz
Sonraki adımlar
Document Intelligence Studio ile kendi formlarınızı ve belgelerinizi işlemeyi deneyin.
Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.
Belge Yönetim Bilgileri Örnek Etiketleme aracıyla kendi formlarınızı ve belgelerinizi işlemeyi deneyin.
Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.