Aracılığıyla paylaş


Belge işleme modelleri

Bu içerik şunlar için geçerlidir:onay işaretiv4.0 (GA) | Önceki sürümler:mavi onay işaretiv3.1 (GA)mavi onay işaretiv3.0 (GA)mavi onay işaretiv2.1 (GA)

Bu içerik şunlar için geçerlidir:onay işaretiv3.1 (GA) | En son sürüm:mor onay işaretiv4.0 (GA) | Önceki sürümler:mavi onay işaretiv3.0mavi onay işaretiv2.1

Bu içerik şunlar için geçerlidir:checkmarkonay işaretiv3.0 (GA) | En son sürümler:purple-checkmarkmor onay işaretiv4.0 (GA)purple-checkmarkmor onay işaretiv3.1 | blue-checkmarkv2.1

Bu içerik şunlar için geçerlidir:checkmarkCheckmarkEn son sürüm: | blue-checkmarkv4.0 (GA)

Foundry Araçları'ndaki Azure Belge Zekası, uygulamalarınıza ve akışlarınıza akıllı belge işleme eklemek için kullanabileceğiniz çeşitli modelleri destekler. Önceden oluşturulmuş bir etki alanına özgü modeli kullanabilir veya özel iş gereksinimlerinize ve kullanım örneklerinize göre uyarlanmış özel bir model eğitebilirsiniz. Belge Zekası'nı REST API veya Python, C#, Java ve JavaScript istemci kitaplıklarıyla kullanabilirsiniz.

Not

Finansal veriler, korumalı sağlık verileri, kişisel veriler veya yüksek oranda hassas veriler içeren belge işleme projeleri dikkatli bir şekilde dikkat gerektirir. Ulusal/bölgesel ve sektöre özgü tüm gereksinimlere uyladığınızdan emin olun.

Modele genel bakış

Aşağıdaki tabloda, her kararlı API için genel kullanıma sunulan (GA) modeller gösterilmektedir.

Model türü Model 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Belge çözümleme modelleri Okuma ✔️ ✔️ ✔️ Kullanılamaz
Belge çözümleme modelleri Düzen ✔️ ✔️ ✔️ ✔️
Belge çözümleme modelleri Genel belge** Desteklendiği yer:
düzen modeli
✔️ ✔️ Kullanılamaz
Önceden oluşturulmuş modeller Banka çeki ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller Banka ekstresi ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller payStub ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller Sözleşme ✔️ ✔️ Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller Sağlık sigortası kartı ✔️ ✔️ ✔️ Kullanılamaz
Önceden oluşturulmuş modeller Kimlik belgesi ✔️ ✔️ ✔️ ✔️
Önceden oluşturulmuş modeller Fatura ✔️ ✔️ ✔️ ✔️
Önceden oluşturulmuş modeller Makbuz ✔️ ✔️ ✔️ ✔️
Önceden oluşturulmuş modeller ABD birleşik vergisi* ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD 1040 vergisi* ✔️ ✔️ Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD 1095 vergisi* ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD 1098 vergisi* ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD 1099 vergisi* ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD W2 vergisi ✔️ ✔️ ✔️ Kullanılamaz
Önceden oluşturulmuş modeller ABD W4 vergisi ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD mortgage 1003 URLA ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD ipotek 1004 URAR ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD ipotek 1005 ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD ipotek 1008 özeti ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller ABD ipotek kapanışı açıklaması ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller Evlilik sertifikası ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller Kredi kartı ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Önceden oluşturulmuş modeller Kartvizit kullanım dışı ✔️ ✔️ ✔️
Özel sınıflandırma modeli Özel sınıflandırıcı ✔️ ✔️ Kullanılamaz Kullanılamaz
Özel ayıklama modeli Özel nöral ✔️ ✔️ ✔️ Kullanılamaz
Özel ayıklama modeli Özel şablon ✔️ ✔️ ✔️ ✔️
Özel ayıklama modeli Özel oluşturulmuş ✔️ ✔️ ✔️ ✔️
Tüm modeller Eklenti özellikleri ✔️ ✔️ Kullanılamaz Kullanılamaz

* Alt modelleri içerir. Desteklenen çeşitlemeler ve alt türleri için modele özgü bilgilere bakın.
** Genel belge modelinin tüm özellikleri düzen modelinde kullanılabilir. Genel model artık desteklenmiyor.

Gecikme süresi

Gecikme süresi, bir API sunucusunun gelen isteği işlemesi ve işlemesi ve giden yanıtı istemciye teslim etme süresidir. Belgeyi analiz etme süresi, her sayfadaki boyuta (ör. sayfa sayısı) ve ilişkili içeriğe bağlıdır. Belge Zekası, benzer belgeler için gecikme süresinin karşılaştırılabilir olduğu ancak her zaman aynı olmadığı çok kiracılı zaman uyumsuz bir hizmettir. Gecikme süresi ve performansta zaman zaman değişkenlik, görüntüleri ve büyük belgeleri büyük ölçekte işleyen mikro hizmet tabanlı durum bilgisi olmayan tüm hizmetlerde geçerlidir. Donanım ve kapasite ile ölçeklendirme özelliklerini sürekli olarak artırıyor olsak da, çalışma zamanında gecikme sorunları yaşamaya devam edebilirsiniz.

Eklenti özelliği

Belge Zekası için aşağıdaki eklenti özellikleri kullanılabilir. Kartvizit modeli dışındaki tüm modeller için, Belge Zekası artık daha karmaşık analizlere olanak sağlayan eklenti özelliklerini destekliyor. Belge ayıklama senaryosuna bağlı olarak bu isteğe bağlı özellikleri etkinleştirebilir ve devre dışı bırakabilirsiniz. Aşağıdaki eklenti özellikleri 2023-07-31 (GA) ve sonraki API sürümü için kullanılabilir:

Eklenti özelliği Eklenti/Ücretsiz 30.11.2024 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Yazı tipi özelliği ayıklama Eklenti ✔️ ✔️ Kullanılamaz Kullanılamaz
Formül ayıklama Eklenti ✔️ ✔️ Kullanılamaz Kullanılamaz
Yüksek çözünürlüklü ayıklama Eklenti ✔️ ✔️ Kullanılamaz Kullanılamaz
Barkod ayıklama Ücretsiz ✔️ ✔️ Kullanılamaz Kullanılamaz
Dil algılama Ücretsiz ✔️ ✔️ Kullanılamaz Kullanılamaz
Anahtar/değer çiftleri Ücretsiz ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Sorgu alanları Eklenti* ✔️ Kullanılamaz Kullanılamaz Kullanılamaz
Aranabilir PDF Eklenti* ✔️ Kullanılamaz Kullanılamaz Kullanılamaz

Model analizi özellikleri

Model Kimliği İçerik ayıklama Sorgu alanları Paragraf Paragraf rolleri Seçim işaretleri Tablolar Anahtar/değer çiftleri Diller Barkodlar Belge analizi Formül* Stil yazı tipi* Yüksek çözünürlük* Aranabilir PDF
prebuilt-read O O O O O O
prebuilt-layout O O O O O O
prebuilt-contract O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (çeşitli) O O O O O
prebuilt-tax.us.1095A O O O O O
prebuilt-tax.us.1095C O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (çeşitli) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

✓ - Etkin
O - İsteğe bağlı
* - Premium özellikler ekstra maliyetler doğurabilir

Sorgu alanları diğer eklenti özelliklerinden farklı şekilde fiyatlendirilir. Daha fazla bilgi için bkz . Fiyatlandırma.

Sınırlayıcı kutu ve çokgen koordinatları

Sınırlayıcı kutu (polygon v3.0 ve sonraki sürümlerde), belgedeki metin öğelerini çevreleyen soyut bir dikdörtgendir. Sınırlayıcı kutu, nesne algılama için başvuru noktası olarak kullanılır:

  • Sınırlayıcı kutu, dört sayısal çiftten oluşan bir dizide sunulan x ve y koordinat düzlemi kullanılarak konumu belirtir. Her çift, kutunun bir köşesini şu sırayla temsil eder: sol üst, sağ üst, sağ alt, sol alt.
  • Görüntü koordinatları piksel cinsinden gösterilir. PDF için koordinatlar inç olarak sunulur.

Dil desteği

Derin öğrenmeyi temel alan Belge Zekası'ndaki evrensel modeller birçok dili destekler. Modeller, karma dillere sahip metin satırları da dahil olmak üzere resimlerinizden ve belgelerinizden çok dilli metin ayıklayabilir. Dil desteği, Belge Zekası hizmeti işlevselliğine göre değişir. Tam liste için aşağıdaki makalelere bakın:

Bölgesel kullanılabilirlik

Belge Zekası genel olarak 60'ın üzeri Azure genel altyapı bölgesinde kullanılabilir.

Sizin ve müşterileriniz için en uygun bölgeyi seçmenize yardımcı olmak için bkz. Azure coğrafyaları.

Model ayrıntıları

Bu bölümde, her modelden bekleyebileceğiniz çıkış açıklanmaktadır. Eklenti özellikleriyle çoğu modelin çıkışını genişletebilirsiniz.

OCR okuma

Okuma API'sinde, optik karakter tanıma (OCR), algılanırsa satır ve sözcükleri, bunların konumlarını, algılanan dilleri ve el yazısı stilini analiz edip ayıklamak için kullanılır.

Bu örnek belge , Document Intelligence Studio kullanılarak işlendi.

Document Intelligence Studio Okuma kullanılarak işlenen örnek belgeyi gösteren ekran görüntüsü.

Düzen analizi

Düzen çözümleme modeli metinleri, tabloları, seçim işaretlerini ve başlıklar, bölüm başlıkları, sayfa üst bilgileri ve sayfa alt bilgileri gibi diğer yapı öğelerini analiz eder ve ayıklar.

Bu örnek belge , Document Intelligence Studio kullanılarak işlendi.

Document Intelligence Studio kullanılarak işlenen örnek gazete sayfasını gösteren ekran görüntüsü.

Sağlık sigortası kartı

Sağlık sigortası kartı modeli, ABD sağlık sigortası kartlarından önemli bilgileri analiz etmek ve ayıklamak için güçlü OCR özelliklerini derin öğrenme modelleriyle birleştirir.

Bu örnek ABD sağlık sigortası kartı Document Intelligence Studio kullanılarak işlenmiştir.

Document Intelligence Studio'da örnek bir ABD sağlık sigortası kartı analizini gösteren ekran görüntüsü.

ABD vergi belgeleri

ABD vergi belgesi modelleri, belirli bir vergi belgesi grubundaki önemli alanları ve satır öğelerini analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD vergi belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:

Model Açıklama Model Kimliği
ABD vergisi W-2 Vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. prebuilt-tax.us.w2
ABD vergisi W-4 Vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. prebuilt-tax.us.w4
ABD vergisi 1040 ipotek faizi ayrıntılarını ayıklayın. prebuilt-tax.us.1040 (varyasyonlar)
ABD vergisi 1095 Sağlık sigortası ayrıntılarını ayıklayın. prebuilt-tax.us.1095 (varyasyonlar)
ABD vergisi 1098 ipotek faizi ayrıntılarını ayıklayın. prebuilt-tax.us.1098 (varyasyonlar)
ABD vergisi 1099 İşveren dışındaki kaynaklardan alınan geliri ayıklayın. prebuilt-tax.us.1099 (varyasyonlar)

Bu örnek W-2 belgesi , Document Intelligence Studio kullanılarak işlendi.

Örnek bir W-2 belgesini gösteren ekran görüntüsü.

ABD ipotek belgeleri

ABD ipotek belgesi modelleri, belirli bir ipotek belgesi grubundan ödünç alan, kredi ve mülk bilgilerini içeren önemli alanları analiz eder ve ayıklar. API, telefon tarafından yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD ipotek belgelerinin analizini destekler. Aşağıdaki modeller şu anda desteklenmektedir.

Model Açıklama Model Kimliği
1003 End-User Lisans Sözleşmesi Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. prebuilt-mortgage.us.1003
1004 Tekdüzen Konut Değerlendirme Raporu (URAR) Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. prebuilt-mortgage.us.1004
1005 İstihdam doğrulaması Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. prebuilt-mortgage.us.1005
1008 Özet belgesi Ödünç almacı, satıcı, mülk, ipotek ve altına yazan ayrıntıları ayıklayın. prebuilt-mortgage.us.1008
Kapanış Açıklaması Kapanış, işlem maliyetleri ve kredi ayrıntılarını ayıklayın. prebuilt-mortgage.us.closingDisclosure

Bu örnek Kapanış Açıklaması belgesi , Document Intelligence Studio kullanılarak işlendi.

Örnek kapanış açıklamasını gösteren ekran görüntüsü.

Contract

Sözleşme modeli, taraflar, yargı alanları, sözleşme kimliği ve unvan dahil olmak üzere sözleşme sözleşmelerindeki önemli alanları ve satır öğelerini analiz eder ve ayıklar. Model şu anda İngilizce sözleşme belgelerini desteklemektedir.

Bu örnek sözleşme , Document Intelligence Studio kullanılarak işlendi.

Document Intelligence Studio kullanarak sözleşme modeli ayıklamayı gösteren ekran görüntüsü.

ABD banka çeki

Sözleşme modeli çek ayrıntıları, hesap ayrıntıları, tutar ve not dahil olmak üzere ABD banka çeklerindeki önemli alanları analiz eder ve ayıklar.

Bu banka denetimi örneği Document Intelligence Studio kullanılarak işlendi.

Document Intelligence Studio kullanarak banka denetimi modeli ayıklamayı gösteren ekran görüntüsü.

ABD banka ekstresi

Banka ekstresi modeli, ABD banka ekstreleri hesap numarası, banka ayrıntıları, ekstre ayrıntıları ve işlem ayrıntılarındaki önemli alanları ve satır öğelerini analiz eder ve ayıklar.

Bu örnek banka ekstresi Document Intelligence Studio kullanılarak işlendi.

Document Intelligence Studio kullanarak banka ekstresi modeli ayıklamayı gösteren ekran görüntüsü.

payStub

payStub modeli, bordroyla ilgili bilgilerle belge ve dosyalardan önemli alanları ve satır öğelerini analiz eder ve ayıklar.

Bu örnek ödeme saplaması , Document Intelligence Studio kullanılarak işlendi.

Document Intelligence Studio kullanarak payStub modeli ayıklamayı gösteren ekran görüntüsü.

Fatura

Fatura modeli, müşteri adını, fatura adresini, son tarihi, vadesi gelen tutarı, satır öğelerini ve diğer önemli verileri ayıklamak için faturaların işlenmesini otomatikleştirir.

Bu örnek fatura , Document Intelligence Studio kullanılarak işlendi.

Örnek faturayı gösteren ekran görüntüsü.

Makbuz

Basılı ve el yazısı makbuzlardan satıcı adı, tarihler, satır öğeleri, miktarlar ve toplamlar için satış makbuzlarını taramak için makbuz modelini kullanın. Sürüm v3.0, tek sayfalı otel makbuzu işlemeyi de destekler.

Bu örnek alındı bilgisi Document Intelligence Studio kullanılarak işlendi.

Örnek alındı bilgisini gösteren ekran görüntüsü.

Kimlik belgesi

Anahtar alanları ayıklamak için ABD ehliyetlerini (50 eyaletin tamamı ve Columbia Bölgesi) ve uluslararası pasaportlardan (vize ve diğer seyahat belgeleri hariç) biyografik sayfaları işlemek için kimlik belgesi (KIMLIK) modelini kullanın.

Bu örnek ABD sürücü lisansı , Document Intelligence Studio kullanılarak işlenmiştir.

Örnek kimlik kartını gösteren ekran görüntüsü.

Evlilik sertifikası

Bireyler, tarih ve konum gibi önemli alanları ayıklamak üzere ABD evlilik sertifikalarını işlemek için evlilik sertifikası modelini kullanın.

Bu örnek ABD evlilik sertifikası Document Intelligence Studio kullanılarak işlendi.

Örnek bir evlilik sertifikası gösteren ekran görüntüsü.

Kredi kartı

Anahtar alanlarını ayıklamak üzere kredi ve banka kartlarını işlemek için kredi kartı modelini kullanın.

Bu örnek kredi kartı , Document Intelligence Studio kullanılarak işlendi.

Örnek kredi kartını gösteren ekran görüntüsü.

Özel modeller

Özel modeller yaygın olarak iki türe ayrılır. Belirli bir belge türünden tanımlı şema ayıklayan "belge türü" sınıflandırması ve özel ayıklama modellerini destekleyen özel sınıflandırma modelleri.

Özel model türlerini ve ilişkili model derleme modlarını gösteren diyagram.

Özel belge modelleri, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. Ayrı içeriğinizdeki form alanlarını tanır ve anahtar/değer çiftleri ile tablo verilerini ayıklar. Başlamak için form türünün yalnızca bir örneğine ihtiyacınız vardır.

Sürüm v3.0 ve üzeri özel modeller, özel şablonda (form) imza algılamayı ve hem şablon hem de sinir modellerindeki çapraz sayfa tablolarını destekler. İmza algılama , belgeyi imzalayan kişinin kimliğini değil, imzanın varlığını arar. Model imza algılama için imzasız döndürürse, model tanımlı alanda imza bulamadı.

Bu örnek özel şablon , Document Intelligence Studio kullanılarak işlendi.

Özel formu analiz eden Belge Yönetim Bilgileri'nin gösterildiği ekran görüntüsü.

Özel ayıklama

Özel ayıklama modeli iki tür olarak gelir: özel şablon ve özel sinir. Özel ayıklama modeli oluşturmak için, bir belge veri kümesini ayıklanmasını istediğiniz değerlerle etiketleyip etiketlenmiş veri kümesinde modeli eğitin. Başlamak için aynı form veya belge türünün yalnızca beş örneğine ihtiyacınız vardır.

Bu örnek özel ayıklama , Document Intelligence Studio kullanılarak işlendi.

Document Intelligence Studio'da özel ayıklama modeli analizini gösteren ekran görüntüsü.

Özel sınıflandırıcı

Özel sınıflandırma modeliyle, ayıklama modelini çağırmadan önce belge türünü tanımlayabilirsiniz. Sınıflandırma modeli, 2023-07-31 (GA) API'siyle başlayarak kullanılabilir. Özel sınıflandırma modelini eğiterek en az iki ayrı sınıf ve sınıf başına en az beş örnek gerekir.

Oluşturulan modeller

Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle çağrılan bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir oluşturulmuş modele en fazla 200 eğitilmiş özel model atayabilirsiniz.

Bu örnek oluşturulan model , Document Intelligence Studio'dadır.

Document Intelligence Studio Özel model oluştur bölmesini gösteren ekran görüntüsü.

Giriş gereksinimleri

Aşağıdaki dosya biçimleri desteklenir.

Model PDF Resim:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Okundu
Düzen
Genel belge
Önceden oluşturulmuş
Özel ayıklama
Özel sınıflandırma
  • Fotoğraflar ve taramalar: En iyi sonuçlar için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
  • PDF'ler ve TIFF'ler: PDF'ler ve TIFF'ler için en fazla 2.000 sayfa işlenebilir. (Ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir.)
  • Dosya boyutu: Belgeleri analiz etmek için dosya boyutu ücretli (S0) katmanı için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
  • Görüntü boyutları: Boyutlar 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
  • Parola kilitleri: PDF'leriniz parola kilitliyse, göndermeden önce kilidi kaldırmanız gerekir.
  • Metin yüksekliği: Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta olan yaklaşık 8 noktalı metne karşılık gelir.
  • Özel model eğitimi: Eğitim verileri için en fazla sayfa sayısı, özel şablon modeli için 500 ve özel sinir modeli için 50.000'dir.
  • Özel ayıklama modeli eğitimi: Eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1 GB'tır.
  • Özel sınıflandırma modeli eğitimi: Eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 1 GB'tır. 2024-11-30 (GA) için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 2 GB'tır.
  • Office dosya türleri (DOCX, XLSX, PPTX): En fazla dize uzunluğu sınırı 8 milyon karakterdir.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Sınırlama, Belge Yönetim Bilgileri Hizmeti'nden değil araçtan türetilir.

Sürüm geçişi

Belge Zekası v3.1 geçiş kılavuzundaki adımları izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenin.

Model Açıklama
Belge analizi
Düzen Belgelerden metin ve düzen bilgilerini ayıklama.
Önceden oluşturulmuş
Fatura İngilizce ve İspanyolca faturalarından önemli bilgileri ayıklayın.
Makbuz İngilizce makbuzlardan önemli bilgileri ayıklayın.
Kimlik belgesi ABD ehliyetlerinden ve uluslararası pasaportlardan önemli bilgileri ayıklayın.
Kartvizit İngilizce kartvizitlerden önemli bilgileri ayıklayın.
Özel
Özel İşletmenize özgü formlardan ve belgelerden veri ayıklama. Özel modeller, ayrı verileriniz ve kullanım örnekleriniz için eğitilir.
Oluşan Özel modellerden oluşan bir koleksiyon oluşturup bunları form türlerinizden oluşturulan tek bir modele atayın.

Düzen

Düzen API'si belgelerden metin, tablo ve üst bilgiler, seçim işaretleri ve yapı bilgilerini analiz eder ve ayıklar.

Bu örnek belge , Örnek Etiketleme aracı kullanılarak işlendi.

Örnek Etiketleme aracını kullanarak düzen analizini gösteren ekran görüntüsü.

Fatura

Fatura modeli, satış faturalarından önemli bilgileri analiz eder ve ayıklar. API faturaları çeşitli biçimlerde analiz eder ve müşteri adı, fatura adresi, son tarih ve son ödeme tutarı gibi önemli bilgileri ayıklar.

Bu örnek fatura , Örnek Etiketleme aracı kullanılarak işlendi.

Örnek Etiketleme aracını kullanarak örnek fatura analizini gösteren ekran görüntüsü.

Makbuz

Makbuz modeli, yazdırılan ve el yazısı satış makbuzlarından önemli bilgileri analiz eder ve ayıklar.

Bu örnek alındı bilgisi , Örnek Etiketleme aracı kullanılarak işlendi.

Örnek alındı bilgisini gösteren ekran görüntüsü.

Kimlik belgesi

Kimlik belgesi modeli, aşağıdaki belgelerden önemli bilgileri analiz eder ve ayıklar:

  • ABD sürücü lisansları (50 eyaletin tamamı ve Columbia Bölgesi)
  • Uluslararası pasaportlardan biyografik sayfalar (vize ve diğer seyahat belgeleri hariç). API, kimlik belgelerini analiz eder ve ayıklar.

Bu örnek ABD sürücü lisansı , Örnek Etiketleme aracı kullanılarak işlenmiştir.

Örnek kimlik kartını gösteren ekran görüntüsü.

Kartvizit

Kartvizit modeli, kartvizit görüntülerindeki önemli bilgileri analiz eder ve ayıklar.

Bu örnek kartvizit , Örnek Etiketleme aracı kullanılarak işlenmiştir.

Örnek kartviziti gösteren ekran görüntüsü.

Özel

Özel modeller, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. API, ayrı içeriğinizdeki form alanlarını tanımak ve anahtar/değer çiftleri ile tablo verilerini ayıklamak için eğitilmiş bir makine öğrenmesi programıdır. Başlamak için aynı form türünün yalnızca beş örneğine ihtiyacınız vardır. Özel modelinizi etiketli veri kümeleriyle veya etiketsiz olarak eğitebilirsiniz.

Bu örnek özel model , Örnek Etiketleme aracı kullanılarak işlenmiştir.

Özel form bölmesini analiz eden Belge Yönetim Bilgileri aracını gösteren ekran görüntüsü.

Oluşturulan özel model

Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle çağrılan bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir birleşik modele en fazla 100 eğitilmiş özel model atayabilirsiniz.

Bu oluşturulan model bölmesi Örnek Etiketleme aracı kullanılarak işlendi.

Document Intelligence Studio Özel model oluştur bölmesini gösteren ekran görüntüsü.

Model veri ayıklama

Model Metin ayıklama Dil algılama Seçim işaretleri Tablolar Paragraf Paragraf rolleri Anahtar/değer çiftleri Fields
Düzen
Fatura
Makbuz
Kimlik Belgesi
Kartvizit
Özel Form

Giriş gereksinimleri

Aşağıdaki dosya biçimleri desteklenir.

Model PDF Resim:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Okundu
Düzen
Genel belge
Önceden oluşturulmuş
Özel ayıklama
Özel sınıflandırma
  • Fotoğraflar ve taramalar: En iyi sonuçlar için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
  • PDF'ler ve TIFF'ler: PDF'ler ve TIFF'ler için en fazla 2.000 sayfa işlenebilir. (Ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir.)
  • Dosya boyutu: Belgeleri analiz etmek için dosya boyutu ücretli (S0) katmanı için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
  • Görüntü boyutları: Boyutlar 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
  • Parola kilitleri: PDF'leriniz parola kilitliyse, göndermeden önce kilidi kaldırmanız gerekir.
  • Metin yüksekliği: Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta olan yaklaşık 8 noktalı metne karşılık gelir.
  • Özel model eğitimi: Eğitim verileri için en fazla sayfa sayısı, özel şablon modeli için 500 ve özel sinir modeli için 50.000'dir.
  • Özel ayıklama modeli eğitimi: Eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1 GB'tır.
  • Özel sınıflandırma modeli eğitimi: Eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 1 GB'tır. 2024-11-30 (GA) için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 2 GB'tır.
  • Office dosya türleri (DOCX, XLSX, PPTX): En fazla dize uzunluğu sınırı 8 milyon karakterdir.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Sınırlama, Belge Zekası'ndan değil araçtan türetilir.

Sürüm geçişi

Belge Yönetim Bilgileri v3.1 geçiş kılavuzundaki adımları izleyerek uygulamalarınızda Belge Zekası v3.0'ı kullanmayı öğrenebilirsiniz