Belge işleme modelleri

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar.
  • Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-02-29-preview'dır.
  • Genel önizleme sürümü 2024-02-29-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir:
  • Doğu ABD
  • Batı ABD2
  • Batı Avrupa

Bu içerik şunlar için geçerlidir:Checkmarkv4.0 (önizleme) | Önceki sürümler:mavi onay işaretiv3.1 (GA)mavi onay işaretiv3.0 (GA)mavi onay işaretiv2.1 (GA)

Bu içerik:Checkmarkv3.1 (GA) | En son sürüm:mor onay işaretiv4.0 (önizleme) | Önceki sürümler:mavi onay işaretiv3.0mavi onay işaretiv2.1 için geçerlidir

Bu içerik:Checkmarkv3.0 (GA) | En son sürümler:mor onay işaretiv4.0 (önizleme)mor onay işaretiv3.1 | Önceki sürüm:mavi onay işaretiv2.1 için geçerlidir

Bu içerik:Checkmarkv2.1 | En son sürüm:mavi onay işaretiv4.0 (önizleme) için geçerlidir

Azure AI Belge Zekası, uygulamalarınıza ve akışlarınıza akıllı belge işleme eklemenize olanak tanıyan çok çeşitli modelleri destekler. Önceden oluşturulmuş etki alanına özgü bir model kullanabilir veya özel iş ihtiyaçlarınıza ve kullanım örneklerinize göre uyarlanmış özel bir model eğitebilirsiniz. Belge Zekası REST API veya Python, C#, Java ve JavaScript istemci kitaplıklarıyla kullanılabilir.

Modele genel bakış

Aşağıdaki tabloda, her geçerli önizleme ve kararlı API için kullanılabilir modeller gösterilmektedir:

Model Türü Model 2024-02-29-preview
&bullet 2023-10-31-preview
2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Belge çözümleme modelleri Okuma ✔️ ✔️ ✔️ yok
Belge çözümleme modelleri Düzen ✔️ ✔️ ✔️ ✔️
Belge çözümleme modelleri Genel belge düzene taşındı** ✔️ ✔️ yok
Önceden oluşturulmuş modeller Sözleşme ✔️ ✔️ yok yok
Önceden oluşturulmuş modeller Sağlık sigortası kartı ✔️ ✔️ ✔️ yok
Önceden oluşturulmuş modeller Kimlik belgesi ✔️ ✔️ ✔️ ✔️
Önceden oluşturulmuş modeller Fatura ✔️ ✔️ ✔️ ✔️
Önceden oluşturulmuş modeller Makbuz ✔️ ✔️ ✔️ ✔️
Önceden oluşturulmuş modeller US 1040 Tax* ✔️ ✔️ yok yok
Önceden oluşturulmuş modeller US 1098 Tax* ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD 1099 Vergisi* ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD W2 Vergisi ✔️ ✔️ ✔️ yok
Önceden oluşturulmuş modeller ABD Mortgage 1003 URLA ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD Mortgage 1008 Özeti ✔️ yok yok yok
Önceden oluşturulmuş modeller ABD Mortgage kapanış açıklaması ✔️ yok yok yok
Önceden oluşturulmuş modeller Evlilik sertifikası ✔️ yok yok yok
Önceden oluşturulmuş modeller Kredi kartı ✔️ yok yok yok
Önceden oluşturulmuş modeller Kartvizit kullanım dışı ✔️ ✔️ ✔️
Özel sınıflandırma modeli Özel sınıflandırıcı ✔️ ✔️ yok yok
Özel ayıklama modeli Özel nöral ✔️ ✔️ ✔️ yok
Özel ifade modeli Özel şablon ✔️ ✔️ ✔️ ✔️
Özel ayıklama modeli Özel oluşturulmuş ✔️ ✔️ ✔️ ✔️
Tüm modeller Eklenti özellikleri ✔️ ✔️ yok yok

* - Alt modelleri içerir. Desteklenen varyasyonlar ve alt türler için modele özgü bilgilere bakın.

Eklenti Özelliği Eklenti/Ücretsiz 2024-02-29-preview
&bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-2024-02-29-preview&preserve-view=true
2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Yazı tipi özelliği ayıklama Eklenti ✔️ ✔️ yok yok
Formül ayıklama Eklenti ✔️ ✔️ yok yok
Yüksek çözünürlüklü ayıklama Eklenti ✔️ ✔️ yok yok
Barkod ayıklama Ücretsiz ✔️ ✔️ yok yok
Dil algılama Ücretsiz ✔️ ✔️ yok yok
Anahtar değer çiftleri Ücretsiz ✔️ yok yok yok
Sorgu alanları Eklenti* ✔️ yok yok yok

Model analizi özellikleri

Model Kimliği İçerik Ayıklama Sorgu alanları Paragraf Paragraf Rolleri Seçim İşaretleri Tablolar Anahtar-Değer Çiftleri Diller Barkod Belge Analizi Formül* Stil Yazı Tipi* Yüksek Çözünürlük*
önceden oluşturulmuş okuma O O O O O
önceden oluşturulmuş düzen O O O O O
önceden oluşturulmuş belge O O O O O
önceden oluşturulmuş businessCard
önceden oluşturulmuş sözleşme O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
önceden oluşturulmuş fatura O O O O O O
önceden oluşturulmuş makbuz O O O O O
prebuilt-marriageCertificate.us O O O O O
önceden oluşturulmuş creditCard O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
önceden oluşturulmuş tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(çeşitlemeler) O O O O O
prebuilt-tax.us.1040(çeşitlemeler) O O O O O
{ customModelName } O O O O O

✓ - Etkin
O - İsteğe bağlı
* - Premium özellikler ekstra maliyetler doğurabilir

Eklenti* - Sorgu alanlarının fiyatı diğer eklenti özelliklerinden farklıdır. Ayrıntılar için fiyatlandırmaya bakın.

Model Açıklama
Belge çözümleme modelleri
Oku OCR Sözcükler, konumlar ve algılanan diller de dahil olmak üzere basılı ve el yazısı metinleri ayıklayın.
Düzen analizi Tablolar, seçim işaretleri, başlıklar, bölüm başlıkları ve daha fazlası gibi metin ve belge düzeni öğelerini ayıklayın.
Önceden oluşturulmuş modeller
Sağlık sigortası kartı ABD sağlık sigortası kartlarından sigortacı, üye, reçete, grup numarası ve diğer önemli bilgileri ayıklayarak sağlık süreçlerini otomatikleştirin.
ABD Vergi belgesi modelleri Çalışan, işveren, ücret ve diğer bilgileri ayıklamak için ABD vergi formlarını işleme.
ABD Mortgage belge modelleri Ödünç almacı kredisi ve mülk bilgilerini ayıklamak için ABD ipotek formlarını işleme.
Sözleşme Sözleşme ve taraf ayrıntılarını ayıklayın.
Fatura Faturaları otomatikleştirme.
Makbuz Makbuzlardan alındı bilgisi verilerini ayıklayın.
Kimlik belgesi (Kimlik) ABD sürücü lisanslarından ve uluslararası pasaportlardan kimlik (KIMLIK) alanlarını ayıklayın.
Kartvizit Uygulamalarınıza önemli alanları ve verileri ayıklamak için kartvizitleri tarayın.
Özel modeller
Özel model (genel bakış) İşletmenize özgü formlardan ve belgelerden veri ayıklama. Özel modeller, ayrı verileriniz ve kullanım örnekleriniz için eğitilir.
Özel ayıklama modelleri Özel şablon modelleri , belgelerden değer ayıklamak için düzen ipuçlarını kullanır ve tanımlı görsel şablonlarla yüksek oranda yapılandırılmış belgelerden alan ayıklamaya uygundur.
Özel sinir modelleri , yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış belgelerden alanları ayıklamak için çeşitli belge türleri üzerinde eğitilir.
Özel sınıflandırma modeli Özel sınıflandırma modeli, içindeki belgeleri tanımlamak için giriş dosyasındaki her sayfayı sınıflandırabilir ve ayrıca bir giriş dosyasındaki tek bir belgenin birden çok örneğini veya birden çok belgeyi tanımlayabilir.
Oluşturulan modeller Çeşitli belge türlerinin tek bir oluşturulmuş modelle işlenmesini otomatikleştirmek için birkaç özel modeli tek bir modelde birleştirin.

Kartvizit modeli dışındaki tüm modellerde, Belge Zekası artık daha gelişmiş analizlere olanak sağlamak için eklenti özelliklerini destekliyor. Bu isteğe bağlı özellikler, belge ayıklama senaryosuna bağlı olarak etkinleştirilebilir ve devre dışı bırakılabilir. (GA) ve sonraki API sürümü için 2023-07-31 yedi eklenti özelliği vardır:

Model ayrıntıları

Bu bölümde, her modelden bekleyebileceğiniz çıkış açıklanmaktadır. Eklenti özellikleriyle çoğu modelin çıkışını genişletebileceğinizi lütfen unutmayın.

OCR okuma

Okuma API'si, algılanırsa satırları, sözcükleri, bunların konumlarını, algılanan dilleri ve el yazısı stilini analiz eder ve ayıklar.

Document Intelligence Studio kullanılarak işlenen örnek belge:

Document Intelligence Studio Okuma kullanılarak işlenen örnek belgenin ekran görüntüsü

Düzen analizi

Düzen çözümleme modeli metinleri, tabloları, seçim işaretlerini ve başlıklar, bölüm başlıkları, sayfa üst bilgileri, sayfa alt bilgileri ve daha fazlası gibi diğer yapı öğelerini analiz eder ve ayıklar.

Document Intelligence Studio kullanılarak işlenen örnek belge:

Document Intelligence Studio kullanılarak işlenen örnek gazete sayfasının ekran görüntüsü.

Sağlık sigortası kartı

Sağlık sigortası kartı modeli, ABD sağlık sigortası kartlarından önemli bilgileri analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini derin öğrenme modelleri ile birleştirir.

Document Intelligence Studio kullanılarak işlenen örnek ABD sağlık sigortası kartı:

Document Intelligence Studio'da örnek bir ABD sağlık sigortası kartı analizinin ekran görüntüsü.

ABD vergi belgeleri

ABD vergi belgesi modelleri, belirli bir vergi belgesi grubundaki önemli alanları ve satır öğelerini analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD vergi belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:

Model Açıklama ModelKimliği
ABD Vergisi W-2 Vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. önceden oluşturulmuş-tax.us.W-2
ABD Vergisi 1040 ipotek faizi ayrıntılarını ayıklayın. prebuilt-tax.us.1040(çeşitlemeler)
ABD Vergisi 1098 ipotek faizi ayrıntılarını ayıklayın. prebuilt-tax.us.1098(çeşitlemeler)
ABD Vergisi 1099 İşveren dışındaki kaynaklardan alınan geliri ayıklayın. prebuilt-tax.us.1099(çeşitlemeler)

Document Intelligence Studio kullanılarak işlenen örnek W-2 belgesi:

Örnek W-2'nin ekran görüntüsü.

ABD ipotek belgeleri

ABD ipotek belge modelleri, belirli bir ipotek belgesi grubundan ödünç alan, kredi ve mülk bilgileri dahil olmak üzere önemli alanları analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD ipotek belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:

Model Açıklama ModelKimliği
1003 Son Kullanıcı Lisans Sözleşmesi (EULA) Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. prebuilt-mortgage.us.1003
1008 Özet belgesi Ödünç almacı, satıcı, mülk, ipotek ve alt yazı bilgilerini ayıklayın. prebuilt-mortgage.us.1008
Kapanış açıklaması Kapanış, işlem maliyetleri ve kredi ayrıntılarını ayıklayın. prebuilt-mortgage.us.closingDisclosure
Evlilik sertifikası Ortak kredi başvuru sahipleri için evlilik bilgileri bilgilerini ayıklayın. önceden oluşturulmuş evlilikSertifika
ABD Vergisi W-2 Gelir doğrulaması için vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. önceden oluşturulmuş-tax.us.W-2

Document Intelligence Studio kullanılarak işlenen Örnek Kapanış açıklama belgesi:

Örnek kapanış açıklamasının ekran görüntüsü.

Contract

Sözleşme modeli, taraflar, yargı alanları, sözleşme kimliği ve unvan dahil olmak üzere sözleşme sözleşmelerindeki önemli alanları ve satır öğelerini analiz eder ve ayıklar. Model şu anda İngilizce sözleşme belgelerini desteklemektedir.

Document Intelligence Studio kullanılarak işlenen örnek sözleşme:

Document Intelligence Studio kullanarak sözleşme modeli ayıklama işleminin ekran görüntüsü.

Fatura

Fatura modeli, müşteri adını, fatura adresini, son tarihi ve vadesi gelen tutarı, satır öğelerini ve diğer önemli verileri ayıklamak için faturaların işlenmesini otomatikleştirir. Model şu anda İngilizce, İspanyolca, Almanca, Fransızca, İtalyanca, Portekizce ve Felemenkçe faturaları desteklemektedir.

Document Intelligence Studio kullanılarak işlenen örnek fatura:

Örnek faturanın ekran görüntüsü.

Makbuz

Satış makbuzlarını basılı ve el yazısı makbuzlardan satıcı adı, tarihler, satır öğeleri, miktarlar ve toplamlar için taramak için makbuz modelini kullanın. v3.0 sürümü, tek sayfalı otel makbuzu işlemeyi de destekler.

Document Intelligence Studio kullanılarak işlenen örnek alındı bilgisi:

Örnek alındı bilgisinin ekran görüntüsü.

Kimlik belgesi (Kimlik)

Anahtar alanları ayıklamak için ABD Sürücü Lisanslarını (50 eyaletin tamamı ve Columbia Bölgesi) ve uluslararası pasaportlardan biyografik sayfaları (vize ve diğer seyahat belgeleri hariç) işlemek için Kimlik belgesi (KIMLIK) modelini kullanın.

Document Intelligence Studio kullanılarak işlenen örnek ABD Sürücü Lisansı:

Örnek kimlik kartının ekran görüntüsü.

Evlilik sertifikası

Bireyler, tarih ve konum gibi önemli alanları ayıklamak üzere ABD evlilik sertifikalarını işlemek için evlilik sertifikası modelini kullanın.

Document Intelligence Studio kullanılarak işlenen örnek ABD evlilik sertifikası:

Örnek evlilik sertifikasının ekran görüntüsü.

Kredi kartı

Anahtar alanlarını ayıklamak üzere kredi ve banka kartlarını işlemek için kredi kartı modelini kullanın.

Document Intelligence Studio kullanılarak işlenen örnek kredi kartı:

Örnek kredi kartının ekran görüntüsü.

Özel modeller

Özel modeller geniş bir şekilde iki türe sınıflandırılabilir. Belirli bir belge türünden tanımlı şema ayıklayan "belge türü" sınıflandırması ve özel ayıklama modellerini destekleyen özel sınıflandırma modelleri.

Özel model türlerinin ve ilişkili model derleme modlarının diyagramı.

Özel belge modelleri, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. Bunlar, ayrı içeriğinizdeki form alanlarını tanıyacak, anahtar-değer çiftlerini ve tablo verilerini ayıklayabilir. Başlamak için form türünün yalnızca bir örneğine ihtiyacınız vardır.

Sürüm v3.0 özel modeli, özel şablonda (form) imza algılamayı ve hem şablon hem de sinir modellerindeki çapraz sayfa tablolarını destekler.

Document Intelligence Studio kullanılarak işlenen örnek özel şablon:

Belge Yönetim Bilgileri aracının özel form çözümleme penceresinin ekran görüntüsü.

Özel ayıklama

Özel ayıklama modeli, özel şablon veya özel sinir olmak üzere iki türden biri olabilir. Özel ayıklama modeli oluşturmak için, bir belge veri kümesini ayıklanmasını istediğiniz değerlerle etiketleyip etiketlenmiş veri kümesinde modeli eğitin. Başlamak için aynı form veya belge türünün yalnızca beş örneğine ihtiyacınız vardır.

Document Intelligence Studio kullanılarak işlenen örnek özel ayıklama:

Document Intelligence Studio'da özel ayıklama modeli analizinin ekran görüntüsü.

Özel sınıflandırıcı

Özel sınıflandırma modeli, ayıklama modelini çağırmadan önce belge türünü tanımlamanızı sağlar. Sınıflandırma modeli API'den 2023-07-31 (GA) başlayarak kullanılabilir. Özel sınıflandırma modelini eğiterek en az iki ayrı sınıf ve sınıf başına en az beş örnek gerekir.

Oluşturulan modeller

Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle adlı bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir oluşturulmuş modele en fazla 200 eğitilmiş özel model atayabilirsiniz.

Document Intelligence Studio'da oluşturulan model iletişim kutusu penceresi:

Document Intelligence Studio özel model oluştur iletişim penceresinin ekran görüntüsü.

Giriş gereksinimleri

  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTML
    Okundu
    Düzen ✔ (2024-02-29-preview, 2023-10-31-preview)
    Genel Belge
    Önceden oluşturulmuş
    Özel ayıklama
    Özel sınıflandırma ✔ (2024-02-29-preview)
  • PDF ve TIFF için en fazla 2000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.

  • Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (DPI) olan yaklaşık 8noktalı metne karşılık gelir.

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır 1GB .

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Sürüm geçişi

Belge Zekası v3.1 geçiş kılavuzumuzu izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenin

Model Açıklama
Belge analizi
Düzen Belgelerden metin ve düzen bilgilerini ayıklama.
Önceden oluşturulmuş
Fatura İngilizce ve İspanyolca faturalardan önemli bilgileri ayıklayın.
Makbuz İngilizce makbuzlardan önemli bilgileri ayıklayın.
Kimlik belgesi ABD sürücü lisanslarından ve uluslararası pasaportlardan önemli bilgileri ayıklayın.
Kartvizit İngilizce kartvizitlerden önemli bilgileri ayıklayın.
Özel
Özel İşletmenize özgü formlardan ve belgelerden veri ayıklama. Özel modeller, ayrı verileriniz ve kullanım örnekleriniz için eğitilir.
Oluşan Özel modellerden oluşan bir koleksiyon oluşturup bunları form türlerinizden oluşturulan tek bir modele atayın.

Düzen

Düzen API'si belgelerden metin, tablo ve üst bilgiler, seçim işaretleri ve yapı bilgilerini analiz eder ve ayıklar.

Örnek Etiketleme aracı kullanılarak işlenen örnek belge:

Örnek Etiketleme aracını kullanan 'düzen' analizinin ekran görüntüsü.

Fatura

Fatura modeli, satış faturalarından önemli bilgileri analiz eder ve ayıklar. API faturaları çeşitli biçimlerde analiz eder ve müşteri adı, fatura adresi, son tarih ve son ödeme tutarı gibi önemli bilgileri ayıklar.

Örnek Etiketleme aracı kullanılarak işlenen örnek fatura:

Örnek Etiketleme aracının kullanıldığı örnek fatura analizinin ekran görüntüsü.

Makbuz

  • Makbuz modeli, yazdırılan ve el yazısı satış makbuzlarından önemli bilgileri analiz eder ve ayıklar.

Örnek Etiketleme aracı kullanılarak işlenen örnek alındı bilgisi:

Örnek alındı bilgisinin ekran görüntüsü.

Kimlik belgesi

Kimlik belgesi modeli, aşağıdaki belgelerden önemli bilgileri analiz eder ve ayıklar:

  • ABD Sürücü Lisansları (50 eyaletin tamamı ve Columbia Bölgesi)

  • Uluslararası pasaportlardan biyografik sayfalar (vize ve diğer seyahat belgeleri hariç). API, kimlik belgelerini analiz eder ve ayıklar

Örnek Etiketleme aracı kullanılarak işlenen örnek ABD Sürücü Lisansı:

Örnek kimlik kartının ekran görüntüsü.

Kartvizit

Kartvizit modeli, kartvizit görüntülerindeki önemli bilgileri analiz eder ve ayıklar.

Örnek Etiketleme aracı kullanılarak işlenen örnek kartvizit:

Örnek kartvizitin ekran görüntüsü.

Özel

  • Özel modeller, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. API, ayrı içeriğinizdeki form alanlarını tanımak ve anahtar-değer çiftleri ile tablo verilerini ayıklamak için eğitilmiş bir makine öğrenmesi programıdır. Başlamak için aynı form türüne yalnızca beş örnek gerekir ve özel modeliniz etiketli veri kümeleriyle veya etiketsiz olarak eğitilebilir.

Örnek Etiketleme aracını kullanarak örnek özel model işleme:

Belge Yönetim Bilgileri aracının özel form çözümleme penceresinin ekran görüntüsü.

Oluşturulan özel model

Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle adlı bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir birleşik modele en fazla 100 eğitilmiş özel model atayabilirsiniz.

Örnek Etiketleme aracını kullanarak oluşturulan model iletişim kutusu penceresi:

Document Intelligence Studio özel model oluştur iletişim penceresinin ekran görüntüsü.

Model veri ayıklama

Model Metin ayıklama Dil algılama Seçim İşaretleri Tablolar Paragraf Paragraf rolleri Anahtar-Değer çiftleri Alanlar
Düzen
Fatura
Makbuz
Kimlik Belgesi
Kartvizit
Özel Form

Giriş gereksinimleri

  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTML
    Okundu
    Düzen ✔ (2024-02-29-preview, 2023-10-31-preview)
    Genel Belge
    Önceden oluşturulmuş
    Özel ayıklama
    Özel sınıflandırma ✔ (2024-02-29-preview)
  • PDF ve TIFF için en fazla 2000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.

  • Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (DPI) olan yaklaşık 8noktalı metne karşılık gelir.

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır 1GB .

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Sürüm geçişi

Belge Zekası v3.1 geçiş kılavuzumuzu izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenebilirsiniz

Sonraki adımlar