Belge Zekası özel şablon modeli

Bu içerik için geçerlidir:onay işaretiv4.0 (GA) | Önceki sürümler:mavi onay işaretiv3.1 (GA)kırmızı onay işaretiv3.0 (kullanımdan kaldırılıyor)kırmızı onay işaretiv2.1 (kullanımdan kaldırılıyor)

Bu içerik şunlar için geçerlidir:onay işaretiv3.1 (GA) | En son sürüm:purple-checkmarkv4.0 (GA) | Önceki sürümler:blue-checkmarkv3.0blue-checkmarkv2.1

Bu içerik şunlar için geçerlidir:red-checkmarkv3.0 (kullanımdan kaldırılıyor) | Latest versions:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Önceki sürüm:blue-checkmarkv2.1 (kullanımdan kaldırılıyor)

Bu içerik için geçerlidir:red-checkmarkv2.1 | En son sürüm:blue-checkmarkv4.0 (GA)

Özel şablon (eski adıyla özel form), etiketli anahtar-değer çiftlerini, seçim işaretlerini, tabloları, bölgeleri ve imzaları belgelerden doğru ayıklayan, eğitmek kolay bir belge modelidir. Şablon modelleri, belgelerden değerleri ayıklamak için düzen ipuçlarını kullanır ve tanımlı görsel şablonlarıyla yüksek oranda yapılandırılmış belgelerden alan ayıklamaya uygundur.

Özel şablon modelleri, daha fazla alan türü ve dil desteğiyle özel sinir modelleri ile aynı etiketleme biçimini ve stratejisini paylaşır.

Model özellikleri

Özel şablon modelleri anahtar-değer çiftlerini, seçim işaretlerini, tabloları, imza alanlarını ve seçili bölgeleri destekler.

Form alanları Seçim işaretleri Tablosal alanlar (Tablolar) Imza Seçili bölgeler Çakışan alanlar
Desteklenen Desteklenen Desteklenen Desteklenen Desteklenen Desteklenmiyor

Tablosal alanlar

V3.0 ve sonraki API sürümlerinin yayımlanmasıyla birlikte, özel şablon modelleri çapraz sayfa tablo alanları (tablolar) için destek ekler:

  • Birden çok sayfaya yayılan bir tabloyu etiketlemek için, tablonun her satırını tek bir tablodaki farklı sayfalar arasında etiketle.
  • En iyi uygulama olarak, veri kümenizin beklenen varyasyonlardan birkaç örnek içerdiğinden emin olun. Örneğin, tüm tablonun tek bir sayfada yer aldığı ve bu çeşitlemeleri belgelerde görmeyi bekliyorsanız tabloların iki veya daha fazla sayfaya yayıldığı örnekleri ekleyin.

Tablosal alanlar, tablo olarak tanınmayan bir belge içinde yinelenen bilgileri ayıklarken de yararlıdır. Örneğin, özgeçmişteki iş deneyimlerinin yinelenen bir bölümü tablosal alan olarak etiketlenebilir ve ayıklanabilir.

Varyasyonlarla başa çıkma

Şablon modelleri tanımlı bir görsel şablonu kullanır, şablonda yapılan değişiklikler daha düşük doğrulukla sonuçlanabilir. Bu örneklerde, eğitim veri kümenizi her şablondan en az beş örnek içerecek şekilde bölün ve varyasyonların her biri için bir model eğitin. Ardından modelleri tek bir uç noktada oluşturabilirsiniz . Dijital PDF belgeleri ve görüntüleri gibi ince çeşitlemeler için, aynı eğitim veri kümesinde her tür için en az beş örnek eklemek en iyisidir.

Giriş gereksinimleri

  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • Desteklenen dosya biçimleri:

    Modeli PDF Görüntü:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTML
    Okuma
    Düzen
    Genel Belge
    Önceden oluşturulmuş
    Özelleştirilmiş

    ✱ Microsoft Office dosyaları şu anda diğer modeller veya sürümler için desteklenmiyor.

  • PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.

  • Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF'leriniz parola kilitliyse, göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (8) olan yaklaşık DPI-point metnine karşılık gelir.

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

  • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.

  • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır 1GB .

model eğitme

Özel şablon modelleri genel olarak v2.0 API ve sonraki sürümlerden itibaren kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.

Modeli REST API SDK Modelleri Etiketle ve Test Et
Özel şablon v3.1 API Belge Yönetim Bilgileri SDK'sı Document Intelligence Studio

v3.0 ve üzeri API'lerle, modeli eğitmek için yapılan derleme işlemi, yeni bir buildMode özelliğini destekler. Özel bir şablon modeli eğitmek için buildModetemplate olarak ayarlayın.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-11-30


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Özel şablon modelleri genellikle v3.1 API'siyle kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.

Modeli REST API SDK Modelleri Etiketle ve Test Et
Özel şablon v3.1 API Belge Yönetim Bilgileri SDK'sı Document Intelligence Studio

v3.0 ve üzeri API'lerle, modeli eğitmek için derleme işlemi, özel bir şablon modeli eğitmek amacıyla ayarlanabilen yeni bir \ özelliğini destekleyen bir özelliğe sahiptir; \ \ olarak ayarlayın.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için Dil Desteği— özel modeller sayfamıza bakın.

Özel (şablon) modelleri genel olarak v2.1 API'siyle kullanılabilir.

Modeli REST API SDK Modelleri Etiketle ve Test Et
Özel model (şablon) Belge Yönetim Bilgileri 2.1 Belge Yönetim Bilgileri SDK'sı Belge Zekası Örnek Etiketleme Aracı

Sonraki adımlar

Özel modeller oluşturmayı ve birleştirmeyi öğrenin.