Belge Yönetim Bilgileri özel şablon modeli

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar.
  • Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-02-29-preview'dır.
  • Genel önizleme sürümü 2024-02-29-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir:
  • Doğu ABD
  • Batı ABD2
  • Batı Avrupa

Bu içerik şunlar için geçerlidir:Checkmarkv4.0 (önizleme) | Önceki sürümler:mavi onay işaretiv3.1 (GA)mavi onay işaretiv3.0 (GA)mavi onay işaretiv2.1 (GA)

Bu içerik:Checkmarkv3.1 (GA) | En son sürüm:mor onay işaretiv4.0 (önizleme) | Önceki sürümler:mavi onay işaretiv3.0mavi onay işaretiv2.1 için geçerlidir

Bu içerik:Checkmarkv3.0 (GA) | En son sürümler:mor onay işaretiv4.0 (önizleme)mor onay işaretiv3.1 | Önceki sürüm:mavi onay işaretiv2.1 için geçerlidir

Bu içerik:Checkmarkv2.1 | En son sürüm:mavi onay işaretiv4.0 (önizleme) için geçerlidir

Özel şablon (eski adıyla özel form), etiketli anahtar-değer çiftlerini, seçim işaretlerini, tabloları, bölgeleri ve imzaları belgelerden doğru ayıklayan, eğitmek kolay bir belge modelidir. Şablon modelleri, belgelerden değerleri ayıklamak için düzen ipuçlarını kullanır ve tanımlı görsel şablonlarıyla yüksek oranda yapılandırılmış belgelerden alan ayıklamaya uygundur.

Özel şablon modelleri, daha fazla alan türü ve dil desteğiyle özel sinir modelleri ile aynı etiketleme biçimini ve stratejisini paylaşır.

Model özellikleri

Özel şablon modelleri anahtar-değer çiftlerini, seçim işaretlerini, tabloları, imza alanlarını ve seçili bölgeleri destekler.

Form alanları Seçim işaretleri Tablosal alanlar (Tablolar) İmza Seçili bölgeler
Desteklenir Desteklenir Desteklenir Desteklenir Desteklenir

Tablosal alanlar

API sürüm 2022-06-30-preview ve üzeri sürümlerle birlikte, özel şablon modelleri çapraz sayfa tablo alanları (tablolar) için destek ekler:

  • Birden çok sayfaya yayılan bir tabloyu etiketlemek için, tablonun her satırını tek bir tablodaki farklı sayfalar arasında etiketle.
  • En iyi uygulama olarak, veri kümenizin beklenen varyasyonlardan birkaç örnek içerdiğinden emin olun. Örneğin, tüm tablonun tek bir sayfada yer aldığı ve bu çeşitlemeleri belgelerde görmeyi bekliyorsanız tabloların iki veya daha fazla sayfaya yayıldığı örnekleri ekleyin.

Tablosal alanlar, tablo olarak tanınmayan bir belge içinde yinelenen bilgileri ayıklarken de yararlıdır. Örneğin, özgeçmişteki iş deneyimlerinin yinelenen bir bölümü tablosal alan olarak etiketlenebilir ve ayıklanabilir.

Çeşitlemelerle ilgilenme

Şablon modelleri tanımlı bir görsel şablonu kullanır, şablonda yapılan değişiklikler daha düşük doğrulukla sonuçlanabilir. Bu örneklerde, eğitim veri kümenizi her şablondan en az beş örnek içerecek şekilde bölün ve varyasyonların her biri için bir model eğitin. Ardından modelleri tek bir uç noktada oluşturabilirsiniz . Dijital PDF belgeleri ve görüntüleri gibi ince çeşitlemeler için, aynı eğitim veri kümesinde her tür için en az beş örnek eklemek en iyisidir.

Giriş gereksinimleri

  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTML
    Okundu
    Düzen ✔ (2024-02-29-preview, 2023-10-31-preview veya üzeri)
    Genel Belge
    Önceden oluşturulmuş
    Özel

    ✱ Microsoft Office dosyaları şu anda diğer modeller veya sürümler için desteklenmiyor.

  • PDF ve TIFF için en fazla 2000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.

  • Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (DPI) olan yaklaşık 8noktalı metne karşılık gelir.

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

  • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.

  • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır 1GB .

Model eğitma

Özel şablon modelleri genellikle v4.0 API'siyle kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.

Model REST API SDK Modelleri Etiketleme ve Test Et
Özel şablon v3.1 API Belge Yönetim Bilgileri SDK'sı Belge Makine Zekası Stüdyosu

v3.0 ve üzeri API'lerle, modeli eğitmek için derleme işlemi yeni buildMode bir özelliği destekler; özel şablon modelini eğitmek için olarak ayarlayın buildModetemplate.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-02-29-preview

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Özel şablon modelleri genellikle v3.1 API'siyle kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.

Model REST API SDK Modelleri Etiketleme ve Test Et
Özel şablon v3.1 API Belge Yönetim Bilgileri SDK'sı Belge Makine Zekası Stüdyosu

v3.0 ve üzeri API'lerle, modeli eğitmek için derleme işlemi yeni buildMode bir özelliği destekler; özel şablon modelini eğitmek için olarak ayarlayın buildModetemplate.

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için Dil Desteği— özel modeller sayfamıza bakın.

Özel (şablon) modelleri genel olarak v2.1 API'siyle kullanılabilir.

Model REST API SDK Modelleri Etiketleme ve Test Et
Özel model (şablon) Belge Yönetim Bilgileri 2.1 Belge Yönetim Bilgileri SDK'sı Belge Yönetim Bilgileri Örneği etiketleme aracı

Sonraki adımlar

Özel modeller oluşturmayı ve oluşturmayı öğrenin: