Bu içerik şunlar için geçerlidir:v3.1 (GA) | En son sürüm: v4.0 (GA) | Önceki sürümler: v3.0v2.1
Bu içerik şunlar için geçerlidir:v3.0 (GA) | En son sürümler: v4.0 (GA) v3.1 | Önceki sürüm:v2.1
Bu içerik şunlar için geçerlidir:v2.1 | En son sürüm:v4.0 (GA)
Özel şablon (eski adıyla özel form), etiketli anahtar-değer çiftlerini, seçim işaretlerini, tabloları, bölgeleri ve imzaları belgelerden doğru ayıklayan, eğitmek kolay bir belge modelidir. Şablon modelleri, belgelerden değerleri ayıklamak için düzen ipuçlarını kullanır ve tanımlı görsel şablonlarıyla yüksek oranda yapılandırılmış belgelerden alan ayıklamaya uygundur.
Özel şablon modelleri, daha fazla alan türü ve dil desteğiyle özel sinir modelleri ile aynı etiketleme biçimini ve stratejisini paylaşır.
Model özellikleri
Özel şablon modelleri anahtar-değer çiftlerini, seçim işaretlerini, tabloları, imza alanlarını ve seçili bölgeleri destekler.
Form alanları
Seçim işaretleri
Tablosal alanlar (Tablolar)
İmza
Seçili bölgeler
Çakışan alanlar
Desteklenir
Desteklenir
Desteklenir
Desteklenir
Desteklenir
Desteklenmez
Tablosal alanlar
V3.0 ve sonraki API sürümlerinin yayımlanmasıyla birlikte, özel şablon modelleri çapraz sayfa tablo alanları (tablolar) için destek ekler:
Birden çok sayfaya yayılan bir tabloyu etiketlemek için, tablonun her satırını tek bir tablodaki farklı sayfalar arasında etiketle.
En iyi uygulama olarak, veri kümenizin beklenen varyasyonlardan birkaç örnek içerdiğinden emin olun. Örneğin, tüm tablonun tek bir sayfada yer aldığı ve bu çeşitlemeleri belgelerde görmeyi bekliyorsanız tabloların iki veya daha fazla sayfaya yayıldığı örnekleri ekleyin.
Tablosal alanlar, tablo olarak tanınmayan bir belge içinde yinelenen bilgileri ayıklarken de yararlıdır. Örneğin, özgeçmişteki iş deneyimlerinin yinelenen bir bölümü tablosal alan olarak etiketlenebilir ve ayıklanabilir.
Çeşitlemelerle ilgilenme
Şablon modelleri tanımlı bir görsel şablonu kullanır, şablonda yapılan değişiklikler daha düşük doğrulukla sonuçlanabilir. Bu örneklerde, eğitim veri kümenizi her şablondan en az beş örnek içerecek şekilde bölün ve varyasyonların her biri için bir model eğitin. Ardından modelleri tek bir uç noktada oluşturabilirsiniz . Dijital PDF belgeleri ve görüntüleri gibi ince çeşitlemeler için, aynı eğitim veri kümesinde her tür için en az beş örnek eklemek en iyisidir.
Giriş gereksinimleri
En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
Desteklenen dosya biçimleri:
Model
PDF
Görüntü: JPEG/JPG, PNG, BMP, TIFF, HEIF
Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTML
Okundu
✔
✔
✔
Düzen
✔
✔
✔
Genel Belge
✔
✔
Önceden oluşturulmuş
✔
✔
Özel
✔
✔
✱ Microsoft Office dosyaları şu anda diğer modeller veya sürümler için desteklenmiyor.
PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (DPI) olan yaklaşık 8-point metnine karşılık gelir.
Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.
Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır 1GB .
Model eğitma
Özel şablon modelleri genel olarak v2.0 API ve sonraki sürümlerden itibaren kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.
v3.0 ve üzeri API'lerle, modeli eğitmek için derleme işlemi yeni buildMode bir özelliği destekler; özel şablon modelini eğitmek için olarak ayarlayın buildModetemplate.
Özel şablon modelleri genellikle v3.1 API'siyle kullanılabilir. Yeni bir projeyle başlıyorsanız veya etiketli bir veri kümeniz varsa, özel bir şablon modeli eğitmek için Document Intelligence Studio ile v3.1 veya v3.0 API'sini kullanın.
v3.0 ve üzeri API'lerle, modeli eğitmek için derleme işlemi yeni buildMode bir özelliği destekler; özel şablon modelini eğitmek için olarak ayarlayın buildModetemplate.
Diğer geliştiriciler ve uzmanlarla gerçek dünyadaki kullanım örneklerini temel alan ölçeklenebilir yapay zeka çözümleri oluşturmak için toplantı serisine katılın.
Azure Belge zekası, belgelerin gerçek zamanlı, uygun ölçekte ve doğrulukla gönderilmesini sağlamak için büyük ölçekte verileri ayıklar. Bu modül, kullanıcılara Azure Belge zekası görüntü işleme API'sini kullanma araçları sağlar.
Bir modeli yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış belgelerden veri ayıklamak üzere eğitmek için özel sinirsel belge modelini kullanın.