Belge Yönetim Bilgileri sözleşme modeli
Önemli
- Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar. Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
- Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-07-31-preview'dır.
- Genel önizleme sürümü 2024-07-31-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir. AI Studio'daki özel oluşturucu (belge alanı ayıklama) modelinin yalnızca Orta Kuzey ABD bölgesinde kullanılabildiğini unutmayın:
- Doğu ABD
- Batı ABD2
- Batı Avrupa
- Orta Kuzey ABD
Bu içerik şunlar için geçerlidir: v4.0 (önizleme) | Önceki sürüm: v3.1 (GA)
Bu içerik şunlar için geçerlidir: v3.1 (GA) | En son sürüm: v4.0 (önizleme)
Belge Yönetim Bilgileri sözleşme modeli, belirli bir önemli sözleşme varlığı grubundaki önemli alanları ve satır öğelerini analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini kullanır. Anlaşmalar telefon tarafından yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede olabilir. API belge metnini analiz eder; Taraflar, Yargı Alanları, Sözleşme Kimliği ve Unvan gibi önemli bilgileri ayıklar; ve yapılandırılmış bir JSON veri gösterimi döndürür. Model şu anda İngilizce belge biçimlerini desteklemektedir.
Otomatik sözleşme işleme
Otomatik sözleşme işleme, belgelerden önemli sözleşme alanlarını ayıklama işlemidir. Geçmişte sözleşme analizi süreci el ile ve bu nedenle çok zaman alır. Önemli verilerin sözleşmelerden doğru şekilde çıkarılması genellikle sözleşme otomasyon sürecinin ilk ve en kritik adımlarından biridir.
Dağıtım seçenekleri
Document Intelligence v4.0 (2024-07-31-preview) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar | Model Kimliği |
---|---|---|
Sözleşme modeli | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
önceden oluşturulmuş sözleşme |
Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar | Model Kimliği |
---|---|---|
Sözleşme modeli | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
önceden oluşturulmuş sözleşme |
Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Özellik | Kaynaklar | Model Kimliği |
---|---|---|
Sözleşme modeli | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
önceden oluşturulmuş sözleşme |
Giriş gereksinimleri
Desteklenen dosya biçimleri:
Model PDF Resim: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLOkundu ✔ ✔ ✔ Düzen ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Genel Belge ✔ ✔ Önceden oluşturulmuş ✔ ✔ Özel ayıklama ✔ ✔ Özel sınıflandırma ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve
4
ücretsiz (F0) katman için MB'tır.Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir
8
.Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve
1
sinir modeli için GB'tır.Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır
1
. 2024-07-31-preview ve üzeri sürümler için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır2
.
Sözleşme belgesi veri ayıklamayı deneyin
Müşteri bilgileri, satıcı ayrıntıları ve satır öğeleri dahil olmak üzere verilerin sözleşmelerden nasıl ayıklandığına bakın. Aşağıdaki kaynaklara ihtiyacınız vardır:
Azure aboneliği: Ücretsiz olarak bir abonelik oluşturabilirsiniz.
Azure portalında bir Belge Zekası örneği. Hizmeti denemek için ücretsiz fiyatlandırma katmanını (
F0
) kullanabilirsiniz. Kaynağınız dağıtıldıktan sonra anahtarınızı ve uç noktanızı almak için Kaynağa git'i seçin.
Belge Makine Zekası Stüdyosu
Document Intelligence Studio giriş sayfasında Vergi Belgeleri'ni seçin.
Örnek vergi belgelerini analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.
Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:
Desteklenen diller ve yerel ayarlar
Desteklenen dillerin tam listesi için Dil Desteği— önceden oluşturulmuş modeller sayfamıza bakın.
Alan ayıklama
Desteklenen belge ayıklama alanları için GitHub örnek depomuzdaki sözleşme modeli şema sayfasına bakın.
Ayıklanan sözleşme anahtar-değer çiftleri ve satır öğeleri JSON çıkışının bölümünde yer alır
documentResults
.
Sonraki adımlar
Document Intelligence Studio ile kendi formlarınızı ve belgelerinizi işlemeyi deneyin.
Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.