Belge Zekası fatura modeli

Bu içerik için geçerlidir:onay işaretiv4.0 (GA) | Önceki sürümler:mavi onay işaretiv3.1 (GA)kırmızı onay işaretiv3.0 (kullanımdan kaldırılıyor)kırmızı onay işaretiv2.1 (kullanımdan kaldırılıyor)

::: moniker-end

Bu içerik şunlar için geçerlidir:onay işaretiv3.1 (GA) | En son sürüm:purple-checkmarkv4.0 (GA) | Önceki sürümler:blue-checkmarkv3.0blue-checkmarkv2.1

Bu içerik şunlar için geçerlidir:red-checkmarkv3.0 (kullanımdan kaldırılıyor) | Latest versions:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Önceki sürüm:blue-checkmarkv2.1 (kullanımdan kaldırılıyor)

Bu içerik için geçerlidir:red-checkmarkv2.1 | En son sürüm:blue-checkmarkv4.0 (GA)

Belge Yönetim Bilgileri fatura modeli, satış faturalarından, yardımcı program faturalarından ve satınalma siparişlerinden önemli alanları ve satır öğelerini analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini kullanır. Faturalar telefon tarafından yakalanan görüntüler, taranan belgeler ve dijital PDF'ler gibi çeşitli biçimlerde ve kalitede olabilir. API fatura metnini analiz eder; müşteri adı, fatura adresi, son tarih ve vadesi gelen tutar gibi önemli bilgileri ayıklar; ve yapılandırılmış bir JSON veri gösterimi döndürür. Model şu anda 27 dilde faturaları desteklemektedir.

Desteklenen belge türleri:

  • Fatura
  • Faturalar
  • Satış siparişleri
  • Satınalma siparişleri

Otomatik fatura işleme

Otomatik fatura işleme, ödeme hesabı belgelerinden anahtar accounts payable alanları ayıklama işlemidir. Ayıklanan veriler, inceleme ve ödeme amacıyla alacak hesapları (AP) iş akışlarınızla entegre edilmiş faturalardan gelen satır öğelerini içerir. Geçmişte, borç hesapları işlemi el ile gerçekleştirilir ve bu nedenle çok zaman alır. Anahtar verilerin faturalardan doğru şekilde ayıkılması genellikle fatura otomasyon sürecinin ilk ve en kritik adımlarından biridir.

Document Intelligence Studio ile işlenen örnek fatura:

Document Intelligence Studio'da analiz edilen örnek faturanın ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracıyla işlenen örnek fatura:

Örnek faturanın ekran görüntüsü.

Geliştirme seçenekleri

Belge Yönetim Bilgileri v4.0: 2024-11-30 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak Model Kimliği
Fatura modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş fatura

Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak Model Kimliği
Fatura modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş fatura

Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak Model Kimliği
Fatura modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş fatura

Document Intelligence v2.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak
Fatura modeli Belge Yönetim Bilgileri etiketleme aracı
REST API
İstemci kitaplığı SDK'sı
Belge Yönetim Bilgileri Docker kapsayıcısı

Giriş gereksinimleri

Aşağıdaki dosya biçimleri desteklenir.

Modeli PDF Resim:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Okuma
Düzen
Genel belge
Önceden oluşturulmuş
Özel ayıklama
Özel sınıflandırma
  • Fotoğraflar ve taramalar: En iyi sonuçlar için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
  • PDF'ler ve TIFF'ler: PDF'ler ve TIFF'ler için en fazla 2.000 sayfa işlenebilir. (Ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir.)
  • Dosya boyutu: Belgeleri analiz etmek için dosya boyutu ücretli (S0) katmanı için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
  • Görüntü boyutları: Boyutlar 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
  • Parola kilitleri: PDF'leriniz parola kilitliyse, göndermeden önce kilidi kaldırmanız gerekir.
  • Metin yüksekliği: Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta olan yaklaşık 8 noktalı metne karşılık gelir.
  • Özel model eğitimi: Eğitim verileri için en fazla sayfa sayısı, özel şablon modeli için 500 ve özel sinir modeli için 50.000'dir.
  • Özel ayıklama modeli eğitimi: Eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1 GB'tır.
  • Özel sınıflandırma modeli eğitimi: Eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 1 GB'tır. 2024-11-30 (GA) için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 2 GB'tır.
  • Office dosya türleri (DOCX, XLSX, PPTX): En fazla dize uzunluğu sınırı 8 milyon karakterdir.
  • Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.
  • Desteklenen PDF ve TIFF, en fazla 2.000 sayfa işlenir. Ücretsiz katman aboneleri için yalnızca ilk iki sayfa işlenir.
  • Desteklenen dosya boyutu 50 MB'tan az ve boyutlar en az 50 x 50 piksel ve en fazla 10.000 x 10.000 piksel olmalıdır.

Fatura modeli veri ayıklama

Müşteri bilgileri, satıcı ayrıntıları ve satır öğeleri dahil olmak üzere verilerin faturalardan nasıl ayıklandığına bakın. Aşağıdaki kaynaklara ihtiyacınız vardır:

  • Azure aboneliği: ücretsiz oluşturabilirsiniz.

  • Azure portalında Document Intelligence örneği. Hizmeti denemek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz. Kaynağınız dağıtıldıktan sonra anahtarınızı ve uç noktanızı almak için Kaynağa git'i seçin.

 Azure portalında anahtarların ve uç nokta konumunun ekran görüntüsü.

  1. Document Intelligence Studio giriş sayfasındaFaturalar'ı seçin.

  2. Örnek faturayı analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.

  3. Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:

    Document Intelligence Studio'da Çözümlemeyi çalıştır ve Çözümle seçenekleri düğmelerinin ekran görüntüsü.

Belge Zekası Örnek Etiketleme Aracı

  1. Belge Zekası Örnek Aracı'na gidin.

  2. Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.

    Düzen modeli analiz sonuçları işleminin ekran görüntüsü.

  3. Açılan menüden analiz etmek için Form Türü'nü seçin.

  4. Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:

  5. Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.

    Kaynak konumu açılan menüsünün ekran görüntüsü.

  6. Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.

  7. Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.

    Ekran görüntüsü, select-form-type açılan menüsünü gösteriyor.

  8. Analizi çalıştır'ı seçin. Belge Zekası Örnek Etiketleme aracı, Önceden Oluşturulmuş API'yi Çağır ve Belgeleri Analiz Et fonksiyonunu çalıştırır.

  9. Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.

    Düzen modeli sonuçları analiz etme işleminin ekran görüntüsü.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için önceden oluşturulmuş model dili destek sayfamıza bakın.

Alan çıkartma

  • Desteklenen belge ayıklama alanları için GitHub örnek deposundaki invoice model şeması sayfasına bakınız.

  • Ayıklanan fatura anahtar-değer çiftleri ve satır öğeleri, JSON çıkışının documentResults bölümünde yer alır.

Anahtar-değer çiftleri

Önceden oluşturulmuş fatura modeli, anahtar-değer çiftlerinin isteğe bağlı iadesini destekler. Varsayılan olarak, anahtar-değer çiftlerinin dönüşü devre dışıdır. Anahtar-değer çiftleri, faturada bir etiketi veya anahtarı ve ilişkili yanıtını veya değerini tanımlayan belirli aralıklardır. Bir faturada, bu çiftler etiket ve kullanıcının ilgili alan veya telefon numarası için girdiği değer olabilir. Yapay zeka modeli, çok çeşitli belge türlerine, biçimlere ve yapılara göre tanımlanabilir anahtarları ve değerleri ayıklamak için eğitilir.

Model bir anahtarın mevcut olduğunu ve ilişkili bir değer olmadığını algıladığında veya isteğe bağlı alanlar işlenirken, anahtarlar da tek başına bulunabilir. Örneğin, bazı durumlarda ikinci ad alanı formda boş bırakılabilir. Anahtar-değer çiftleri her zaman belgede yer alan metin aralıklarıdır. Aynı değerin müşteri/kullanıcı gibi farklı şekillerde açıklandığı belgeler için, ilişkili anahtar müşteri veya kullanıcıdır (bağlama göre).

JSON çıkışı

JSON çıkışı üç bölümden oluşur:

  • "readResults" düğüm, tanınan tüm metinleri ve seçim işaretlerini içerir. Metin, sayfa, satır ve sonra tek tek sözcüklerle düzenlenir.
  • "pageResults" düğümü, sınırlayıcı kutularına sahip ayıklanmış tabloları ve hücreleri, doğruluk derecesi ve readResults içindeki satır ve sözcüklere referansları içerir.
  • "documentResults" düğüm, modelin keşfettiği faturaya özgü değerleri ve satır öğelerini içerir. Faturadaki fatura kimliği, sevk yeri, fatura yeri, müşteri, toplam, satır öğeleri ve çok daha fazlası gibi tüm alanları bulabileceğiniz yerdir.

Geçiş kılavuzu

::: moniker-end

Sonraki adımlar