Belge Yönetim Bilgileri fatura modeli

Bu içerik şunlar için geçerlidir:Checkmarkv4.0 (GA) | Önceki sürümler:mavi onay işaretiv3.1 (GA)mavi onay işaretiv3.0 (GA)mavi onay işaretiv2.1 (GA)

::: moniker-end

Bu içerik şunlar için geçerlidir:Checkmarkv3.1 (GA) | En son sürüm:mor onay işareti v4.0 (GA) | Önceki sürümler: mavi onay işaretiv3.0mavi onay işaretiv2.1

Bu içerik şunlar için geçerlidir:Checkmarkv3.0 (GA) | En son sürümler:mor onay işareti v4.0 (GA) mor onay işaretiv3.1 | Önceki sürüm:mavi onay işaretiv2.1

Bu içerik şunlar için geçerlidir:Checkmarkv2.1 | En son sürüm:mavi onay işaretiv4.0 (GA)

Belge Yönetim Bilgileri fatura modeli, satış faturalarından, yardımcı program faturalarından ve satınalma siparişlerinden önemli alanları ve satır öğelerini analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini kullanır. Faturalar telefon tarafından yakalanan görüntüler, taranan belgeler ve dijital PDF'ler gibi çeşitli biçimlerde ve kalitede olabilir. API fatura metnini analiz eder; müşteri adı, fatura adresi, son tarih ve vadesi gelen tutar gibi önemli bilgileri ayıklar; ve yapılandırılmış bir JSON veri gösterimi döndürür. Model şu anda 27 dilde faturaları desteklemektedir.

Desteklenen belge türleri:

  • Faturalar
  • Yardımcı program faturaları
  • Satış siparişleri
  • Satınalma siparişleri

Otomatik fatura işleme

Otomatik fatura işleme, ödeme hesabı belgelerinden anahtar accounts payable alanları ayıklama işlemidir. Ayıklanan veriler, gözden geçirmeler ve ödemeler için borç hesapları (AP) iş akışlarınızla tümleştirilmiş faturalardan gelen satır öğelerini içerir. Geçmişte, borç hesapları işlemi el ile gerçekleştirilir ve bu nedenle çok zaman alır. Anahtar verilerin faturalardan doğru şekilde ayıkılması genellikle fatura otomasyon sürecinin ilk ve en kritik adımlarından biridir.

Document Intelligence Studio ile işlenen örnek fatura:

Document Intelligence Studio'da analiz edilen örnek faturanın ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracıyla işlenen örnek fatura:

Örnek faturanın ekran görüntüsü.

Dağıtım seçenekleri

Belge Yönetim Bilgileri v4.0: 2024-11-30 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Fatura modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş fatura

Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Fatura modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş fatura

Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Fatura modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş fatura

Document Intelligence v2.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Giriş gereksinimleri

Desteklenen dosya biçimleri:

Model PDF Resim:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Microsoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Okundu
Düzen
Genel Belge
Önceden oluşturulmuş
Özel ayıklama
Özel sınıflandırma
  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve 4 ücretsiz (F0) katman için MB'tır.

  • Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir 8 .

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve 1 sinir modeli için GB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır 1 . 2024-11-30 (GA) için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır 2 .

  • Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.
  • Desteklenen PDF ve TIFF, en fazla 2.000 sayfa işlenir. Ücretsiz katman aboneleri için yalnızca ilk iki sayfa işlenir.
  • Desteklenen dosya boyutu 50 MB'tan az ve boyutlar en az 50 x 50 piksel ve en fazla 10.000 x 10.000 piksel olmalıdır.

Fatura modeli veri ayıklama

Müşteri bilgileri, satıcı ayrıntıları ve satır öğeleri dahil olmak üzere verilerin faturalardan nasıl ayıklandığına bakın. Aşağıdaki kaynaklara ihtiyacınız vardır:

Azure portalında anahtarların ve uç nokta konumunun ekran görüntüsü.

  1. Document Intelligence Studio giriş sayfasında Faturalar'ı seçin.

  2. Örnek faturayı analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.

  3. Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:

    Document Intelligence Studio'da Çözümlemeyi çalıştır ve Çözümle seçenekleri düğmelerinin ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracı

  1. Belge Yönetim Bilgileri Örnek Aracı'na gidin.

  2. Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.

    Düzen modeli analiz sonuçları işleminin ekran görüntüsü.

  3. Açılan menüden analiz etmek için Form Türü'nü seçin.

  4. Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:

  5. Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.

    Kaynak konumu açılan menüsünün ekran görüntüsü.

  6. Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.

  7. Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.

    select-form-type açılan menüsünü gösteren ekran görüntüsü.

  8. Analizi çalıştır'ı seçin. Belge Yönetim Bilgileri Örnek Etiketleme aracı, Önceden Oluşturulmuş API'yi Analiz Et ve belgeyi analiz et'i çağırır.

  9. Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.

    Düzen modeli sonuçları analiz etme işleminin ekran görüntüsü.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için önceden oluşturulmuş model dili destek sayfamıza bakın.

Alan ayıklama

  • Desteklenen belge ayıklama alanları için GitHub örnek depomuzdaki fatura modeli şema sayfasına bakın.

  • Ayıklanan fatura anahtar-değer çiftleri ve satır öğeleri JSON çıkışının bölümünde yer alır documentResults .

Anahtar değer çiftleri

Önceden oluşturulmuş fatura modeli, anahtar-değer çiftlerinin isteğe bağlı iadesini destekler. Varsayılan olarak, anahtar-değer çiftlerinin dönüşü devre dışıdır. Anahtar-değer çiftleri, faturada bir etiketi veya anahtarı ve ilişkili yanıtını veya değerini tanımlayan belirli aralıklardır. Bir faturada, bu çiftler etiket ve kullanıcının bu alan veya telefon numarası için girdiği değer olabilir. Yapay zeka modeli, çok çeşitli belge türlerine, biçimlere ve yapılara göre tanımlanabilir anahtarları ve değerleri ayıklamak için eğitilir.

Model bir anahtarın mevcut olduğunu algıladığında, ilişkili değer olmadan veya isteğe bağlı alanları işlerken de anahtarlar yalıtılabilir. Örneğin, bazı durumlarda ikinci ad alanı formda boş bırakılabilir. Anahtar-değer çiftleri her zaman belgede yer alan metin aralıklarıdır. Aynı değerin müşteri/kullanıcı gibi farklı şekillerde açıklandığı belgeler için, ilişkili anahtar müşteri veya kullanıcıdır (bağlama göre).

JSON çıkışı

JSON çıkışı üç bölümden oluşur:

  • "readResults" düğüm, tanınan tüm metinleri ve seçim işaretlerini içerir. Metin, sayfa, satır ve sonra tek tek sözcüklerle düzenlenir.
  • "pageResults" düğüm, sınırlayıcı kutularıyla ayıklanan tabloları ve hücreleri, güveni ve readResults içindeki satır ve sözcüklere başvuruyu içerir.
  • "documentResults" düğüm, modelin keşfettiği faturaya özgü değerleri ve satır öğelerini içerir. Faturadaki fatura kimliği, sevk yeri, fatura yeri, müşteri, toplam, satır öğeleri ve çok daha fazlası gibi tüm alanları bulabileceğiniz yerdir.

Geçiş kılavuzu

  • Uygulamalarınızda ve iş akışlarınızda v3.0 sürümünü kullanmayı öğrenmek için Belge Zekası v3.1 geçiş kılavuzumuzu izleyin.

::: moniker-end

Sonraki adımlar