Doküman Zekası makbuz modeli

Bu içerik için geçerlidir:onay işaretiv4.0 (GA) | Önceki sürümler:mavi onay işaretiv3.1 (GA)kırmızı onay işaretiv3.0 (kullanımdan kaldırılıyor)kırmızı onay işaretiv2.1 (kullanımdan kaldırılıyor)

Bu içerik şunlar için geçerlidir:onay işaretiv3.1 (GA) | En son sürüm:purple-checkmarkv4.0 (GA) | Önceki sürümler:blue-checkmarkv3.0blue-checkmarkv2.1

Bu içerik şunlar için geçerlidir:red-checkmarkv3.0 (kullanımdan kaldırılıyor) | Latest versions:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Önceki sürüm:blue-checkmarkv2.1 (kullanımdan kaldırılıyor)

Bu içerik için geçerlidir:red-checkmarkv2.1 | En son sürüm:blue-checkmarkv4.0 (GA)

Belge Zekası makbuz modeli, satış makbuzlarından önemli bilgileri analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini derin öğrenme modelleriyle birleştirir. Makbuzlar, basılı ve el yazısı makbuzlar dahil olmak üzere çeşitli biçimlerde ve kalitede olabilir. API satıcı adı, satıcı telefon numarası, işlem tarihi, vergi ve işlem toplamı gibi önemli bilgileri ayıklar ve yapılandırılmış JSON verilerini döndürür. Makbuz modeli v4.0 (GA), genel otel makbuzlarında KDV tablosu ayıklama ile birlikte, ReceiptType, TaxDetails.NetAmount, TaxDetails.Description, TaxDetails.Rate ve CountryRegion gibi diğer alanları destekler.

Fiş bilgisi veri işleme

Makbuz dijitalleştirmesi taranan, fotoğraflanan ve yazdırılan kopyalar da dahil olmak üzere çeşitli makbuz türlerinin kolaylaştırılmış aşağı akış işleme için dijital bir biçime dönüştürülmesidir. Örnek olarak gider yönetimi, tüketici davranışı analizi, vergi otomasyonu gibi örnekler verilebilir. OCR (Optik Karakter Tanıma) teknolojisiyle Belge Zekası'nın kullanılması, bu çeşitli makbuz biçimlerinden verileri ayıklayabilir ve yorumlayabilir. Belge Zekası işleme, dönüştürme işlemini basitleştirir, aynı zamanda gereken süreyi ve çabayı önemli ölçüde azaltarak verimli veri yönetimini ve alımı kolaylaştırır.

Document Intelligence Studio ile işlenen örnek alındı bilgisi:

Document Intelligence Studio'da işlenen örnek makbuzun ekran görüntüsü.

Belge Zekası Örnek Etiketleme aracıyla işlenen örnek makbuz:

Form Örneği Etiketleme Aracı ile işlenmiş örnek makbuzun ekran görüntüsü.

Geliştirme seçenekleri

Belge Yönetim Bilgileri v4.0: 2024-11-30 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak Model Kimliği
Makbuz modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş makbuz

Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak Model Kimliği
Makbuz modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş makbuz

Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak Model Kimliği
Makbuz modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
önceden oluşturulmuş makbuz

Document Intelligence v2.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak
Makbuz modeli Belge Yönetim Bilgileri etiketleme aracı
REST API
İstemci kitaplığı SDK'sı
Belge Yönetim Bilgileri Docker kapsayıcısı

Giriş gereksinimleri

Aşağıdaki dosya biçimleri desteklenir.

Modeli PDF Resim:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Okuma
Düzen
Genel belge
Önceden oluşturulmuş
Özel ayıklama
Özel sınıflandırma
  • Fotoğraflar ve taramalar: En iyi sonuçlar için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
  • PDF'ler ve TIFF'ler: PDF'ler ve TIFF'ler için en fazla 2.000 sayfa işlenebilir. (Ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir.)
  • Dosya boyutu: Belgeleri analiz etmek için dosya boyutu ücretli (S0) katmanı için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
  • Görüntü boyutları: Boyutlar 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
  • Parola kilitleri: PDF'leriniz parola kilitliyse, göndermeden önce kilidi kaldırmanız gerekir.
  • Metin yüksekliği: Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta olan yaklaşık 8 noktalı metne karşılık gelir.
  • Özel model eğitimi: Eğitim verileri için en fazla sayfa sayısı, özel şablon modeli için 500 ve özel sinir modeli için 50.000'dir.
  • Özel ayıklama modeli eğitimi: Eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1 GB'tır.
  • Özel sınıflandırma modeli eğitimi: Eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 1 GB'tır. 2024-11-30 (GA) için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 2 GB'tır.
  • Office dosya türleri (DOCX, XLSX, PPTX): En fazla dize uzunluğu sınırı 8 milyon karakterdir.
  • Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.
  • PDF ve TIFF için desteklenen sayfa izni: Belge Zekası, standart katman aboneleri için 2.000 sayfaya kadar veya serbest katmanlı aboneler için yalnızca ilk iki sayfayı işleyebilir.
  • Desteklenen dosya boyutu: 50 MB'tan az; en düşük piksel 50 x 50 piksel; maksimum piksel 10.000 x 10.000 piksel.

Makbuz şablon veri ayıklama

İşlemlerin saati ve tarihi, satıcı bilgileri ve makbuzlardan elde edilen tutar toplamları da dahil olmak üzere Belge Yönetim Bilgileri'nin verileri nasıl ayıkladiğini görün. Aşağıdaki kaynaklara ihtiyacınız vardır:

  • Azure aboneliği: ücretsiz oluşturabilirsiniz.

  • Azure portalında Document Intelligence örneği. Hizmeti denemek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz. Kaynağınız dağıtıldıktan sonra anahtarınızı ve uç noktanızı almak için Kaynağa git'i seçin.

 Azure portalında anahtarların ve uç nokta konumunun ekran görüntüsü.

Not

Document Intelligence Studio, v3.1 ve v3.0 API'leri ve sonraki sürümlerle kullanılabilir.

  1. Document Intelligence Studio giriş sayfasındaMakbuzlar'ı seçin.

  2. Örnek makbuzu analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.

  3. Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:

    Document Intelligence Studio'da Çözümlemeyi çalıştır ve Çözümle seçenekleri düğmelerinin ekran görüntüsü.

Belge Zekası Örnek Etiketleme Aracı

  1. Belge Zekası Örnek Aracı'na gidin.

  2. Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.

    Düzen modeli analiz sonuçları işleminin ekran görüntüsü.

  3. Açılan menüden analiz etmek için Form Türü'nü seçin.

  4. Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:

  5. Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.

    Kaynak konumu açılan menüsünün ekran görüntüsü.

  6. Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.

  7. Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.

    Form türü seç açılır menüsünün ekran görüntüsü.

  8. Analizi çalıştır'ı seçin. Belge Zekası Örnek Etiketleme aracı, Önceden Oluşturulmuş API'yi Çağır ve Belgeleri Analiz Et fonksiyonunu çalıştırır.

  9. Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.

    Düzen modeli sonuçları analiz etme işleminin ekran görüntüsü.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için önceden oluşturulmuş modeller dil desteği sayfamıza bakın.

Alan çıkartma

Desteklenen belge ayıklama alanları için GitHub örnek depomuzdaki receipt model şeması sayfasına bakın

Adı Türü Açıklama Standartlaştırılmış çıkış
Fiş Türü Dize Satış makbuzu türü Dökümü
MerchantName Dize Makbuzu veren satıcının adı
SatıcıTelefonNumarası Telefon Numarası Listelenen satıcı telefon numarası +1 xxx xxx xxxx
Tüccar Adresi Dize Satıcının listelenen adresi
İşlemTarihi Tarih Makbuzun düzenlendiği tarih yyyy-mm-dd
İşlem Zamanı Zaman Alındının verildiği zaman hh-mm-ss (24 saat)
Toplam Sayı (ABD Doları) Fişin tam işlem toplamı İki ondalıklı kayan nokta
Alt toplam Sayı (ABD Doları) Çoğunlukla vergiler uygulanmadan önce makbuzun alt toplamı İki ondalıklı kayan noktalı sayı
Vergi Sayı (ABD Doları) Makbuz üzerindeki toplam vergi (genellikle satış vergisi veya eşdeğeri). 2022-06-30 sürümünde "TotalTax" olarak yeniden adlandırıldı. İki ondalıklı kayan nokta
Ipucu Sayı (ABD Doları) Alıcı tarafından dahil edilen ipucu İki ondalıklı float
Öğeler Nesne dizisi İsim, miktar, birim fiyat ve toplam fiyat ile ayıklanan satır öğeleri
Adı Dize Öğe açıklaması. 2022-06-30 sürümünde "Açıklama" olarak yeniden adlandırıldı.
Miktar Numara Her öğenin miktarı İki ondalıklı kayan nokta
Fiyat Numara Her bir madde biriminin bireysel fiyatı İki ondalıklı kayan nokta
Toplam Fiyat Numara Satır öğesinin toplam fiyatı İki ondalıklı kayan nokta

Geçiş kılavuzu ve REST API v3.1

Sonraki adımlar