Bu içerik şunlar için geçerlidir:v3.1 (GA) | En son sürüm: v4.0 (GA) | Önceki sürümler: v3.0v2.1
Bu içerik şunlar için geçerlidir:v3.0 (GA) | En son sürümler: v4.0 (GA) v3.1 | Önceki sürüm:v2.1
Bu içerik şunlar için geçerlidir:v2.1 | En son sürüm:v4.0 (GA)
Belge Yönetim Bilgileri fatura modeli, satış faturalarından, yardımcı program faturalarından ve satınalma siparişlerinden önemli alanları ve satır öğelerini analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini kullanır. Faturalar telefon tarafından yakalanan görüntüler, taranan belgeler ve dijital PDF'ler gibi çeşitli biçimlerde ve kalitede olabilir. API fatura metnini analiz eder; müşteri adı, fatura adresi, son tarih ve vadesi gelen tutar gibi önemli bilgileri ayıklar; ve yapılandırılmış bir JSON veri gösterimi döndürür. Model şu anda 27 dilde faturaları desteklemektedir.
Desteklenen belge türleri:
Faturalar
Yardımcı program faturaları
Satış siparişleri
Satınalma siparişleri
Otomatik fatura işleme
Otomatik fatura işleme, ödeme hesabı belgelerinden anahtar accounts payable alanları ayıklama işlemidir. Ayıklanan veriler, gözden geçirmeler ve ödemeler için borç hesapları (AP) iş akışlarınızla tümleştirilmiş faturalardan gelen satır öğelerini içerir. Geçmişte, borç hesapları işlemi el ile gerçekleştirilir ve bu nedenle çok zaman alır. Anahtar verilerin faturalardan doğru şekilde ayıkılması genellikle fatura otomasyon sürecinin ilk ve en kritik adımlarından biridir.
Document Intelligence Studio ile işlenen örnek fatura:
Belge Yönetim Bilgileri Örnek Etiketleme aracıyla işlenen örnek fatura:
Dağıtım seçenekleri
Belge Yönetim Bilgileri v4.0: 2024-11-30 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:
Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Okundu
✔
✔
✔
Düzen
✔
✔
✔
Genel Belge
✔
✔
Önceden oluşturulmuş
✔
✔
Özel ayıklama
✔
✔
Özel sınıflandırma
✔
✔
✔
En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
PDF ve TIFF için en fazla 2.000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve 4 ücretsiz (F0) katman için MB'tır.
Görüntü boyutları 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, yaklaşık 150 nokta/inç (DPI) nokta metnine karşılık gelir 8 .
Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve 1 sinir modeli için GB'tır.
Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile GB'tır 1 . 2024-11-30 (GA) için eğitim verilerinin toplam boyutu gb ve en fazla 10.000 sayfadır 2 .
Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.
Desteklenen PDF ve TIFF, en fazla 2.000 sayfa işlenir. Ücretsiz katman aboneleri için yalnızca ilk iki sayfa işlenir.
Desteklenen dosya boyutu 50 MB'tan az ve boyutlar en az 50 x 50 piksel ve en fazla 10.000 x 10.000 piksel olmalıdır.
Fatura modeli veri ayıklama
Müşteri bilgileri, satıcı ayrıntıları ve satır öğeleri dahil olmak üzere verilerin faturalardan nasıl ayıklandığına bakın. Aşağıdaki kaynaklara ihtiyacınız vardır:
Azure portalında bir Belge Zekası örneği. Hizmeti denemek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz. Kaynağınız dağıtıldıktan sonra anahtarınızı ve uç noktanızı almak için Kaynağa git'i seçin.
Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.
Desteklenen diller ve yerel ayarlar
Desteklenen dillerin tam listesi için önceden oluşturulmuş model dili destek sayfamıza bakın.
Alan ayıklama
Desteklenen belge ayıklama alanları için GitHub örnek depomuzdaki fatura modeli şema sayfasına bakın.
Ayıklanan fatura anahtar-değer çiftleri ve satır öğeleri JSON çıkışının bölümünde yer alır documentResults .
Anahtar değer çiftleri
Önceden oluşturulmuş fatura modeli, anahtar-değer çiftlerinin isteğe bağlı iadesini destekler. Varsayılan olarak, anahtar-değer çiftlerinin dönüşü devre dışıdır. Anahtar-değer çiftleri, faturada bir etiketi veya anahtarı ve ilişkili yanıtını veya değerini tanımlayan belirli aralıklardır. Bir faturada, bu çiftler etiket ve kullanıcının bu alan veya telefon numarası için girdiği değer olabilir. Yapay zeka modeli, çok çeşitli belge türlerine, biçimlere ve yapılara göre tanımlanabilir anahtarları ve değerleri ayıklamak için eğitilir.
Model bir anahtarın mevcut olduğunu algıladığında, ilişkili değer olmadan veya isteğe bağlı alanları işlerken de anahtarlar yalıtılabilir. Örneğin, bazı durumlarda ikinci ad alanı formda boş bırakılabilir. Anahtar-değer çiftleri her zaman belgede yer alan metin aralıklarıdır. Aynı değerin müşteri/kullanıcı gibi farklı şekillerde açıklandığı belgeler için, ilişkili anahtar müşteri veya kullanıcıdır (bağlama göre).
JSON çıkışı
JSON çıkışı üç bölümden oluşur:
"readResults" düğüm, tanınan tüm metinleri ve seçim işaretlerini içerir. Metin, sayfa, satır ve sonra tek tek sözcüklerle düzenlenir.
"pageResults" düğüm, sınırlayıcı kutularıyla ayıklanan tabloları ve hücreleri, güveni ve readResults içindeki satır ve sözcüklere başvuruyu içerir.
"documentResults" düğüm, modelin keşfettiği faturaya özgü değerleri ve satır öğelerini içerir. Faturadaki fatura kimliği, sevk yeri, fatura yeri, müşteri, toplam, satır öğeleri ve çok daha fazlası gibi tüm alanları bulabileceğiniz yerdir.
Geçiş kılavuzu
Uygulamalarınızda ve iş akışlarınızda v3.0 sürümünü kullanmayı öğrenmek için Belge Zekası v3.1 geçiş kılavuzumuzu izleyin.
Diğer geliştiriciler ve uzmanlarla gerçek dünyadaki kullanım örneklerini temel alan ölçeklenebilir yapay zeka çözümleri oluşturmak için toplantı serisine katılın.
Belgelerinizden önemli verileri ve yapı öğelerini ayıklayan bir form işleme uygulaması oluşturmak için Belge Yönetim Bilgileri SDK'sını veya REST API'sini kullanın.
Belge Yönetim Bilgileri istemci kitaplıklarını veya REST API'sini kullanmayı ve belgelerden önemli verileri ayıklamak için uygulamalar oluşturmayı öğrenin.