Belge işleme modelleri
Önemli
- Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar.
- Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
- Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-02-29-preview'dır.
- Genel önizleme sürümü 2024-02-29-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir:
- Doğu ABD
- Batı ABD2
- Batı Avrupa
Bu içerik şunlar için geçerlidir:v4.0 (önizleme) | Önceki sürümler:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Bu içerik:v3.1 (GA) | En son sürüm:v4.0 (önizleme) | Önceki sürümler:v3.0v2.1 için geçerlidir
Bu içerik:v3.0 (GA) | En son sürümler:v4.0 (önizleme)v3.1 | Önceki sürüm:v2.1 için geçerlidir
Bu içerik:v2.1 | En son sürüm:v4.0 (önizleme) için geçerlidir
Azure AI Belge Zekası, uygulamalarınıza ve akışlarınıza akıllı belge işleme eklemenize olanak tanıyan çok çeşitli modelleri destekler. Önceden oluşturulmuş etki alanına özgü bir model kullanabilir veya özel iş ihtiyaçlarınıza ve kullanım örneklerinize göre uyarlanmış özel bir model eğitebilirsiniz. Belge Zekası REST API veya Python, C#, Java ve JavaScript istemci kitaplıklarıyla kullanılabilir.
Modele genel bakış
Aşağıdaki tabloda, her geçerli önizleme ve kararlı API için kullanılabilir modeller gösterilmektedir:
Model Türü | Model | • 2024-02-29-preview • 2023-10-31-preview |
2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
---|---|---|---|---|---|
Belge çözümleme modelleri | Okuma | ✔️ | ✔️ | ✔️ | yok |
Belge çözümleme modelleri | Düzen | ✔️ | ✔️ | ✔️ | ✔️ |
Belge çözümleme modelleri | Genel belge | düzene taşındı** | ✔️ | ✔️ | yok |
Önceden oluşturulmuş modeller | Sözleşme | ✔️ | ✔️ | yok | yok |
Önceden oluşturulmuş modeller | Sağlık sigortası kartı | ✔️ | ✔️ | ✔️ | yok |
Önceden oluşturulmuş modeller | Kimlik belgesi | ✔️ | ✔️ | ✔️ | ✔️ |
Önceden oluşturulmuş modeller | Fatura | ✔️ | ✔️ | ✔️ | ✔️ |
Önceden oluşturulmuş modeller | Makbuz | ✔️ | ✔️ | ✔️ | ✔️ |
Önceden oluşturulmuş modeller | US 1040 Tax* | ✔️ | ✔️ | yok | yok |
Önceden oluşturulmuş modeller | US 1098 Tax* | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD 1099 Vergisi* | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD W2 Vergisi | ✔️ | ✔️ | ✔️ | yok |
Önceden oluşturulmuş modeller | ABD Mortgage 1003 URLA | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD Mortgage 1008 Özeti | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | ABD Mortgage kapanış açıklaması | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | Evlilik sertifikası | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | Kredi kartı | ✔️ | yok | yok | yok |
Önceden oluşturulmuş modeller | Kartvizit | kullanım dışı | ✔️ | ✔️ | ✔️ |
Özel sınıflandırma modeli | Özel sınıflandırıcı | ✔️ | ✔️ | yok | yok |
Özel ayıklama modeli | Özel nöral | ✔️ | ✔️ | ✔️ | yok |
Özel ifade modeli | Özel şablon | ✔️ | ✔️ | ✔️ | ✔️ |
Özel ayıklama modeli | Özel oluşturulmuş | ✔️ | ✔️ | ✔️ | ✔️ |
Tüm modeller | Eklenti özellikleri | ✔️ | ✔️ | yok | yok |
* - Alt modelleri içerir. Desteklenen varyasyonlar ve alt türler için modele özgü bilgilere bakın.
Eklenti Özelliği | Eklenti/Ücretsiz | • 2024-02-29-preview &bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-2024-02-29-preview&preserve-view=true |
2023-07-31 (GA) |
2022-08-31 (GA) |
v2.1 (GA) |
---|---|---|---|---|---|
Yazı tipi özelliği ayıklama | Eklenti | ✔️ | ✔️ | yok | yok |
Formül ayıklama | Eklenti | ✔️ | ✔️ | yok | yok |
Yüksek çözünürlüklü ayıklama | Eklenti | ✔️ | ✔️ | yok | yok |
Barkod ayıklama | Ücretsiz | ✔️ | ✔️ | yok | yok |
Dil algılama | Ücretsiz | ✔️ | ✔️ | yok | yok |
Anahtar değer çiftleri | Ücretsiz | ✔️ | yok | yok | yok |
Sorgu alanları | Eklenti* | ✔️ | yok | yok | yok |
Model analizi özellikleri
Model Kimliği | İçerik Ayıklama | Sorgu alanları | Paragraf | Paragraf Rolleri | Seçim İşaretleri | Tablolar | Anahtar-Değer Çiftleri | Diller | Barkod | Belge Analizi | Formül* | Stil Yazı Tipi* | Yüksek Çözünürlük* |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
önceden oluşturulmuş okuma | ✓ | O | O | O | O | O | |||||||
önceden oluşturulmuş düzen | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
önceden oluşturulmuş belge | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |
önceden oluşturulmuş businessCard | ✓ | ✓ | ✓ | ||||||||||
önceden oluşturulmuş sözleşme | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
önceden oluşturulmuş fatura | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | ||
önceden oluşturulmuş makbuz | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
önceden oluşturulmuş creditCard | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
önceden oluşturulmuş tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1099(çeşitlemeler) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1040(çeşitlemeler) | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Etkin
O - İsteğe bağlı
* - Premium özellikler ekstra maliyetler doğurabilir
Eklenti* - Sorgu alanlarının fiyatı diğer eklenti özelliklerinden farklıdır. Ayrıntılar için fiyatlandırmaya bakın.
Model | Açıklama |
---|---|
Belge çözümleme modelleri | |
Oku OCR | Sözcükler, konumlar ve algılanan diller de dahil olmak üzere basılı ve el yazısı metinleri ayıklayın. |
Düzen analizi | Tablolar, seçim işaretleri, başlıklar, bölüm başlıkları ve daha fazlası gibi metin ve belge düzeni öğelerini ayıklayın. |
Önceden oluşturulmuş modeller | |
Sağlık sigortası kartı | ABD sağlık sigortası kartlarından sigortacı, üye, reçete, grup numarası ve diğer önemli bilgileri ayıklayarak sağlık süreçlerini otomatikleştirin. |
ABD Vergi belgesi modelleri | Çalışan, işveren, ücret ve diğer bilgileri ayıklamak için ABD vergi formlarını işleme. |
ABD Mortgage belge modelleri | Ödünç almacı kredisi ve mülk bilgilerini ayıklamak için ABD ipotek formlarını işleme. |
Sözleşme | Sözleşme ve taraf ayrıntılarını ayıklayın. |
Fatura | Faturaları otomatikleştirme. |
Makbuz | Makbuzlardan alındı bilgisi verilerini ayıklayın. |
Kimlik belgesi (Kimlik) | ABD sürücü lisanslarından ve uluslararası pasaportlardan kimlik (KIMLIK) alanlarını ayıklayın. |
Kartvizit | Uygulamalarınıza önemli alanları ve verileri ayıklamak için kartvizitleri tarayın. |
Özel modeller | |
Özel model (genel bakış) | İşletmenize özgü formlardan ve belgelerden veri ayıklama. Özel modeller, ayrı verileriniz ve kullanım örnekleriniz için eğitilir. |
Özel ayıklama modelleri | ● Özel şablon modelleri , belgelerden değer ayıklamak için düzen ipuçlarını kullanır ve tanımlı görsel şablonlarla yüksek oranda yapılandırılmış belgelerden alan ayıklamaya uygundur. ● Özel sinir modelleri , yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış belgelerden alanları ayıklamak için çeşitli belge türleri üzerinde eğitilir. |
Özel sınıflandırma modeli | Özel sınıflandırma modeli, içindeki belgeleri tanımlamak için giriş dosyasındaki her sayfayı sınıflandırabilir ve ayrıca bir giriş dosyasındaki tek bir belgenin birden çok örneğini veya birden çok belgeyi tanımlayabilir. |
Oluşturulan modeller | Çeşitli belge türlerinin tek bir oluşturulmuş modelle işlenmesini otomatikleştirmek için birkaç özel modeli tek bir modelde birleştirin. |
Kartvizit modeli dışındaki tüm modellerde, Belge Zekası artık daha gelişmiş analizlere olanak sağlamak için eklenti özelliklerini destekliyor. Bu isteğe bağlı özellikler, belge ayıklama senaryosuna bağlı olarak etkinleştirilebilir ve devre dışı bırakılabilir. (GA) ve sonraki API sürümü için 2023-07-31
yedi eklenti özelliği vardır:
ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
(2024-02-29-preview, 2023-10-31-preview)queryFields
(2024-02-29-preview, 2023-10-31-preview)Not available with the US.Tax models
Model ayrıntıları
Bu bölümde, her modelden bekleyebileceğiniz çıkış açıklanmaktadır. Eklenti özellikleriyle çoğu modelin çıkışını genişletebileceğinizi lütfen unutmayın.
OCR okuma
Okuma API'si, algılanırsa satırları, sözcükleri, bunların konumlarını, algılanan dilleri ve el yazısı stilini analiz eder ve ayıklar.
Document Intelligence Studio kullanılarak işlenen örnek belge:
Düzen analizi
Düzen çözümleme modeli metinleri, tabloları, seçim işaretlerini ve başlıklar, bölüm başlıkları, sayfa üst bilgileri, sayfa alt bilgileri ve daha fazlası gibi diğer yapı öğelerini analiz eder ve ayıklar.
Document Intelligence Studio kullanılarak işlenen örnek belge:
Sağlık sigortası kartı
Sağlık sigortası kartı modeli, ABD sağlık sigortası kartlarından önemli bilgileri analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini derin öğrenme modelleri ile birleştirir.
Document Intelligence Studio kullanılarak işlenen örnek ABD sağlık sigortası kartı:
ABD vergi belgeleri
ABD vergi belgesi modelleri, belirli bir vergi belgesi grubundaki önemli alanları ve satır öğelerini analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD vergi belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:
Model | Açıklama | ModelKimliği |
---|---|---|
ABD Vergisi W-2 | Vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. | önceden oluşturulmuş-tax.us.W-2 |
ABD Vergisi 1040 | ipotek faizi ayrıntılarını ayıklayın. | prebuilt-tax.us.1040(çeşitlemeler) |
ABD Vergisi 1098 | ipotek faizi ayrıntılarını ayıklayın. | prebuilt-tax.us.1098(çeşitlemeler) |
ABD Vergisi 1099 | İşveren dışındaki kaynaklardan alınan geliri ayıklayın. | prebuilt-tax.us.1099(çeşitlemeler) |
Document Intelligence Studio kullanılarak işlenen örnek W-2 belgesi:
ABD ipotek belgeleri
ABD ipotek belge modelleri, belirli bir ipotek belgesi grubundan ödünç alan, kredi ve mülk bilgileri dahil olmak üzere önemli alanları analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD ipotek belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:
Model | Açıklama | ModelKimliği |
---|---|---|
1003 Son Kullanıcı Lisans Sözleşmesi (EULA) | Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. | prebuilt-mortgage.us.1003 |
1008 Özet belgesi | Ödünç almacı, satıcı, mülk, ipotek ve alt yazı bilgilerini ayıklayın. | prebuilt-mortgage.us.1008 |
Kapanış açıklaması | Kapanış, işlem maliyetleri ve kredi ayrıntılarını ayıklayın. | prebuilt-mortgage.us.closingDisclosure |
Evlilik sertifikası | Ortak kredi başvuru sahipleri için evlilik bilgileri bilgilerini ayıklayın. | önceden oluşturulmuş evlilikSertifika |
ABD Vergisi W-2 | Gelir doğrulaması için vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. | önceden oluşturulmuş-tax.us.W-2 |
Document Intelligence Studio kullanılarak işlenen Örnek Kapanış açıklama belgesi:
Contract
Sözleşme modeli, taraflar, yargı alanları, sözleşme kimliği ve unvan dahil olmak üzere sözleşme sözleşmelerindeki önemli alanları ve satır öğelerini analiz eder ve ayıklar. Model şu anda İngilizce sözleşme belgelerini desteklemektedir.
Document Intelligence Studio kullanılarak işlenen örnek sözleşme:
Fatura
Fatura modeli, müşteri adını, fatura adresini, son tarihi ve vadesi gelen tutarı, satır öğelerini ve diğer önemli verileri ayıklamak için faturaların işlenmesini otomatikleştirir. Model şu anda İngilizce, İspanyolca, Almanca, Fransızca, İtalyanca, Portekizce ve Felemenkçe faturaları desteklemektedir.
Document Intelligence Studio kullanılarak işlenen örnek fatura:
Makbuz
Satış makbuzlarını basılı ve el yazısı makbuzlardan satıcı adı, tarihler, satır öğeleri, miktarlar ve toplamlar için taramak için makbuz modelini kullanın. v3.0 sürümü, tek sayfalı otel makbuzu işlemeyi de destekler.
Document Intelligence Studio kullanılarak işlenen örnek alındı bilgisi:
Kimlik belgesi (Kimlik)
Anahtar alanları ayıklamak için ABD Sürücü Lisanslarını (50 eyaletin tamamı ve Columbia Bölgesi) ve uluslararası pasaportlardan biyografik sayfaları (vize ve diğer seyahat belgeleri hariç) işlemek için Kimlik belgesi (KIMLIK) modelini kullanın.
Document Intelligence Studio kullanılarak işlenen örnek ABD Sürücü Lisansı:
Evlilik sertifikası
Bireyler, tarih ve konum gibi önemli alanları ayıklamak üzere ABD evlilik sertifikalarını işlemek için evlilik sertifikası modelini kullanın.
Document Intelligence Studio kullanılarak işlenen örnek ABD evlilik sertifikası:
Kredi kartı
Anahtar alanlarını ayıklamak üzere kredi ve banka kartlarını işlemek için kredi kartı modelini kullanın.
Document Intelligence Studio kullanılarak işlenen örnek kredi kartı:
Özel modeller
Özel modeller geniş bir şekilde iki türe sınıflandırılabilir. Belirli bir belge türünden tanımlı şema ayıklayan "belge türü" sınıflandırması ve özel ayıklama modellerini destekleyen özel sınıflandırma modelleri.
Özel belge modelleri, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. Bunlar, ayrı içeriğinizdeki form alanlarını tanıyacak, anahtar-değer çiftlerini ve tablo verilerini ayıklayabilir. Başlamak için form türünün yalnızca bir örneğine ihtiyacınız vardır.
Sürüm v3.0 özel modeli, özel şablonda (form) imza algılamayı ve hem şablon hem de sinir modellerindeki çapraz sayfa tablolarını destekler.
Document Intelligence Studio kullanılarak işlenen örnek özel şablon:
Özel ayıklama
Özel ayıklama modeli, özel şablon veya özel sinir olmak üzere iki türden biri olabilir. Özel ayıklama modeli oluşturmak için, bir belge veri kümesini ayıklanmasını istediğiniz değerlerle etiketleyip etiketlenmiş veri kümesinde modeli eğitin. Başlamak için aynı form veya belge türünün yalnızca beş örneğine ihtiyacınız vardır.
Document Intelligence Studio kullanılarak işlenen örnek özel ayıklama:
Özel sınıflandırıcı
Özel sınıflandırma modeli, ayıklama modelini çağırmadan önce belge türünü tanımlamanızı sağlar. Sınıflandırma modeli API'den 2023-07-31 (GA)
başlayarak kullanılabilir. Özel sınıflandırma modelini eğiterek en az iki ayrı sınıf ve sınıf başına en az beş örnek gerekir.
Oluşturulan modeller
Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle adlı bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir oluşturulmuş modele en fazla 200 eğitilmiş özel model atayabilirsiniz.
Document Intelligence Studio'da oluşturulan model iletişim kutusu penceresi:
Giriş gereksinimleri
En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
Desteklenen dosya biçimleri:
Model PDF Resim:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTMLOkundu ✔ ✔ ✔ Düzen ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Genel Belge ✔ ✔ Önceden oluşturulmuş ✔ ✔ Özel ayıklama ✔ ✔ Özel sınıflandırma ✔ ✔ ✔ (2024-02-29-preview) PDF ve TIFF için en fazla 2000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (DPI) olan yaklaşık
8
noktalı metne karşılık gelir.Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.
Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır
1GB
.
Not
Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.
Sürüm geçişi
Belge Zekası v3.1 geçiş kılavuzumuzu izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenin
Model | Açıklama |
---|---|
Belge analizi | |
Düzen | Belgelerden metin ve düzen bilgilerini ayıklama. |
Önceden oluşturulmuş | |
Fatura | İngilizce ve İspanyolca faturalardan önemli bilgileri ayıklayın. |
Makbuz | İngilizce makbuzlardan önemli bilgileri ayıklayın. |
Kimlik belgesi | ABD sürücü lisanslarından ve uluslararası pasaportlardan önemli bilgileri ayıklayın. |
Kartvizit | İngilizce kartvizitlerden önemli bilgileri ayıklayın. |
Özel | |
Özel | İşletmenize özgü formlardan ve belgelerden veri ayıklama. Özel modeller, ayrı verileriniz ve kullanım örnekleriniz için eğitilir. |
Oluşan | Özel modellerden oluşan bir koleksiyon oluşturup bunları form türlerinizden oluşturulan tek bir modele atayın. |
Düzen
Düzen API'si belgelerden metin, tablo ve üst bilgiler, seçim işaretleri ve yapı bilgilerini analiz eder ve ayıklar.
Örnek Etiketleme aracı kullanılarak işlenen örnek belge:
Fatura
Fatura modeli, satış faturalarından önemli bilgileri analiz eder ve ayıklar. API faturaları çeşitli biçimlerde analiz eder ve müşteri adı, fatura adresi, son tarih ve son ödeme tutarı gibi önemli bilgileri ayıklar.
Örnek Etiketleme aracı kullanılarak işlenen örnek fatura:
Makbuz
- Makbuz modeli, yazdırılan ve el yazısı satış makbuzlarından önemli bilgileri analiz eder ve ayıklar.
Örnek Etiketleme aracı kullanılarak işlenen örnek alındı bilgisi:
Kimlik belgesi
Kimlik belgesi modeli, aşağıdaki belgelerden önemli bilgileri analiz eder ve ayıklar:
ABD Sürücü Lisansları (50 eyaletin tamamı ve Columbia Bölgesi)
Uluslararası pasaportlardan biyografik sayfalar (vize ve diğer seyahat belgeleri hariç). API, kimlik belgelerini analiz eder ve ayıklar
Örnek Etiketleme aracı kullanılarak işlenen örnek ABD Sürücü Lisansı:
Kartvizit
Kartvizit modeli, kartvizit görüntülerindeki önemli bilgileri analiz eder ve ayıklar.
Örnek Etiketleme aracı kullanılarak işlenen örnek kartvizit:
Özel
- Özel modeller, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. API, ayrı içeriğinizdeki form alanlarını tanımak ve anahtar-değer çiftleri ile tablo verilerini ayıklamak için eğitilmiş bir makine öğrenmesi programıdır. Başlamak için aynı form türüne yalnızca beş örnek gerekir ve özel modeliniz etiketli veri kümeleriyle veya etiketsiz olarak eğitilebilir.
Örnek Etiketleme aracını kullanarak örnek özel model işleme:
Oluşturulan özel model
Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle adlı bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir birleşik modele en fazla 100 eğitilmiş özel model atayabilirsiniz.
Örnek Etiketleme aracını kullanarak oluşturulan model iletişim kutusu penceresi:
Model veri ayıklama
Model | Metin ayıklama | Dil algılama | Seçim İşaretleri | Tablolar | Paragraf | Paragraf rolleri | Anahtar-Değer çiftleri | Alanlar |
---|---|---|---|---|---|---|---|---|
Düzen | ✓ | ✓ | ✓ | ✓ | ✓ | |||
Fatura | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Makbuz | ✓ | ✓ | ✓ | |||||
Kimlik Belgesi | ✓ | ✓ | ✓ | |||||
Kartvizit | ✓ | ✓ | ✓ | |||||
Özel Form | ✓ | ✓ | ✓ | ✓ | ✓ |
Giriş gereksinimleri
En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
Desteklenen dosya biçimleri:
Model PDF Resim:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTMLOkundu ✔ ✔ ✔ Düzen ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Genel Belge ✔ ✔ Önceden oluşturulmuş ✔ ✔ Özel ayıklama ✔ ✔ Özel sınıflandırma ✔ ✔ ✔ (2024-02-29-preview) PDF ve TIFF için en fazla 2000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).
Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.
Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (DPI) olan yaklaşık
8
noktalı metne karşılık gelir.Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.
Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.
Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır
1GB
.
Not
Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.
Sürüm geçişi
Belge Zekası v3.1 geçiş kılavuzumuzu izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenebilirsiniz
Sonraki adımlar
Document Intelligence Studio ile kendi formlarınızı ve belgelerinizi işlemeyi deneyin.
Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.
Belge Yönetim Bilgileri Örnek Etiketleme aracıyla kendi formlarınızı ve belgelerinizi işlemeyi deneyin.
Belge Zekası hızlı başlangıcını tamamlayın ve seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturmaya başlayın.
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin