Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu içerik şunlar için geçerlidir:
onay işaretiv3.0 (GA) | En son sürümler:
mor onay işaretiv4.0 (GA)
mor onay işaretiv3.1 | blue-checkmarkv2.1
Bu içerik şunlar için geçerlidir:
CheckmarkEn son sürüm: | blue-checkmarkv4.0 (GA)
Foundry Araçları'ndaki Azure Belge Zekası, uygulamalarınıza ve akışlarınıza akıllı belge işleme eklemek için kullanabileceğiniz çeşitli modelleri destekler. Önceden oluşturulmuş bir etki alanına özgü modeli kullanabilir veya özel iş gereksinimlerinize ve kullanım örneklerinize göre uyarlanmış özel bir model eğitebilirsiniz. Belge Zekası'nı REST API veya Python, C#, Java ve JavaScript istemci kitaplıklarıyla kullanabilirsiniz.
Not
Finansal veriler, korumalı sağlık verileri, kişisel veriler veya yüksek oranda hassas veriler içeren belge işleme projeleri dikkatli bir şekilde dikkat gerektirir. Ulusal/bölgesel ve sektöre özgü tüm gereksinimlere uyladığınızdan emin olun.
Modele genel bakış
Aşağıdaki tabloda, her kararlı API için genel kullanıma sunulan (GA) modeller gösterilmektedir.
| Model türü | Model | 2024-11-30 (GA) | 2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| Belge çözümleme modelleri | Okuma | ✔️ | ✔️ | ✔️ | Kullanılamaz |
| Belge çözümleme modelleri | Düzen | ✔️ | ✔️ | ✔️ | ✔️ |
| Belge çözümleme modelleri | Genel belge** | Desteklendiği yer: düzen modeli |
✔️ | ✔️ | Kullanılamaz |
| Önceden oluşturulmuş modeller | Banka çeki | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | Banka ekstresi | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | payStub | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | Sözleşme | ✔️ | ✔️ | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | Sağlık sigortası kartı | ✔️ | ✔️ | ✔️ | Kullanılamaz |
| Önceden oluşturulmuş modeller | Kimlik belgesi | ✔️ | ✔️ | ✔️ | ✔️ |
| Önceden oluşturulmuş modeller | Fatura | ✔️ | ✔️ | ✔️ | ✔️ |
| Önceden oluşturulmuş modeller | Makbuz | ✔️ | ✔️ | ✔️ | ✔️ |
| Önceden oluşturulmuş modeller | ABD birleşik vergisi* | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD 1040 vergisi* | ✔️ | ✔️ | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD 1095 vergisi* | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD 1098 vergisi* | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD 1099 vergisi* | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD W2 vergisi | ✔️ | ✔️ | ✔️ | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD W4 vergisi | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD mortgage 1003 URLA | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD ipotek 1004 URAR | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD ipotek 1005 | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD ipotek 1008 özeti | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | ABD ipotek kapanışı açıklaması | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | Evlilik sertifikası | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | Kredi kartı | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Önceden oluşturulmuş modeller | Kartvizit | kullanım dışı | ✔️ | ✔️ | ✔️ |
| Özel sınıflandırma modeli | Özel sınıflandırıcı | ✔️ | ✔️ | Kullanılamaz | Kullanılamaz |
| Özel ayıklama modeli | Özel nöral | ✔️ | ✔️ | ✔️ | Kullanılamaz |
| Özel ayıklama modeli | Özel şablon | ✔️ | ✔️ | ✔️ | ✔️ |
| Özel ayıklama modeli | Özel oluşturulmuş | ✔️ | ✔️ | ✔️ | ✔️ |
| Tüm modeller | Eklenti özellikleri | ✔️ | ✔️ | Kullanılamaz | Kullanılamaz |
* Alt modelleri içerir. Desteklenen çeşitlemeler ve alt türleri için modele özgü bilgilere bakın.
** Genel belge modelinin tüm özellikleri düzen modelinde kullanılabilir. Genel model artık desteklenmiyor.
Gecikme süresi
Gecikme süresi, bir API sunucusunun gelen isteği işlemesi ve işlemesi ve giden yanıtı istemciye teslim etme süresidir. Belgeyi analiz etme süresi, her sayfadaki boyuta (ör. sayfa sayısı) ve ilişkili içeriğe bağlıdır. Belge Zekası, benzer belgeler için gecikme süresinin karşılaştırılabilir olduğu ancak her zaman aynı olmadığı çok kiracılı zaman uyumsuz bir hizmettir. Gecikme süresi ve performansta zaman zaman değişkenlik, görüntüleri ve büyük belgeleri büyük ölçekte işleyen mikro hizmet tabanlı durum bilgisi olmayan tüm hizmetlerde geçerlidir. Donanım ve kapasite ile ölçeklendirme özelliklerini sürekli olarak artırıyor olsak da, çalışma zamanında gecikme sorunları yaşamaya devam edebilirsiniz.
Eklenti özelliği
Belge Zekası için aşağıdaki eklenti özellikleri kullanılabilir. Kartvizit modeli dışındaki tüm modeller için, Belge Zekası artık daha karmaşık analizlere olanak sağlayan eklenti özelliklerini destekliyor. Belge ayıklama senaryosuna bağlı olarak bu isteğe bağlı özellikleri etkinleştirebilir ve devre dışı bırakabilirsiniz. Aşağıdaki eklenti özellikleri 2023-07-31 (GA) ve sonraki API sürümü için kullanılabilir:
ocrHighResolutionformulasstyleFontbarcodeslanguageskeyValuePairs-
queryFields(ABD vergi modellerinde kullanılamaz) -
searchablePDF(yalnızca okuma modeli için kullanılabilir)
| Eklenti özelliği | Eklenti/Ücretsiz | 30.11.2024 (GA) | 2023-07-31 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| Yazı tipi özelliği ayıklama | Eklenti | ✔️ | ✔️ | Kullanılamaz | Kullanılamaz |
| Formül ayıklama | Eklenti | ✔️ | ✔️ | Kullanılamaz | Kullanılamaz |
| Yüksek çözünürlüklü ayıklama | Eklenti | ✔️ | ✔️ | Kullanılamaz | Kullanılamaz |
| Barkod ayıklama | Ücretsiz | ✔️ | ✔️ | Kullanılamaz | Kullanılamaz |
| Dil algılama | Ücretsiz | ✔️ | ✔️ | Kullanılamaz | Kullanılamaz |
| Anahtar/değer çiftleri | Ücretsiz | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Sorgu alanları | Eklenti* | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
| Aranabilir PDF | Eklenti* | ✔️ | Kullanılamaz | Kullanılamaz | Kullanılamaz |
Model analizi özellikleri
| Model Kimliği | İçerik ayıklama | Sorgu alanları | Paragraf | Paragraf rolleri | Seçim işaretleri | Tablolar | Anahtar/değer çiftleri | Diller | Barkodlar | Belge analizi | Formül* | Stil yazı tipi* | Yüksek çözünürlük* | Aranabilir PDF |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read |
✓ | ✓ | O | O | O | O | O | O | ||||||
prebuilt-layout |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | O | ||
prebuilt-contract |
✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | ||||
prebuilt-healthInsuranceCard.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-invoice |
✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
prebuilt-receipt |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-creditCard |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-bankStatement |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1003 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1004 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1005 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w4 |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1040 (çeşitli) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1095A |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1095C |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1098 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098E |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098T |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099 (çeşitli) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099SSA |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Etkin
O - İsteğe bağlı
* - Premium özellikler ekstra maliyetler doğurabilir
Sorgu alanları diğer eklenti özelliklerinden farklı şekilde fiyatlendirilir. Daha fazla bilgi için bkz . Fiyatlandırma.
Sınırlayıcı kutu ve çokgen koordinatları
Sınırlayıcı kutu (polygon v3.0 ve sonraki sürümlerde), belgedeki metin öğelerini çevreleyen soyut bir dikdörtgendir. Sınırlayıcı kutu, nesne algılama için başvuru noktası olarak kullanılır:
- Sınırlayıcı kutu, dört sayısal çiftten oluşan bir dizide sunulan x ve y koordinat düzlemi kullanılarak konumu belirtir. Her çift, kutunun bir köşesini şu sırayla temsil eder: sol üst, sağ üst, sağ alt, sol alt.
- Görüntü koordinatları piksel cinsinden gösterilir. PDF için koordinatlar inç olarak sunulur.
Dil desteği
Derin öğrenmeyi temel alan Belge Zekası'ndaki evrensel modeller birçok dili destekler. Modeller, karma dillere sahip metin satırları da dahil olmak üzere resimlerinizden ve belgelerinizden çok dilli metin ayıklayabilir. Dil desteği, Belge Zekası hizmeti işlevselliğine göre değişir. Tam liste için aşağıdaki makalelere bakın:
- Dil desteği: Belge çözümleme modelleri
- Dil desteği: Önceden oluşturulmuş modeller
- Dil desteği: Özel modeller
Bölgesel kullanılabilirlik
Belge Zekası genel olarak 60'ın üzeri Azure genel altyapı bölgesinde kullanılabilir.
Sizin ve müşterileriniz için en uygun bölgeyi seçmenize yardımcı olmak için bkz. Azure coğrafyaları.
Model ayrıntıları
Bu bölümde, her modelden bekleyebileceğiniz çıkış açıklanmaktadır. Eklenti özellikleriyle çoğu modelin çıkışını genişletebilirsiniz.
OCR okuma
Okuma API'sinde, optik karakter tanıma (OCR), algılanırsa satır ve sözcükleri, bunların konumlarını, algılanan dilleri ve el yazısı stilini analiz edip ayıklamak için kullanılır.
Bu örnek belge , Document Intelligence Studio kullanılarak işlendi.
Düzen analizi
Düzen çözümleme modeli metinleri, tabloları, seçim işaretlerini ve başlıklar, bölüm başlıkları, sayfa üst bilgileri ve sayfa alt bilgileri gibi diğer yapı öğelerini analiz eder ve ayıklar.
Bu örnek belge , Document Intelligence Studio kullanılarak işlendi.
Sağlık sigortası kartı
Sağlık sigortası kartı modeli, ABD sağlık sigortası kartlarından önemli bilgileri analiz etmek ve ayıklamak için güçlü OCR özelliklerini derin öğrenme modelleriyle birleştirir.
Bu örnek ABD sağlık sigortası kartı Document Intelligence Studio kullanılarak işlenmiştir.
ABD vergi belgeleri
ABD vergi belgesi modelleri, belirli bir vergi belgesi grubundaki önemli alanları ve satır öğelerini analiz eder ve ayıklar. API, telefonda yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD vergi belgelerinin analizini destekler. Şu anda aşağıdaki modeller desteklenmektedir:
| Model | Açıklama | Model Kimliği |
|---|---|---|
| ABD vergisi W-2 | Vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. | prebuilt-tax.us.w2 |
| ABD vergisi W-4 | Vergiye dönüştürülebilir tazminat ayrıntılarını ayıklayın. | prebuilt-tax.us.w4 |
| ABD vergisi 1040 | ipotek faizi ayrıntılarını ayıklayın. |
prebuilt-tax.us.1040 (varyasyonlar) |
| ABD vergisi 1095 | Sağlık sigortası ayrıntılarını ayıklayın. |
prebuilt-tax.us.1095 (varyasyonlar) |
| ABD vergisi 1098 | ipotek faizi ayrıntılarını ayıklayın. |
prebuilt-tax.us.1098 (varyasyonlar) |
| ABD vergisi 1099 | İşveren dışındaki kaynaklardan alınan geliri ayıklayın. |
prebuilt-tax.us.1099 (varyasyonlar) |
Bu örnek W-2 belgesi , Document Intelligence Studio kullanılarak işlendi.
ABD ipotek belgeleri
ABD ipotek belgesi modelleri, belirli bir ipotek belgesi grubundan ödünç alan, kredi ve mülk bilgilerini içeren önemli alanları analiz eder ve ayıklar. API, telefon tarafından yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede İngilizce ABD ipotek belgelerinin analizini destekler. Aşağıdaki modeller şu anda desteklenmektedir.
| Model | Açıklama | Model Kimliği |
|---|---|---|
| 1003 End-User Lisans Sözleşmesi | Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. | prebuilt-mortgage.us.1003 |
| 1004 Tekdüzen Konut Değerlendirme Raporu (URAR) | Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. | prebuilt-mortgage.us.1004 |
| 1005 İstihdam doğrulaması | Krediyi, ödünç vereni, mülk ayrıntılarını ayıkla. | prebuilt-mortgage.us.1005 |
| 1008 Özet belgesi | Ödünç almacı, satıcı, mülk, ipotek ve altına yazan ayrıntıları ayıklayın. | prebuilt-mortgage.us.1008 |
| Kapanış Açıklaması | Kapanış, işlem maliyetleri ve kredi ayrıntılarını ayıklayın. | prebuilt-mortgage.us.closingDisclosure |
Bu örnek Kapanış Açıklaması belgesi , Document Intelligence Studio kullanılarak işlendi.
Contract
Sözleşme modeli, taraflar, yargı alanları, sözleşme kimliği ve unvan dahil olmak üzere sözleşme sözleşmelerindeki önemli alanları ve satır öğelerini analiz eder ve ayıklar. Model şu anda İngilizce sözleşme belgelerini desteklemektedir.
Bu örnek sözleşme , Document Intelligence Studio kullanılarak işlendi.
ABD banka çeki
Sözleşme modeli çek ayrıntıları, hesap ayrıntıları, tutar ve not dahil olmak üzere ABD banka çeklerindeki önemli alanları analiz eder ve ayıklar.
Bu banka denetimi örneği Document Intelligence Studio kullanılarak işlendi.
ABD banka ekstresi
Banka ekstresi modeli, ABD banka ekstreleri hesap numarası, banka ayrıntıları, ekstre ayrıntıları ve işlem ayrıntılarındaki önemli alanları ve satır öğelerini analiz eder ve ayıklar.
Bu örnek banka ekstresi Document Intelligence Studio kullanılarak işlendi.
payStub
payStub modeli, bordroyla ilgili bilgilerle belge ve dosyalardan önemli alanları ve satır öğelerini analiz eder ve ayıklar.
Bu örnek ödeme saplaması , Document Intelligence Studio kullanılarak işlendi.
Fatura
Fatura modeli, müşteri adını, fatura adresini, son tarihi, vadesi gelen tutarı, satır öğelerini ve diğer önemli verileri ayıklamak için faturaların işlenmesini otomatikleştirir.
Bu örnek fatura , Document Intelligence Studio kullanılarak işlendi.
Makbuz
Basılı ve el yazısı makbuzlardan satıcı adı, tarihler, satır öğeleri, miktarlar ve toplamlar için satış makbuzlarını taramak için makbuz modelini kullanın. Sürüm v3.0, tek sayfalı otel makbuzu işlemeyi de destekler.
Bu örnek alındı bilgisi Document Intelligence Studio kullanılarak işlendi.
Kimlik belgesi
Anahtar alanları ayıklamak için ABD ehliyetlerini (50 eyaletin tamamı ve Columbia Bölgesi) ve uluslararası pasaportlardan (vize ve diğer seyahat belgeleri hariç) biyografik sayfaları işlemek için kimlik belgesi (KIMLIK) modelini kullanın.
Bu örnek ABD sürücü lisansı , Document Intelligence Studio kullanılarak işlenmiştir.
Evlilik sertifikası
Bireyler, tarih ve konum gibi önemli alanları ayıklamak üzere ABD evlilik sertifikalarını işlemek için evlilik sertifikası modelini kullanın.
Bu örnek ABD evlilik sertifikası Document Intelligence Studio kullanılarak işlendi.
Kredi kartı
Anahtar alanlarını ayıklamak üzere kredi ve banka kartlarını işlemek için kredi kartı modelini kullanın.
Bu örnek kredi kartı , Document Intelligence Studio kullanılarak işlendi.
Özel modeller
Özel modeller yaygın olarak iki türe ayrılır. Belirli bir belge türünden tanımlı şema ayıklayan "belge türü" sınıflandırması ve özel ayıklama modellerini destekleyen özel sınıflandırma modelleri.
Özel belge modelleri, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. Ayrı içeriğinizdeki form alanlarını tanır ve anahtar/değer çiftleri ile tablo verilerini ayıklar. Başlamak için form türünün yalnızca bir örneğine ihtiyacınız vardır.
Sürüm v3.0 ve üzeri özel modeller, özel şablonda (form) imza algılamayı ve hem şablon hem de sinir modellerindeki çapraz sayfa tablolarını destekler. İmza algılama , belgeyi imzalayan kişinin kimliğini değil, imzanın varlığını arar. Model imza algılama için imzasız döndürürse, model tanımlı alanda imza bulamadı.
Bu örnek özel şablon , Document Intelligence Studio kullanılarak işlendi.
Özel ayıklama
Özel ayıklama modeli iki tür olarak gelir: özel şablon ve özel sinir. Özel ayıklama modeli oluşturmak için, bir belge veri kümesini ayıklanmasını istediğiniz değerlerle etiketleyip etiketlenmiş veri kümesinde modeli eğitin. Başlamak için aynı form veya belge türünün yalnızca beş örneğine ihtiyacınız vardır.
Bu örnek özel ayıklama , Document Intelligence Studio kullanılarak işlendi.
Özel sınıflandırıcı
Özel sınıflandırma modeliyle, ayıklama modelini çağırmadan önce belge türünü tanımlayabilirsiniz. Sınıflandırma modeli, 2023-07-31 (GA) API'siyle başlayarak kullanılabilir. Özel sınıflandırma modelini eğiterek en az iki ayrı sınıf ve sınıf başına en az beş örnek gerekir.
Oluşturulan modeller
Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle çağrılan bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir oluşturulmuş modele en fazla 200 eğitilmiş özel model atayabilirsiniz.
Bu örnek oluşturulan model , Document Intelligence Studio'dadır.
Giriş gereksinimleri
Aşağıdaki dosya biçimleri desteklenir.
| Model | Resim: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Okundu | ✔ | ✔ | ✔ |
| Düzen | ✔ | ✔ | ✔ |
| Genel belge | ✔ | ✔ | |
| Önceden oluşturulmuş | ✔ | ✔ | |
| Özel ayıklama | ✔ | ✔ | |
| Özel sınıflandırma | ✔ | ✔ | ✔ |
- Fotoğraflar ve taramalar: En iyi sonuçlar için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
- PDF'ler ve TIFF'ler: PDF'ler ve TIFF'ler için en fazla 2.000 sayfa işlenebilir. (Ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir.)
- Dosya boyutu: Belgeleri analiz etmek için dosya boyutu ücretli (S0) katmanı için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
- Görüntü boyutları: Boyutlar 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
- Parola kilitleri: PDF'leriniz parola kilitliyse, göndermeden önce kilidi kaldırmanız gerekir.
- Metin yüksekliği: Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta olan yaklaşık 8 noktalı metne karşılık gelir.
- Özel model eğitimi: Eğitim verileri için en fazla sayfa sayısı, özel şablon modeli için 500 ve özel sinir modeli için 50.000'dir.
- Özel ayıklama modeli eğitimi: Eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1 GB'tır.
- Özel sınıflandırma modeli eğitimi: Eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 1 GB'tır. 2024-11-30 (GA) için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 2 GB'tır.
- Office dosya türleri (DOCX, XLSX, PPTX): En fazla dize uzunluğu sınırı 8 milyon karakterdir.
Not
Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Sınırlama, Belge Yönetim Bilgileri Hizmeti'nden değil araçtan türetilir.
Sürüm geçişi
Belge Zekası v3.1 geçiş kılavuzundaki adımları izleyerek uygulamalarınızda Document Intelligence v3.0'ı kullanmayı öğrenin.
| Model | Açıklama |
|---|---|
| Belge analizi | |
| Düzen | Belgelerden metin ve düzen bilgilerini ayıklama. |
| Önceden oluşturulmuş | |
| Fatura | İngilizce ve İspanyolca faturalarından önemli bilgileri ayıklayın. |
| Makbuz | İngilizce makbuzlardan önemli bilgileri ayıklayın. |
| Kimlik belgesi | ABD ehliyetlerinden ve uluslararası pasaportlardan önemli bilgileri ayıklayın. |
| Kartvizit | İngilizce kartvizitlerden önemli bilgileri ayıklayın. |
| Özel | |
| Özel | İşletmenize özgü formlardan ve belgelerden veri ayıklama. Özel modeller, ayrı verileriniz ve kullanım örnekleriniz için eğitilir. |
| Oluşan | Özel modellerden oluşan bir koleksiyon oluşturup bunları form türlerinizden oluşturulan tek bir modele atayın. |
Düzen
Düzen API'si belgelerden metin, tablo ve üst bilgiler, seçim işaretleri ve yapı bilgilerini analiz eder ve ayıklar.
Bu örnek belge , Örnek Etiketleme aracı kullanılarak işlendi.
Fatura
Fatura modeli, satış faturalarından önemli bilgileri analiz eder ve ayıklar. API faturaları çeşitli biçimlerde analiz eder ve müşteri adı, fatura adresi, son tarih ve son ödeme tutarı gibi önemli bilgileri ayıklar.
Bu örnek fatura , Örnek Etiketleme aracı kullanılarak işlendi.
Makbuz
Makbuz modeli, yazdırılan ve el yazısı satış makbuzlarından önemli bilgileri analiz eder ve ayıklar.
Bu örnek alındı bilgisi , Örnek Etiketleme aracı kullanılarak işlendi.
Kimlik belgesi
Kimlik belgesi modeli, aşağıdaki belgelerden önemli bilgileri analiz eder ve ayıklar:
- ABD sürücü lisansları (50 eyaletin tamamı ve Columbia Bölgesi)
- Uluslararası pasaportlardan biyografik sayfalar (vize ve diğer seyahat belgeleri hariç). API, kimlik belgelerini analiz eder ve ayıklar.
Bu örnek ABD sürücü lisansı , Örnek Etiketleme aracı kullanılarak işlenmiştir.
Kartvizit
Kartvizit modeli, kartvizit görüntülerindeki önemli bilgileri analiz eder ve ayıklar.
Bu örnek kartvizit , Örnek Etiketleme aracı kullanılarak işlenmiştir.
Özel
Özel modeller, işletmenize özgü form ve belgelerden verileri analiz eder ve ayıklar. API, ayrı içeriğinizdeki form alanlarını tanımak ve anahtar/değer çiftleri ile tablo verilerini ayıklamak için eğitilmiş bir makine öğrenmesi programıdır. Başlamak için aynı form türünün yalnızca beş örneğine ihtiyacınız vardır. Özel modelinizi etiketli veri kümeleriyle veya etiketsiz olarak eğitebilirsiniz.
Bu örnek özel model , Örnek Etiketleme aracı kullanılarak işlenmiştir.
Oluşturulan özel model
Oluşturulan model, özel modellerden oluşan bir koleksiyon alınıp bunları form türlerinizden oluşturulan tek bir modele atayarak oluşturulur. Tek bir model kimliğiyle çağrılan bir oluşturulmuş modele birden çok özel model atayabilirsiniz. Tek bir birleşik modele en fazla 100 eğitilmiş özel model atayabilirsiniz.
Bu oluşturulan model bölmesi Örnek Etiketleme aracı kullanılarak işlendi.
Model veri ayıklama
| Model | Metin ayıklama | Dil algılama | Seçim işaretleri | Tablolar | Paragraf | Paragraf rolleri | Anahtar/değer çiftleri | Fields |
|---|---|---|---|---|---|---|---|---|
| Düzen | ✓ | ✓ | ✓ | ✓ | ✓ | |||
| Fatura | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
| Makbuz | ✓ | ✓ | ✓ | |||||
| Kimlik Belgesi | ✓ | ✓ | ✓ | |||||
| Kartvizit | ✓ | ✓ | ✓ | |||||
| Özel Form | ✓ | ✓ | ✓ | ✓ | ✓ |
Giriş gereksinimleri
Aşağıdaki dosya biçimleri desteklenir.
| Model | Resim: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Okundu | ✔ | ✔ | ✔ |
| Düzen | ✔ | ✔ | ✔ |
| Genel belge | ✔ | ✔ | |
| Önceden oluşturulmuş | ✔ | ✔ | |
| Özel ayıklama | ✔ | ✔ | |
| Özel sınıflandırma | ✔ | ✔ | ✔ |
- Fotoğraflar ve taramalar: En iyi sonuçlar için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
- PDF'ler ve TIFF'ler: PDF'ler ve TIFF'ler için en fazla 2.000 sayfa işlenebilir. (Ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir.)
- Dosya boyutu: Belgeleri analiz etmek için dosya boyutu ücretli (S0) katmanı için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
- Görüntü boyutları: Boyutlar 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
- Parola kilitleri: PDF'leriniz parola kilitliyse, göndermeden önce kilidi kaldırmanız gerekir.
- Metin yüksekliği: Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta olan yaklaşık 8 noktalı metne karşılık gelir.
- Özel model eğitimi: Eğitim verileri için en fazla sayfa sayısı, özel şablon modeli için 500 ve özel sinir modeli için 50.000'dir.
- Özel ayıklama modeli eğitimi: Eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1 GB'tır.
- Özel sınıflandırma modeli eğitimi: Eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 1 GB'tır. 2024-11-30 (GA) için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 2 GB'tır.
- Office dosya türleri (DOCX, XLSX, PPTX): En fazla dize uzunluğu sınırı 8 milyon karakterdir.
Not
Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Sınırlama, Belge Zekası'ndan değil araçtan türetilir.
Sürüm geçişi
Belge Yönetim Bilgileri v3.1 geçiş kılavuzundaki adımları izleyerek uygulamalarınızda Belge Zekası v3.0'ı kullanmayı öğrenebilirsiniz
İlgili içerik
- Document Intelligence Studio ile kendi formlarınızı ve belgelerinizi işleyin.
- Belge Yönetim Bilgileri hızlı başlangıcını tamamlayın ve ardından seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturun.
- Belge Yönetim Bilgileri Örnek Etiketleme aracıyla kendi formlarınızı ve belgelerinizi işleyin.
- Belge Yönetim Bilgileri hızlı başlangıcını tamamlayın ve ardından seçtiğiniz geliştirme dilinde bir belge işleme uygulaması oluşturun.