Belge Zekası eklenti özellikleri
Önemli
- Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar.
- Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
- Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-02-29-preview'dır.
- Genel önizleme sürümü 2024-02-29-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir:
- Doğu ABD
- Batı ABD2
- Batı Avrupa
Bu içerik şunlar için geçerlidir:v4.0 (önizleme) | Önceki sürümler:v3.1 (GA)
Bu içerik:v3.1 (GA) | En son sürüm:v4.0 (önizleme) için geçerlidir
Not
Eklenti özellikleri Kartvizit modeli dışındaki tüm modellerde kullanılabilir.
Özellikler
Belge Zekası daha gelişmiş ve modüler analiz özelliklerini destekler. Sonuçları belgelerinizden ayıklanan daha fazla özellik içerecek şekilde genişletmek için eklenti özelliklerini kullanın. Bazı eklenti özellikleri ek ücrete tabidir. Bu isteğe bağlı özellikler, belge ayıklama senaryosuna bağlı olarak etkinleştirilebilir ve devre dışı bırakılabilir. Bir özelliği etkinleştirmek için ilişkili özellik adını sorgu dizesi özelliğine features
ekleyin. Bir istekte, virgülle ayrılmış bir özellik listesi sağlayarak birden fazla eklenti özelliğini etkinleştirebilirsiniz. Aşağıdaki eklenti özellikleri ve sonraki sürümler için 2023-07-31 (GA)
kullanılabilir.
Not
Tüm eklenti özellikleri tüm modeller tarafından desteklenmez. Daha fazla bilgi için bkz. model veri ayıklama.
aşağıdaki eklenti özellikleri, 2024-02-29-preview
ve sonraki sürümler için2024-02-29-preview
kullanılabilir:
Not
2023-10-30-preview API'sindeki sorgu alanları uygulaması, son önizleme sürümünden farklıdır. Yeni uygulama daha ucuzdur ve yapılandırılmış belgelerle iyi çalışır.
Sürüm kullanılabilirliği
Eklenti Özelliği | Eklenti/Ücretsiz | 2024-02-29-önizleme | 2023-07-31 (GA) |
2022-08-31 (GA) |
v2.1 (GA) |
---|---|---|---|---|---|
Yazı tipi özelliği ayıklama | Eklenti | ✔️ | ✔️ | yok | yok |
Formül ayıklama | Eklenti | ✔️ | ✔️ | yok | yok |
Yüksek çözünürlüklü ayıklama | Eklenti | ✔️ | ✔️ | yok | yok |
Barkod ayıklama | Ücretsiz | ✔️ | ✔️ | yok | yok |
Dil algılama | Ücretsiz | ✔️ | ✔️ | yok | yok |
Anahtar değer çiftleri | Ücretsiz | ✔️ | yok | yok | yok |
Sorgu alanları | Eklenti* | ✔️ | yok | yok | yok |
✱ Eklenti - Sorgu alanları diğer eklenti özelliklerinden farklı fiyatlendirilir. Ayrıntılar için fiyatlandırmaya bakın.
Desteklenen dosya biçimleri
PDF
Görüntüler:
JPEG
/JPG
,PNG
,BMP
,TIFF
,HEIF
✱ Microsoft Office dosyaları şu anda desteklenmiyor.
Yüksek çözünürlüklü ayıklama
Mühendislik çizimleri gibi büyük boyutlu belgelerden küçük metinleri tanıma görevi zor bir görevdir. Genellikle metin diğer grafik öğelerle karıştırılır ve çeşitli yazı tipleri, boyutları ve yönlendirmeleri vardır. Ayrıca, metin ayrı parçalara ayrılabilir veya diğer simgelerle bağlanabilir. Belge Zekası artık bu tür belgelerden içerik ayıklama özelliğini ocr.highResolution
destekliyor. Bu eklenti özelliğini etkinleştirerek A1/A2/A3 belgelerinden geliştirilmiş içerik ayıklama kalitesi elde edersiniz.
REST API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=ocrHighResolution
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=ocrHighResolution
Formül ayıklama
Bu ocr.formula
özellik, matematik denklemleri gibi tanımlanan tüm formülleri altında bir üst düzey nesne content
olarak koleksiyonda formulas
ayıklar. içinde content
algılanan formüller olarak :formula:
temsil edilir. Bu koleksiyondaki her girdi, veya display
olarak inline
formül türünü ve koordinatlarıyla birlikte LaTeX gösterimini value
polygon
içeren bir formülü temsil eder. Başlangıçta, formüller her sayfanın sonunda görünür.
Not
Puan confidence
sabit kodlanmış.
"content": ":formula:",
"pages": [
{
"pageNumber": 1,
"formulas": [
{
"kind": "inline",
"value": "\\frac { \\partial a } { \\partial b }",
"polygon": [...],
"span": {...},
"confidence": 0.99
},
{
"kind": "display",
"value": "y = a \\times b + a \\times c",
"polygon": [...],
"span": {...},
"confidence": 0.99
}
]
}
]
REST API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=formulas
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=formulas
Yazı tipi özelliği ayıklama
özelliği, ocr.font
koleksiyonda styles
ayıklanan metnin tüm yazı tipi özelliklerini altında content
en üst düzey nesne olarak ayıklar. Her stil nesnesi tek bir yazı tipi özelliğini, uygulandığı metin aralığını ve buna karşılık gelen güvenilirlik puanını belirtir. Varolan stil özelliği, metnin yazı tipi, italik ve normal gibi stiller, fontStyle
kalın veya normalcolor
, fontWeight
metnin rengi ve backgroundColor
metin sınırlayıcı kutusunun rengi gibi daha fazla yazı tipi özelliğiyle similarFontFamily
genişletilir.
"content": "Foo bar",
"styles": [
{
"similarFontFamily": "Arial, sans-serif",
"spans": [ { "offset": 0, "length": 3 } ],
"confidence": 0.98
},
{
"similarFontFamily": "Times New Roman, serif",
"spans": [ { "offset": 4, "length": 3 } ],
"confidence": 0.98
},
{
"fontStyle": "italic",
"spans": [ { "offset": 1, "length": 2 } ],
"confidence": 0.98
},
{
"fontWeight": "bold",
"spans": [ { "offset": 2, "length": 3 } ],
"confidence": 0.98
},
{
"color": "#FF0000",
"spans": [ { "offset": 4, "length": 2 } ],
"confidence": 0.98
},
{
"backgroundColor": "#00FF00",
"spans": [ { "offset": 5, "length": 2 } ],
"confidence": 0.98
}
]
REST API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=styleFont
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=styleFont
Barkod özelliği ayıklama
Bu özellik koleksiyondaki ocr.barcode
barcodes
tüm tanımlanan barkodları altında content
en üst düzey nesne olarak ayıklar. content
içinde algılanan barkodlar olarak :barcode:
temsil edilir. Bu koleksiyondaki her giriş bir barkodu temsil eder ve koordinatlarıyla birlikte polygon
olarak kind
barkod türünü ve ekli barkod içeriğini value
içerir. Başlangıçta, her sayfanın sonunda barkodlar görünür. confidence
için 1 olarak sabit kodlanmıştır.
Desteklenen barkod türleri
Barkod Türü | Örnek |
---|---|
QR Code |
|
Code 39 |
|
Code 93 |
|
Code 128 |
|
UPC (UPC-A & UPC-E) |
|
PDF417 |
|
EAN-8 |
|
EAN-13 |
|
Codabar |
|
Databar |
|
Databar Genişletilmiş |
|
ITF |
|
Data Matrix |
REST API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=barcodes
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=barcodes
Dil algılama
languages
özelliği analyzeResult
isteğe eklendiğinde, altındaki analyzeResult
koleksiyonda ile confidence
birlikte her metin satırı için algılanan birincil dil tahmininde bulunurlanguages
.
"languages": [
{
"spans": [
{
"offset": 0,
"length": 131
}
],
"locale": "en",
"confidence": 0.7
},
]
REST API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=languages
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=languages
Anahtar-değer Çiftleri
Önceki API sürümlerinde, önceden oluşturulmuş belge modeli formlardan ve belgelerden anahtar-değer çiftlerini ayıkladı. Özelliğin keyValuePairs
önceden oluşturulmuş düzene eklenmesiyle, düzen modeli artık aynı sonuçları üretir.
Anahtar-değer çiftleri, belge içinde bir etiketi veya anahtarı ve ilişkili yanıtını veya değerini tanımlayan belirli aralıklardır. Yapılandırılmış bir formda, bu çiftler etiket ve kullanıcının bu alan için girdiği değer olabilir. Yapılandırılmamış bir belgede, bir paragraftaki metne göre sözleşmenin yürütülme tarihi olabilir. Yapay zeka modeli, çok çeşitli belge türlerine, biçimlere ve yapılara göre tanımlanabilir anahtarları ve değerleri ayıklamak için eğitilir.
Model bir anahtarın mevcut olduğunu algıladığında, ilişkili değer olmadan veya isteğe bağlı alanları işlerken de anahtarlar yalıtılabilir. Örneğin, bazı durumlarda ikinci ad alanı formda boş bırakılabilir. Anahtar-değer çiftleri, belgede yer alan metinlerin yayılma alanlarıdır. Aynı değerin müşteri/kullanıcı gibi farklı şekillerde açıklandığı belgeler için, ilişkili anahtar müşteri veya kullanıcıdır (bağlama göre).
REST API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=keyValuePairs
Sorgu Alanları
Sorgu alanları, önceden oluşturulmuş herhangi bir modelden ayıklanan şemayı genişletmeye veya anahtar adı değişken olduğunda belirli bir anahtar adı tanımlamaya yönelik bir eklenti özelliğidir. Sorgu alanlarını kullanmak için özellikleri queryFields
olarak ayarlayın ve özelliğindeki queryFields
alan adlarının virgülle ayrılmış bir listesini sağlayın.
Belge Zekası artık sorgu alanı ayıklamalarını destekliyor. Sorgu alanı ayıklama ile, ek eğitime gerek kalmadan bir sorgu isteği kullanarak ayıklama işlemine alanlar ekleyebilirsiniz.
Önceden oluşturulmuş veya özel bir modelin şemasını genişletmeniz veya düzenin çıkışıyla birkaç alan ayıklamanız gerektiğinde sorgu alanlarını kullanın.
Sorgu alanları premium eklenti özelliğidir. En iyi sonuçları elde etmek için, çok sözcüklü alan adları için deve büyük/küçük harf veya Pascal büyük/küçük harf alan adlarını kullanarak ayıklamak istediğiniz alanları tanımlayın.
Sorgu alanları istek başına en fazla 20 alanı destekler. Belge alan için bir değer içeriyorsa, alan ve değer döndürülür.
Bu sürüm, önceki uygulamadan daha düşük fiyatlı ve doğrulanması gereken sorgu alanları özelliğinin yeni bir uygulamasına sahiptir.
Not
Document Intelligence Studio sorgu alanı ayıklama şu anda Düzen ve Önceden Oluşturulmuş modeller 2024-02-29-preview
2023-10-31-preview
API'siyle ve modeller (W2, 1098 ve 1099s modelleri) dışında US tax
sonraki sürümlerde kullanılabilir.
Sorgu alanı ayıklama
Sorgu alanı ayıklama için, ayıklamak istediğiniz alanları belirtin ve Belge Yönetim Bilgileri belgeyi uygun şekilde analiz eder. Bir örnek aşağıda verilmiştir:
Document Intelligence Studio'da bir sözleşmeyi işliyorsanız veya
2023-10-31-preview
sürümlerini kullanın2024-02-29-preview
:İsteğin bir parçası olarak , ,
Party2
,TermsOfUse
PaymentTerms
, ,PaymentDate
veTermEndDate
gibiParty1
alan etiketlerininanalyze document
listesini geçirebilirsiniz.Belge Zekası, alan verilerini analiz edip ayıklayabilir ve yapılandırılmış bir JSON çıkışındaki değerleri döndürebildi.
Sorgu alanlarına ek olarak, yanıt metin, tablo, seçim işareti ve diğer ilgili verileri içerir.
REST API
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=queryFields&queryFields=TERMS
Sonraki adımlar
Daha fazla bilgi edinin: ModelDüzeni modelini okuma
SDK örnekleri: python