Aracılığıyla paylaş


Belge Zekası eklenti özellikleri

Bu içerik şunlar için geçerlidir:Checkmarkv4.0 (GA) | Önceki sürümler:mavi onay işaretiv3.1 (GA) :::moniker-end

Bu içerik şunlar için geçerlidir:Checkmarkv3.1 (GA) | En son sürüm:mor onay işaretiv4.0 (GA)

Not

Eklenti özellikleri Kartvizit modeli dışındaki tüm modellerde kullanılabilir.

Özellikler

Belge Zekası daha gelişmiş ve modüler analiz özelliklerini destekler. Sonuçları belgelerinizden ayıklanan daha fazla özellik içerecek şekilde genişletmek için eklenti özelliklerini kullanın. Bazı eklenti özellikleri ek ücrete tabidir. Bu isteğe bağlı özellikler, belge ayıklama senaryosuna bağlı olarak etkinleştirilebilir ve devre dışı bırakılabilir. Bir özelliği etkinleştirmek için ilişkili özellik adını sorgu dizesi özelliğine features ekleyin. Bir istekte, virgülle ayrılmış bir özellik listesi sağlayarak birden fazla eklenti özelliğini etkinleştirebilirsiniz. Aşağıdaki eklenti özellikleri ve sonraki sürümler için 2023-07-31 (GA) kullanılabilir.

Not

Tüm modeller veya Microsoft Office dosya türleri eklenti özelliklerini desteklemez. Daha fazla bilgi için bkz. model veri ayıklama.

Sürüm kullanılabilirliği

Eklenti Özelliği Eklenti/Ücretsiz 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Barkod ayıklama Ücretsiz ✔️ ✔️ yok yok
Dil algılama Ücretsiz ✔️ ✔️ yok yok
Anahtar değer çiftleri Ücretsiz ✔️ yok yok yok
Aranabilir PDF Ücretsiz ✔️ yok yok yok
Yazı tipi özelliği ayıklama Eklenti ✔️ ✔️ yok yok
Formül ayıklama Eklenti ✔️ ✔️ yok yok
Yüksek çözünürlüklü ayıklama Eklenti ✔️ ✔️ yok yok
Sorgu alanları Eklenti ✔️ yok yok yok

✱ Eklenti - Sorgu alanları diğer eklenti özelliklerinden farklı fiyatlendirilir. Ayrıntılar için fiyatlandırmaya bakın.
** Eklenti - Aranabilir pdf yalnızca Eklenti özelliği olarak Okuma modeli ile kullanılabilir.

Desteklenen dosya biçimleri

  • PDF

  • Görüntüler: JPEG/JPG, PNG, BMP, TIFF, HEIF

✱ Microsoft Office dosyaları şu anda desteklenmiyor.

Yüksek çözünürlüklü ayıklama

Mühendislik çizimleri gibi büyük boyutlu belgelerden küçük metinleri tanıma görevi zor bir görevdir. Genellikle metin diğer grafik öğelerle karıştırılır ve çeşitli yazı tipleri, boyutları ve yönlendirmeleri vardır. Ayrıca, metin ayrı parçalara ayrılabilir veya diğer simgelerle bağlanabilir. Belge Zekası artık bu tür belgelerden içerik ayıklama özelliğini ocr.highResolution destekliyor. Bu eklenti özelliğini etkinleştirerek A1/A2/A3 belgelerinden geliştirilmiş içerik ayıklama kalitesi elde edersiniz.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-11-30&features=ocrHighResolution
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=ocrHighResolution

Formül ayıklama

Bu ocr.formula özellik, matematik denklemleri gibi tanımlanan tüm formülleri altında bir üst düzey nesne contentolarak koleksiyonda formulas ayıklar. içinde contentalgılanan formüller olarak :formula:temsil edilir. Bu koleksiyondaki her girdi, veya displayolarak inline formül türünü ve koordinatlarıyla birlikte LaTeX gösterimini valuepolygon içeren bir formülü temsil eder. Başlangıçta, formüller her sayfanın sonunda görünür.

Not

Puan confidence sabit kodlanmış.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-11-30&features=formulas
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=formulas

Yazı tipi özelliği ayıklama

özelliği, ocr.font koleksiyonda styles ayıklanan metnin tüm yazı tipi özelliklerini altında contenten üst düzey nesne olarak ayıklar. Her stil nesnesi tek bir yazı tipi özelliğini, uygulandığı metin aralığını ve buna karşılık gelen güvenilirlik puanını belirtir. Varolan stil özelliği, metnin yazı tipi, italik ve normal gibi stiller, fontStyle kalın veya normalcolor, fontWeight metnin rengi ve backgroundColor metin sınırlayıcı kutusunun rengi gibi daha fazla yazı tipi özelliğiyle similarFontFamily genişletilir.

  {your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-11-30&features=styleFont
  {your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=styleFont

Barkod özelliği ayıklama

Bu özellik koleksiyondaki ocr.barcodebarcodes tüm tanımlanan barkodları altında contenten üst düzey nesne olarak ayıklar. contentiçinde algılanan barkodlar olarak :barcode:temsil edilir. Bu koleksiyondaki her giriş bir barkodu temsil eder ve koordinatlarıyla birlikte polygon olarak kind barkod türünü ve ekli barkod içeriğini value içerir. Başlangıçta, her sayfanın sonunda barkodlar görünür. confidence için 1 olarak sabit kodlanmıştır.

Desteklenen barkod türleri

Barkod Türü Örnek
QR Code QR Kodunun ekran görüntüsü.
Code 39 Kod 39'un ekran görüntüsü.
Code 93 Kod 93'ün ekran görüntüsü.
Code 128 Kod 128'in ekran görüntüsü.
UPC (UPC-A & UPC-E) UPC'nin ekran görüntüsü.
PDF417 PDF417'nin ekran görüntüsü.
EAN-8 Avrupa makale numarası barkod ean-8'in ekran görüntüsü.
EAN-13 Avrupa makale numarası barkod ean-13'ün ekran görüntüsü.
Codabar Codabar'ın ekran görüntüsü.
Databar Veri çubuğunun ekran görüntüsü.
Databar Genişletilmiş Genişletilmiş Veri çubuğunun ekran görüntüsü.
ITF Beşte ikisi arası barkodun (ITF) ekran görüntüsü.
Data Matrix Veri Matrisi'nin ekran görüntüsü.
{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-11-30&features=barcodes
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=barcodes

Dil algılama

languages özelliği analyzeResult isteğe eklendiğinde, altındaki analyzeResultkoleksiyonda ile confidence birlikte her metin satırı için algılanan birincil dil tahmininde bulunurlanguages.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-11-30&features=languages
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=languages

Aranabilir PDF

Aranabilir PDF özelliği, taranmış resim PDF dosyaları gibi bir analog PDF'yi eklenmiş metin içeren bir PDF'ye dönüştürmenizi sağlar. Ekli metin, algılanan metin varlıklarını görüntü dosyalarının üzerine katmanlayarak PDF'nin ayıklanan içeriğinde derin metin araması sağlar.

Önemli

  • Şu anda yalnızca Okuma modeli prebuilt-read aranabilir PDF özelliğini destekler. Bu özelliği kullanırken olarak prebuilt-readbelirtinmodelId.
  • Aranabilir PDF, genel PDF tüketimi için kullanım maliyeti olmadan (GA) prebuilt-read modeline dahil edilir 2024-11-30 .

Aranabilir PDF kullanma

Aranabilir PDF'yi kullanmak için işlemi kullanarak bir POST istekte bulunup Analyze çıkış biçimini olarak pdfbelirtin:


POST /documentModels/prebuilt-read:analyze?output=pdf
{...}
202

Analyze İşlem tamamlandıktan sonra, işlem sonuçlarını almak için bir GET istekte bulunabilirsinizAnalyze.

Başarıyla tamamlandıktan sonra PDF olarak alınabilir ve indirilebilir application/pdf. Bu işlem, Base64 ile kodlanmış JSON yerine PDF'nin eklenmiş metin biçiminin doğrudan indirilmesini sağlar.


// Monitor the operation until completion.
GET /documentModels/prebuilt-read/analyzeResults/{resultId}
200
{...}

// Upon successful completion, retrieve the PDF as application/pdf.
GET /documentModels/prebuilt-read/analyzeResults/{resultId}/pdf
200 OK
Content-Type: application/pdf

Anahtar-değer Çiftleri

Önceki API sürümlerinde model, prebuilt-document formlardan ve belgelerden anahtar-değer çiftlerini ayıklamıştı. Özelliğin keyValuePairs önceden oluşturulmuş düzene eklenmesiyle, düzen modeli artık aynı sonuçları üretir.

Anahtar-değer çiftleri, belge içinde bir etiketi veya anahtarı ve ilişkili yanıtını veya değerini tanımlayan belirli aralıklardır. Yapılandırılmış bir formda, bu çiftler etiket ve kullanıcının bu alan için girdiği değer olabilir. Yapılandırılmamış bir belgede, bir paragraftaki metne göre sözleşmenin yürütülme tarihi olabilir. Yapay zeka modeli, çok çeşitli belge türlerine, biçimlere ve yapılara göre tanımlanabilir anahtarları ve değerleri ayıklamak için eğitilir.

Model bir anahtarın mevcut olduğunu algıladığında, ilişkili değer olmadan veya isteğe bağlı alanları işlerken de anahtarlar yalıtılabilir. Örneğin, bazı durumlarda ikinci ad alanı formda boş bırakılabilir. Anahtar-değer çiftleri, belgede yer alan metinlerin yayılma alanlarıdır. Aynı değerin müşteri/kullanıcı gibi farklı şekillerde açıklandığı belgeler için, ilişkili anahtar müşteri veya kullanıcıdır (bağlama göre).

REST API

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-11-30&features=keyValuePairs

Sorgu Alanları

Sorgu alanları, önceden oluşturulmuş herhangi bir modelden ayıklanan şemayı genişletmeye veya anahtar adı değişken olduğunda belirli bir anahtar adı tanımlamaya yönelik bir eklenti özelliğidir. Sorgu alanlarını kullanmak için özellikleri queryFields olarak ayarlayın ve özelliğindeki queryFields alan adlarının virgülle ayrılmış bir listesini sağlayın.

  • Belge Zekası artık sorgu alanı ayıklamalarını destekliyor. Sorgu alanı ayıklama ile, ek eğitime gerek kalmadan bir sorgu isteği kullanarak ayıklama işlemine alanlar ekleyebilirsiniz.

  • Önceden oluşturulmuş veya özel bir modelin şemasını genişletmeniz veya düzenin çıkışıyla birkaç alan ayıklamanız gerektiğinde sorgu alanlarını kullanın.

  • Sorgu alanları premium eklenti özelliğidir. En iyi sonuçları elde etmek için, çok sözcüklü alan adları için deve büyük/küçük harf veya Pascal büyük/küçük harf alan adlarını kullanarak ayıklamak istediğiniz alanları tanımlayın.

  • Sorgu alanları istek başına en fazla 20 alanı destekler. Belge alan için bir değer içeriyorsa, alan ve değer döndürülür.

  • Bu sürüm, önceki uygulamadan daha düşük fiyatlı ve doğrulanması gereken sorgu alanları özelliğinin yeni bir uygulamasına sahiptir.

Not

Document Intelligence Studio sorgu alanı ayıklama şu anda ABD vergi modelleri W2, 1098 ve 1099 dışında Düzen ve Önceden Oluşturulmuş modeller 2024-11-30 (GA) API'siyle kullanılabilir.

Sorgu alanı ayıklama

Sorgu alanı ayıklama için, ayıklamak istediğiniz alanları belirtin ve Belge Yönetim Bilgileri belgeyi uygun şekilde analiz eder. Bir örnek aşağıda verilmiştir:

  • Document Intelligence Studio'da bir sözleşmeyi işliyorsanız 2024-11-30 (GA) sürümünü kullanın:

    Document Intelligence Studio'daki sorgu alanları düğmesinin ekran görüntüsü.

  • İsteğin bir parçası olarak , , Party2, TermsOfUsePaymentTerms, , PaymentDateve TermEndDate gibi Party1alan etiketlerinin analyze document listesini geçirebilirsiniz.

    Document Intelligence Studio'da sorgu alanları seçim penceresinin ekran görüntüsü.

  • Belge Zekası, alan verilerini analiz edip ayıklayabilir ve yapılandırılmış bir JSON çıkışındaki değerleri döndürebildi.

  • Sorgu alanlarına ek olarak, yanıt metin, tablo, seçim işareti ve diğer ilgili verileri içerir.

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-11-30&features=queryFields&queryFields=TERMS

Sonraki adımlar

Daha fazla bilgi edinin: Model Düzeni modelini okuma

SDK örnekleri: python

Daha fazla örnek bulun: Eklenti özellikleri

Daha fazla örnek bulun: Eklenti özellikleri