Belge Zekası eklenti özellikleri

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar.
  • Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-02-29-preview'dır.
  • Genel önizleme sürümü 2024-02-29-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir:
  • Doğu ABD
  • Batı ABD2
  • Batı Avrupa

Bu içerik şunlar için geçerlidir:Checkmarkv4.0 (önizleme) | Önceki sürümler:mavi onay işaretiv3.1 (GA)

Bu içerik:Checkmarkv3.1 (GA) | En son sürüm:mor onay işaretiv4.0 (önizleme) için geçerlidir

Not

Eklenti özellikleri Kartvizit modeli dışındaki tüm modellerde kullanılabilir.

Belge Zekası daha gelişmiş ve modüler analiz özelliklerini destekler. Sonuçları belgelerinizden ayıklanan daha fazla özellik içerecek şekilde genişletmek için eklenti özelliklerini kullanın. Bazı eklenti özellikleri ek ücrete tabidir. Bu isteğe bağlı özellikler, belge ayıklama senaryosuna bağlı olarak etkinleştirilebilir ve devre dışı bırakılabilir. Bir özelliği etkinleştirmek için ilişkili özellik adını sorgu dizesi özelliğine features ekleyin. Bir istekte, virgülle ayrılmış bir özellik listesi sağlayarak birden fazla eklenti özelliğini etkinleştirebilirsiniz. Aşağıdaki eklenti özellikleri ve sonraki sürümler için 2023-07-31 (GA) kullanılabilir.

Not

Tüm eklenti özellikleri tüm modeller tarafından desteklenmez. Daha fazla bilgi için bkz. model veri ayıklama.

aşağıdaki eklenti özellikleri, 2024-02-29-previewve sonraki sürümler için2024-02-29-preview kullanılabilir:

Not

2023-10-30-preview API'sindeki sorgu alanları uygulaması, son önizleme sürümünden farklıdır. Yeni uygulama daha ucuzdur ve yapılandırılmış belgelerle iyi çalışır.

Eklenti Özelliği Eklenti/Ücretsiz 2024-02-29-önizleme 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Yazı tipi özelliği ayıklama Eklenti ✔️ ✔️ yok yok
Formül ayıklama Eklenti ✔️ ✔️ yok yok
Yüksek çözünürlüklü ayıklama Eklenti ✔️ ✔️ yok yok
Barkod ayıklama Ücretsiz ✔️ ✔️ yok yok
Dil algılama Ücretsiz ✔️ ✔️ yok yok
Anahtar değer çiftleri Ücretsiz ✔️ yok yok yok
Sorgu alanları Eklenti* ✔️ yok yok yok

Eklenti* - Sorgu alanlarının fiyatı diğer eklenti özelliklerinden farklıdır. Ayrıntılar için fiyatlandırmaya bakın.

Yüksek çözünürlüklü ayıklama

Mühendislik çizimleri gibi büyük boyutlu belgelerden küçük metinleri tanıma görevi zor bir görevdir. Genellikle metin diğer grafik öğelerle karıştırılır ve çeşitli yazı tipleri, boyutları ve yönlendirmeleri vardır. Ayrıca, metin ayrı parçalara ayrılabilir veya diğer simgelerle bağlanabilir. Belge Zekası artık bu tür belgelerden içerik ayıklama özelliğini ocr.highResolution destekliyor. Bu eklenti özelliğini etkinleştirerek A1/A2/A3 belgelerinden geliştirilmiş içerik ayıklama kalitesi elde edersiniz.

REST API

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=ocrHighResolution
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=ocrHighResolution

Formül ayıklama

Bu ocr.formula özellik, matematik denklemleri gibi tanımlanan tüm formülleri altında bir üst düzey nesne contentolarak koleksiyonda formulas ayıklar. içinde contentalgılanan formüller olarak :formula:temsil edilir. Bu koleksiyondaki her girdi, veya displayolarak inline formül türünü ve koordinatlarıyla birlikte LaTeX gösterimini valuepolygon içeren bir formülü temsil eder. Başlangıçta, formüller her sayfanın sonunda görünür.

Not

Puan confidence sabit kodlanmış.

"content": ":formula:",
  "pages": [
    {
      "pageNumber": 1,
      "formulas": [
        {
          "kind": "inline",
          "value": "\\frac { \\partial a } { \\partial b }",
          "polygon": [...],
          "span": {...},
          "confidence": 0.99
        },
        {
          "kind": "display",
          "value": "y = a \\times b + a \\times c",
          "polygon": [...],
          "span": {...},
          "confidence": 0.99
        }
      ]
    }
  ]

REST API

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=formulas
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=formulas

Yazı tipi özelliği ayıklama

özelliği, ocr.font koleksiyonda styles ayıklanan metnin tüm yazı tipi özelliklerini altında contenten üst düzey nesne olarak ayıklar. Her stil nesnesi tek bir yazı tipi özelliğini, uygulandığı metin aralığını ve buna karşılık gelen güvenilirlik puanını belirtir. Varolan stil özelliği, metnin yazı tipi, italik ve normal gibi stiller, fontStyle kalın veya normalcolor, fontWeight metnin rengi ve backgroundColor metin sınırlayıcı kutusunun rengi gibi daha fazla yazı tipi özelliğiyle similarFontFamily genişletilir.

"content": "Foo bar",
"styles": [
    {
      "similarFontFamily": "Arial, sans-serif",
      "spans": [ { "offset": 0, "length": 3 } ],
      "confidence": 0.98
    },
    {
      "similarFontFamily": "Times New Roman, serif",
      "spans": [ { "offset": 4, "length": 3 } ],
      "confidence": 0.98
    },
    {
      "fontStyle": "italic",
      "spans": [ { "offset": 1, "length": 2 } ],
      "confidence": 0.98
    },
    {
      "fontWeight": "bold",
      "spans": [ { "offset": 2, "length": 3 } ],
      "confidence": 0.98
    },
    {
      "color": "#FF0000",
      "spans": [ { "offset": 4, "length": 2 } ],
      "confidence": 0.98
    },
    {
      "backgroundColor": "#00FF00",
      "spans": [ { "offset": 5, "length": 2 } ],
      "confidence": 0.98
    }
  ]

REST API

  {your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=styleFont
  {your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=styleFont

Barkod özelliği ayıklama

Bu özellik koleksiyondaki ocr.barcodebarcodes tüm tanımlanan barkodları altında contenten üst düzey nesne olarak ayıklar. contentiçinde algılanan barkodlar olarak :barcode:temsil edilir. Bu koleksiyondaki her giriş bir barkodu temsil eder ve koordinatlarıyla birlikte polygon olarak kind barkod türünü ve ekli barkod içeriğini value içerir. Başlangıçta, her sayfanın sonunda barkodlar görünür. confidence için 1 olarak sabit kodlanmıştır.

Desteklenen barkod türleri

Barkod Türü Örnek
QR Code QR Kodunun ekran görüntüsü.
Code 39 Kod 39'un ekran görüntüsü.
Code 93 Kod 93'ün ekran görüntüsü.
Code 128 Kod 128'in ekran görüntüsü.
UPC (UPC-A & UPC-E) UPC'nin ekran görüntüsü.
PDF417 PDF417'nin ekran görüntüsü.
EAN-8 Avrupa makale numarası barkod ean-8'in ekran görüntüsü.
EAN-13 Avrupa makale numarası barkod ean-13'ün ekran görüntüsü.
Codabar Codabar'ın ekran görüntüsü.
Databar Veri çubuğunun ekran görüntüsü.
Databar Genişletilmiş Genişletilmiş Veri çubuğunun ekran görüntüsü.
ITF Beşte ikisi arası barkodun (ITF) ekran görüntüsü.
Data Matrix Veri Matrisi'nin ekran görüntüsü.

REST API

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=barcodes
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=barcodes

Dil algılama

languages özelliği analyzeResult isteğe eklendiğinde, altındaki analyzeResultkoleksiyonda ile confidence birlikte her metin satırı için algılanan birincil dil tahmininde bulunurlanguages.

"languages": [
    {
        "spans": [
            {
                "offset": 0,
                "length": 131
            }
        ],
        "locale": "en",
        "confidence": 0.7
    },
]

REST API

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=languages
{your-resource-endpoint}.cognitiveservices.azure.com/formrecognizer/documentModels/prebuilt-layout:analyze?api-version=2023-07-31&features=languages

Anahtar-değer Çiftleri

Önceki API sürümlerinde, önceden oluşturulmuş belge modeli formlardan ve belgelerden anahtar-değer çiftlerini ayıkladı. Özelliğin keyValuePairs önceden oluşturulmuş düzene eklenmesiyle, düzen modeli artık aynı sonuçları üretir.

Anahtar-değer çiftleri, belge içinde bir etiketi veya anahtarı ve ilişkili yanıtını veya değerini tanımlayan belirli aralıklardır. Yapılandırılmış bir formda, bu çiftler etiket ve kullanıcının bu alan için girdiği değer olabilir. Yapılandırılmamış bir belgede, bir paragraftaki metne göre sözleşmenin yürütülme tarihi olabilir. Yapay zeka modeli, çok çeşitli belge türlerine, biçimlere ve yapılara göre tanımlanabilir anahtarları ve değerleri ayıklamak için eğitilir.

Model bir anahtarın mevcut olduğunu algıladığında, ilişkili değer olmadan veya isteğe bağlı alanları işlerken de anahtarlar yalıtılabilir. Örneğin, bazı durumlarda ikinci ad alanı formda boş bırakılabilir. Anahtar-değer çiftleri, belgede yer alan metinlerin yayılma alanlarıdır. Aynı değerin müşteri/kullanıcı gibi farklı şekillerde açıklandığı belgeler için, ilişkili anahtar müşteri veya kullanıcıdır (bağlama göre).

REST API

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=keyValuePairs

Sorgu Alanları

Sorgu alanları, önceden oluşturulmuş herhangi bir modelden ayıklanan şemayı genişletmeye veya anahtar adı değişken olduğunda belirli bir anahtar adı tanımlamaya yönelik bir eklenti özelliğidir. Sorgu alanlarını kullanmak için özellikleri queryFields olarak ayarlayın ve özelliğindeki queryFields alan adlarının virgülle ayrılmış bir listesini sağlayın.

  • Belge Zekası artık sorgu alanı ayıklamalarını destekliyor. Sorgu alanı ayıklama ile, ek eğitime gerek kalmadan bir sorgu isteği kullanarak ayıklama işlemine alanlar ekleyebilirsiniz.

  • Önceden oluşturulmuş veya özel bir modelin şemasını genişletmeniz veya düzenin çıkışıyla birkaç alan ayıklamanız gerektiğinde sorgu alanlarını kullanın.

  • Sorgu alanları premium eklenti özelliğidir. En iyi sonuçları elde etmek için, çok sözcüklü alan adları için deve büyük/küçük harf veya Pascal büyük/küçük harf alan adlarını kullanarak ayıklamak istediğiniz alanları tanımlayın.

  • Sorgu alanları istek başına en fazla 20 alanı destekler. Belge alan için bir değer içeriyorsa, alan ve değer döndürülür.

  • Bu sürüm, önceki uygulamadan daha düşük fiyatlı ve doğrulanması gereken sorgu alanları özelliğinin yeni bir uygulamasına sahiptir.

Not

Document Intelligence Studio sorgu alanı ayıklama şu anda Düzen ve Önceden Oluşturulmuş modeller 2024-02-29-preview2023-10-31-preview API'siyle ve modeller (W2, 1098 ve 1099s modelleri) dışında US tax sonraki sürümlerde kullanılabilir.

Sorgu alanı ayıklama

Sorgu alanı ayıklama için, ayıklamak istediğiniz alanları belirtin ve Belge Yönetim Bilgileri belgeyi uygun şekilde analiz eder. Bir örnek aşağıda verilmiştir:

  • Document Intelligence Studio'da bir sözleşmeyi işliyorsanız veya 2023-10-31-preview sürümlerini kullanın2024-02-29-preview:

    Document Intelligence Studio'daki sorgu alanları düğmesinin ekran görüntüsü.

  • İsteğin bir parçası olarak , , Party2, TermsOfUsePaymentTerms, , PaymentDateve TermEndDate gibi Party1alan etiketlerinin analyze document listesini geçirebilirsiniz.

    Document Intelligence Studio'da sorgu alanları seçim penceresinin ekran görüntüsü.

  • Belge Zekası, alan verilerini analiz edip ayıklayabilir ve yapılandırılmış bir JSON çıkışındaki değerleri döndürebildi.

  • Sorgu alanlarına ek olarak, yanıt metin, tablo, seçim işareti ve diğer ilgili verileri içerir.

REST API

{your-resource-endpoint}.cognitiveservices.azure.com/documentintelligence/documentModels/prebuilt-layout:analyze?api-version=2024-02-29-preview&features=queryFields&queryFields=TERMS

Sonraki adımlar

Daha fazla bilgi edinin: ModelDüzeni modelini okuma

SDK örnekleri: python