Metin Birleştirme bilişsel becerisi

Makale
09/01/2024

Metin Birleştirme becerisi, bir dize dizisinden gelen metni tek bir alanda birleştirir.

Not

Bu beceri Azure yapay zeka hizmetlerine bağlı değildir. Faturalandırılamaz ve Azure AI hizmetleri temel gereksinimi yoktur.

@odata.type

Microsoft.Skills.Text.MergeSkill

Beceri parametreleri

Parametreler büyük/küçük harfe duyarlıdır.

Parametre adı	Açıklama
`insertPreTag`	Her eklemeden önce eklenecek dize. Varsayılan değer şudur: `" "`. Alanı atlamak için değerini olarak `""`ayarlayın.
`insertPostTag`	Her eklemeden sonra eklenecek dize. Varsayılan değer şudur: `" "`. Alanı atlamak için değerini olarak `""`ayarlayın.

Beceri girişleri

Giriş adı	Açıklama
`itemsToInsert`	Birleştirilecek dize dizisi.
`text`	(isteğe bağlı) Eklenecek ana metin gövdesi. Sağlanmazsa `text` öğeleri `itemsToInsert` birleştirir.
`offsets`	(isteğe bağlı) Eklenmesi gereken konum `itemsToInsert` dizisi`text`. Sağlanırsa, öğelerinin `text` sayısı öğesinin öğe `textToInsert`sayısına eşit olmalıdır. Aksi takdirde tüm öğeler sonuna `text`eklenir.

Beceri çıkışları

Çıkış adı	Açıklama
`mergedText`	Sonuçta elde edilen birleştirilmiş metin.
`mergedOffsets`	öğelerinin `itemsToInsert` eklendiği konum dizisi`mergedText`.

Örnek girdi

Bu beceri için kullanılabilir giriş sağlayan bir JSON belgesi şu olabilir:

{
  "values": [
    {
      "recordId": "1",
      "data":
      {
        "text": "The brown fox jumps over the dog",
        "itemsToInsert": ["quick", "lazy"],
        "offsets": [3, 28]
      }
    }
  ]
}

Örnek çıktı

Bu örnekte, insertPreTag öğesinin olarak, insertPostTag öğesinin ise olarak ayarlandığı " """varsayılarak önceki girişin çıkışı gösterilir.

{
  "values": [
    {
      "recordId": "1",
      "data":
      {
        "mergedText": "The quick brown fox jumps over the lazy dog"
      }
    }
  ]
}

Genişletilmiş örnek beceri kümesi tanımı

Metin Birleştirme'yi kullanmaya yönelik yaygın bir senaryo, resimlerin metinsel gösterimini (OCR becerisinden alınan metin veya resim yazısı) belgenin içerik alanıyla birleştirmektir.

Aşağıdaki örnek beceri kümesi, belgeye eklenmiş görüntülerden metin ayıklamak için OCR becerisini kullanır. Ardından, her görüntüden hem özgün hem de OCRed metinleri içeren bir merged_text alanı oluşturur. Burada OCR becerisi hakkında daha fazla bilgi edinebilirsiniz.

{
  "description": "Extract text from images and merge with content text to produce merged_text",
  "skills":
  [
    {
      "description": "Extract text (plain and structured) from image.",
      "@odata.type": "#Microsoft.Skills.Vision.OcrSkill",
      "context": "/document/normalized_images/*",
      "defaultLanguageCode": "en",
      "detectOrientation": true,
      "inputs": [
        {
          "name": "image",
          "source": "/document/normalized_images/*"
        }
      ],
      "outputs": [
        {
          "name": "text"
        }
      ]
    },
    {
      "@odata.type": "#Microsoft.Skills.Text.MergeSkill",
      "description": "Create merged_text, which includes all the textual representation of each image inserted at the right location in the content field.",
      "context": "/document",
      "insertPreTag": " ",
      "insertPostTag": " ",
      "inputs": [
        {
          "name":"text", 
          "source": "/document/content"
        },
        {
          "name": "itemsToInsert", 
          "source": "/document/normalized_images/*/text"
        },
        {
          "name":"offsets", 
          "source": "/document/normalized_images/*/contentOffset" 
        }
      ],
      "outputs": [
        {
          "name": "mergedText", 
          "targetName" : "merged_text"
        }
      ]
    }
  ]
}

Yukarıdaki örnekte normalleştirilmiş görüntüler alanının mevcut olduğu varsayılır. Normalleştirilmiş görüntüler alanını almak için dizin oluşturucu tanımınızdaki imageAction yapılandırmasını aşağıda gösterildiği gibiNormalizedImages oluşturacak şekilde ayarlayın:

{
  //...rest of your indexer definition goes here ...
  "parameters":{
    "configuration":{
        "dataToExtract":"contentAndMetadata",
        "imageAction":"generateNormalizedImages"
    }
  }
}

Aracılığıyla paylaş