Определение проекций

Завершено

Проекции данных, которые будут храниться в хранилище знаний, основываются на структурах документов, созданных конвейером обогащения в процессе индексирования. Каждый навык в вашем наборе навыков итеративно создает представление JSON обогащенных данных для индексируемых документов. Некоторые или все поля в документе можно сохранить как проекции.

Использование навыка Формирователь

Процесс индексирования постепенно создает сложный документ, содержащий различные поля выходных данных из навыков в наборе навыков. Это может привести к созданию схемы, с которой трудно работать и которая включает коллекции примитивных значений данных, которые не соответствуют правильному формату JSON.

Чтобы упростить сопоставление этих значений полей с проекциями в хранилище знаний, для создания нового поля, содержащего более простую структуру полей, которые необходимо сопоставить с проекциями, обычно используется навык Формирователь.

Например, рассмотрим следующее определение навыка Формирователя.

{
  "@odata.type": "#Microsoft.Skills.Util.ShaperSkill",
  "name": "define-projection",
  "description": "Prepare projection fields",
  "context": "/document",
  "inputs": [
    {
      "name": "file_name",
      "source": "/document/metadata_content_name"
    },
    {
      "name": "url",
      "source": "/document/url"
    },
    {
      "name": "sentiment",
      "source": "/document/sentimentScore"
    },
    {
      "name": "key_phrases",
      "source": null,
      "sourceContext": "/document/merged_content/keyphrases/*",
      "inputs": [
        {
          "name": "phrase",
          "source": "/document/merged_content/keyphrases/*"
        }
      ]
    }
  ],
  "outputs": [
    {
      "name": "output",
      "targetName": "projection"
    }
  ]
}

Этот навык формирователя создает поле проекции со следующей структурой:

{
    "file_name": "file_name.pdf",
    "url": "https://<storage_path>/file_name.pdf",
    "sentiment": 1.0,
    "key_phrases": [
        {
            "phrase": "first key phrase"
        },
        {
            "phrase": "second key phrase"
        },
        {
            "phrase": "third key phrase"
        },
        ...
    ]
}

Полученный документ JSON имеет правильный формат и проще сопоставляется с проекцией в хранилище знаний, чем более сложный документ, который итеративно строится на основе предыдущих навыков в конвейере обогащения.