Определение проекций
Проекции данных, которые будут храниться в хранилище знаний, основываются на структурах документов, созданных конвейером обогащения в процессе индексирования. Каждый навык в вашем наборе навыков итеративно создает представление JSON обогащенных данных для индексируемых документов. Некоторые или все поля в документе можно сохранить как проекции.
Использование навыка Формирователь
Процесс индексирования постепенно создает сложный документ, содержащий различные поля выходных данных из навыков в наборе навыков. Это может привести к созданию схемы, с которой трудно работать и которая включает коллекции примитивных значений данных, которые не соответствуют правильному формату JSON.
Чтобы упростить сопоставление этих значений полей с проекциями в хранилище знаний, для создания нового поля, содержащего более простую структуру полей, которые необходимо сопоставить с проекциями, обычно используется навык Формирователь.
Например, рассмотрим следующее определение навыка Формирователя.
{
"@odata.type": "#Microsoft.Skills.Util.ShaperSkill",
"name": "define-projection",
"description": "Prepare projection fields",
"context": "/document",
"inputs": [
{
"name": "file_name",
"source": "/document/metadata_content_name"
},
{
"name": "url",
"source": "/document/url"
},
{
"name": "sentiment",
"source": "/document/sentimentScore"
},
{
"name": "key_phrases",
"source": null,
"sourceContext": "/document/merged_content/keyphrases/*",
"inputs": [
{
"name": "phrase",
"source": "/document/merged_content/keyphrases/*"
}
]
}
],
"outputs": [
{
"name": "output",
"targetName": "projection"
}
]
}
Этот навык формирователя создает поле проекции со следующей структурой:
{
"file_name": "file_name.pdf",
"url": "https://<storage_path>/file_name.pdf",
"sentiment": 1.0,
"key_phrases": [
{
"phrase": "first key phrase"
},
{
"phrase": "second key phrase"
},
{
"phrase": "third key phrase"
},
...
]
}
Полученный документ JSON имеет правильный формат и проще сопоставляется с проекцией в хранилище знаний, чем более сложный документ, который итеративно строится на основе предыдущих навыков в конвейере обогащения.