Рекомендации по форматированию импортированных документов и URL-адресов

Ознакомьтесь с указанными рекомендациями по форматированию для получения наилучших результатов для вашего содержимого.

Рекомендации по форматированию

После импорта файла или URL-адреса QnA Maker преобразует и сохраняет ваш контент в формате уценки. В процессе преобразования в текст добавляются новые строки, например \n\n. Знание формата уценки поможет вам понять преобразованное содержимое и управлять содержимым базы знаний.

Если вы добавляете или редактируете свой контент непосредственно в базе знаний, воспользуйтесь форматированием уценки для создания расширенного текстового контента или измените содержание формата уценки, которое уже есть в ответе. QnA Maker поддерживает большую часть формата уценки, чтобы добавить в содержимое возможности форматированного текста. Тем не менее, клиентское приложение, например чат-бот, может не поддерживать тот же набор форматов уценки. Следует протестировать отображение ответов клиентским приложением.

См. полный список типов содержания и примеров.

Базовое форматирование документов

QnA Maker определяет разделы, подразделы и взаимосвязи в файле на основе таких визуальных подсказок, как:

  • размер шрифта
  • стиль шрифта
  • нумерация
  • цвета

Примечание.

В настоящее время мы не поддерживаем функцию извлечения изображений из загруженных документов.

Руководства по продукции

Руководством обычно называются справочные материалы, входящие в комплект поставки продукта. Они помогают пользователям устанавливать, использовать, обслуживать продукт и устранять возможные неполадки. Когда QnA Maker обрабатывает руководство, он извлекает заголовки и подзаголовки в качестве вопросов, а последующее содержимое — в качестве ответов. Пример вы можете найти здесь.

Ниже приведен пример руководства со страницей индексов и иерархическим содержимым

Product Manual example for a knowledge base

Примечание.

Извлечение лучше всего работает с руководствами с отдельным содержанием и (или) страницей индексов и хорошей иерархической структурой заголовков.

Брошюры, рекомендации, документы и другие файлы

Многие другие типы документов также могут быть обработаны для создания пар вопросов и ответов при условии, что они имеют четкую структуру и макет. К ним относятся: брошюры, руководства, отчеты, официальные документы, научные статьи, политики, книги и т. д. см. пример здесь.

Ниже приведен пример слабоструктурированного документа без индекса:

Azure Blob storage semi-structured Doc

Поддержка неструктурированных документов

Пользовательские ответы на вопросы теперь поддерживают неструктурированные документы. Документ, содержимое которого не организовано четко определенным иерархическим образом, в котором отсутствует заданная структура или содержимое свободно перемещается, может рассматриваться как неструктурированный документ.

Ниже приведен пример неструктурированного PDF-документа:

Unstructured document example for a knowledge base

В настоящее время данная функция доступна только при загрузке документов и только для форматов файлов PDF и DOC.

Важно!

Поддержка неструктурированного файла или содержимого доступна только в службе ответов на вопросы.

Документ структурированных вопросов и ответов

Формат структурированных "вопросов — ответов" в DOC-файлах представлен в чередующемся формате — по одному вопросу в строке, за которым следует ответ в следующей строке, как показано ниже.

Question1

Answer1

Question2

Answer2

Ниже приведен пример структурированного документа Word вопросов и ответов.

Structured QnA document example for a knowledge base

Структурированные TXT, TSV и XLS файлы

Вопросы и ответы в форме структурированных файлов в формате TXT, TSV или XLS также могут быть загружены в QnA Maker для создания или расширения базы знаний. Они могут быть либо обычным текстом, либо иметь содержимое в формате RTF или HTML. Пары QnA имеют необязательное поле метаданных, которое можно использовать для группирования пар QnA по категориям.

Вопрос Ответ Метаданные (1 ключ: 1 значение)
Question1 Answer1 Key1:Value1 | Key2:Value2
Question2 Answer2 Key:Value

Все остальные столбцы в исходном файле игнорируются.

Пример структурированного файла Excel

Ниже приведен пример структурированных вопросов и ответов файла формата XLS с содержимым HTML

Structured QnA excel example for a knowledge base

Пример альтернативных вопросов для единственного ответа в файле Excel

Ниже приведен пример структурированного файла QnA .xls с несколькими альтернативными вопросами для единственного ответа:

Example of alternate questions for single answer in Excel file

После импорта файла пара вопросов и ответов находится в базе знаний, как показано ниже:

Screenshot of alternate questions for single answer imported into knowledge base

Загрузка данных в структурированном формате через импорт

При импорте базы знаний содержимое существующей базы знаний полностью заменяется. Для импорта нужно предоставить структурированный TSV-файл с информацией об источнике данных. Эти сведения помогают QnA Maker сгруппировать пары "вопрос — ответ" и сопоставить их с конкретным источником данных. Пары QnA имеют необязательное поле метаданных, которое можно использовать для группирования пар QnA по категориям.

Вопрос Ответ Оригинал Метаданные (1 ключ: 1 значение)
Question1 Answer1 Url1 Key1:Value1 | Key2:Value2
Question2 Answer2 Редакция Key:Value

Многооборотное форматирование документа

  • Используйте заголовки и подзаголовки для обозначения иерархии. Например, родительский QnA можно обозначить как заголовок уровня 1, а QnA, который следует использовать в качестве подсказки, — как заголовок уровня 2. Используйте заголовок меньшего размера для обозначения последующей иерархии. Не используйте стиль, цвет или какой-либо другой механизм для обозначения структуры документа, поскольку QnA Maker не будет извлекать из таких документов подсказки для диалога с несколькими шагами.
  • Первый символ заголовка должен быть прописным.
  • Не завершайте заголовок вопросительным знаком ("?").

Примеры документов:
Surface Pro (DOCX)
Преимущества Contoso (DOCX)
Преимущества Contoso (PDF)

URL-адреса вопросов и ответов

QnA Maker может поддерживать веб-страницы вопросов и ответов в трех разных формах:

  • Простые страницы вопросов и ответов
  • Страницы вопросов и ответов со ссылками
  • Страницы часто задаваемых вопросов с главной страницей тем

Простые страницы вопросов и ответов

Это наиболее распространенный тип страниц с вопросами и ответами, в котором ответы содержатся на той же странице, сразу после каждого вопроса.

Ниже показан пример простой страницы вопросов и ответов.

Plain FAQ page example for a knowledge base

В этом типе страниц с вопросами и ответами все вопросы собраны вместе и содержат ссылки на ответы, расположенные либо в разных разделах на той же странице, либо на разных страницах.

Ниже показан пример страницы вопросов и ответов со ссылками на разделы, которые расположенные на той же странице.

Section Link FAQ page example for a knowledge base

Этот тип часто задаваемых вопросов имеет страницу тем, где каждая тема связана с соответствующим набором вопросов и ответов на отдельной странице. QnA Maker просматривает все связанные страницы, чтобы извлечь соответствующие вопросы и ответы.

Ниже приведен пример страницы тем со ссылками на разделы часто задаваемых вопросов на разных страницах.

Deep link FAQ page example for a knowledge base

URL-адреса для поддержки

QnA Maker может обрабатывать полуструктурированные веб-страницы поддержки, такие как статьи в Интернете, описывающие способы выполнения определенной задачи, способы диагностики и устранения проблемы и рекомендации для процесса. Извлечение лучше всего работает с документами, которые имеют четкую структуру с иерархической структурой заголовков.

Примечание.

Извлечение для статьи о поддержке — это новая функция, которая находится на ранних стадиях. Она лучше всего подходит для простых страниц, которые хорошо структурированы и не содержат сложные колонтитулы.

QnA Maker supports extraction from semi-structured web pages where a clear structure is presented with hierarchical headings

База знаний по импорту и экспорту

Файлы TSV и XLS из экспортированных баз знаний можно использовать только путем импорта файлов со страницы Настройки на портале QnA Maker. Их нельзя использовать в качестве источников данных во время создания базы знаний или с помощью функции Добавить файл или + Добавить URL на странице Настройки.

Когда вы импортируете базу знаний через файлы TSV и XLS, пары QnA добавляются в редакторский источник, а не в источники, из которых были извлечены QnA в экспортированной базе знаний.

Следующие шаги

См. полный список типов содержания и примеров