Directrices de formato para la respuesta de preguntas

Revise estas instrucciones de formato para obtener los mejores resultados de su contenido.

Consideraciones de formato

Después de importar un archivo o una dirección URL, la respuesta a preguntas convierte y almacena el contenido en formato de Markdown. El proceso de conversión agrega nuevas líneas al texto, como \n\n. Conocer el formato de Markdown le ayuda a comprender el contenido convertido y a administrar el contenido de la base de conocimiento.

Si agrega o edita el contenido directamente en la base de conocimiento, use el formato de Markdown para crear contenido de texto enriquecido o cambiar el contenido de dicho formato que ya está en la respuesta. La respuesta a preguntas admite gran parte del formato de Markdown para aportar funcionalidades de texto enriquecido al contenido. Sin embargo, es posible que la aplicación cliente, como un bot de chat, no admita el mismo conjunto de formatos de Markdown. Es importante probar la presentación de las respuestas de la aplicación cliente.

Formato básico de documentos

La respuesta a preguntas identifica las secciones y subsecciones, así como las relaciones, en el archivo según las indicaciones visuales, como:

  • tamaño de fuente
  • estilo de fuente
  • numeración
  • colores

Nota

Actualmente no se admite la extracción de imágenes de los documentos cargados.

Manuales de productos

Un manual suele ser material de orientación que acompaña a un producto. Ayuda al usuario a configurar, usar y mantener el producto y a solucionar problemas con el mismo. Cuando la respuesta a preguntas procesa un manual, extrae los títulos y subtítulos como preguntas y el contenido ulterior como respuestas. Consulte un ejemplo aquí.

A continuación se muestra un ejemplo de un manual con una página de índice y contenido jerárquico

Ejemplo de manual del producto para knowledge base

Nota

La extracción funciona mejor en manuales que tienen una tabla de contenido o una página de índice y una estructura clara con títulos jerárquicos.

Folletos, instrucciones, documentos y otros archivos

También se pueden procesar muchos otros tipos de documentos para generar pares de preguntas y respuestas, siempre que tengan una estructura y un diseño claros. Entre ellas se incluyen las siguientes: folletos, instrucciones, informes, documentos técnicos, documentos científicos, directivas, libros, etc. Consulte un ejemplo aquí.

A continuación se muestra un ejemplo de documento semiestructurado, sin un índice:

Documento semiestructurado de Azure Blob Storage

Compatibilidad con documentos no estructurados

La característica de respuesta a preguntas personalizada ahora admite documentos no estructurados. Se puede considerar que un documento que no tiene su contenido organizado de una manera jerárquica bien definida, al que le falta una estructura de conjunto o cuyo contenido fluye libremente es un documento no estructurado.

A continuación se muestra un ejemplo de un documento PDF no estructurado:

Ejemplo de documento no estructurado para una knowledge base

Nota

Los pares de pregunta y respuesta no se extraen en la pestaña "Editar orígenes" para orígenes no estructurados.

Importante

La compatibilidad con archivos o contenido no estructurado solo está disponible en la característica de respuesta a preguntas.

Documento de respuesta a preguntas estructurado

El formato de respuestas a preguntas estructuradas en los archivos de documento (DOC) consiste en alternar preguntas y respuestas por línea, una pregunta por línea seguida de su respuesta en la línea siguiente, tal como se muestra a continuación:

Question1

Answer1

Question2

Answer2

A continuación, se muestra un ejemplo de un documento de palabras de respuesta de preguntas estructurada:

Ejemplo de documento de QnA estructurado para una knowledge base

Archivos TXT, TSV y XLS estructurados

La respuesta a preguntas en forma de archivos .txt, .tsv o .xls estructurados también se pueden cargar en la respuesta a preguntas para crear o ampliar una base de conocimiento. Pueden ser texto sin formato o pueden tener contenido en formato RTF o HTML. Los pares de preguntas y respuestas tienen un campo de metadatos opcional que se puede usar para agruparlos en categorías.

Pregunta Respuesta Metadatos (1 clave: 1 valor)
Pregunta1 Respuesta1 Key1:Value1 | Key2:Value2
Pregunta2 Respuesta2 Key:Value

Se ignoran las columnas adicionales del archivo de origen.

Formato de datos estructurado mediante importación

Al importar una base de conocimiento, se reemplaza el contenido de la base de conocimiento existente. La importación requiere un archivo .tsv estructurado que contiene información del origen de datos. Esta información ayuda a agrupar los pares pregunta-respuesta y a atribuirlos a un origen de datos particular. Los pares de preguntas y respuestas tienen un campo de metadatos opcional que se puede usar para agruparlos en categorías. El formato de importación debe ser similar al formato de la base de conocimiento exportada.

Pregunta Respuesta Source Metadatos (1 clave: 1 valor) QnaId
Pregunta1 Respuesta1 URL1 Key1:Value1 | Key2:Value2 QnaId 1
Pregunta2 Respuesta2 Editorial Key:Value QnaId 2

Formato de documento de varios turnos

  • Use encabezados y subtítulos para indicar la jerarquía. Por ejemplo, puede usar h1 para indicar la respuesta a la pregunta primaria y h2 para indicar la respuesta a la pregunta que se debe tomar como solicitud. Use el tamaño de encabezado pequeño para indicar la jerarquía subsiguiente. No utilice el estilo, el color u otro mecanismo para inferir la estructura en el documento, la respuesta a preguntas no extraerá las solicitudes de varios turnos.
  • El primer carácter del encabezado debe escribirse en mayúsculas.
  • No termine un encabezado con un signo de interrogación, ?.

Documentos de muestra:
Surface Pro (docx)
Ventajas de Contoso (docx)
Ventajas de Contoso (pdf)

Preguntas más frecuentes sobre las direcciones URL

La respuesta a preguntas puede admitir páginas web de preguntas más frecuentes de tres formas diferentes:

  • Páginas de preguntas más frecuentes sin formato
  • Páginas de preguntas más frecuentes con vínculos
  • Páginas de preguntas más frecuentes con una página principal de temas

Páginas de preguntas más frecuentes sin formato

Este es el tipo más común de página de preguntas más frecuentes, en la que las respuestas siguen inmediatamente las preguntas de la misma página.

En este tipo de página de preguntas más frecuentes, las preguntas se agregan juntas y se vinculan a respuestas que están en secciones diferentes de la misma página o en páginas distintas.

A continuación se muestra un ejemplo de una página de preguntas más frecuentes con vínculos en las secciones que se encuentran en la misma página:

Ejemplo de página de preguntas más frecuentes con sección de vínculos para una base de conocimiento

Este tipo de preguntas más frecuentes tiene una página de temas en la que cada tema se vincula a un conjunto de preguntas y respuestas correspondiente en una página diferente. La respuesta a preguntas rastrea todas las páginas vinculadas para extraer las preguntas y respuestas correspondientes.

A continuación, se muestra un ejemplo de una página de temas con vínculos a secciones de preguntas más frecuentes en páginas distintas.

Ejemplo de página de preguntas más frecuentes con vínculos profundos para knowledge base

Direcciones URL de soporte técnico

La respuesta a preguntas puede procesar páginas web de soporte técnico semiestructuradas, como artículos web que describen cómo realizar una tarea determinada, cómo diagnosticar y resolver un problema determinado y cuáles son las mejores prácticas para un determinado proceso. La extracción funciona mejor en contenido con una estructura clara y con encabezados jerárquicos.

Nota

La extracción para artículos de soporte técnico es una característica nueva que se encuentra en sus primeras etapas. Funciona mejor con páginas simples, que están bien estructuradas y no contienen encabezados ni pies de página complejos.

Importación y exportación de la base de conocimiento

Los archivos TSV y XLS de las bases de conocimiento exportadas solo se pueden usar mediante la importación de los archivos de la página Configuración en Language Studio. No se pueden usar como orígenes de datos durante la creación de la knowledge base ni desde las características + Agregar archivo o + Agregar URL de la página Configuración.

Al importar la knowledge base mediante estos archivos TSV y XLS, los pares de preguntas y respuestas se agregan al origen editorial y no a los orígenes de los que se extrajeron estos pares en la knowledge base exportada.

Pasos siguientes