Instrucciones de formato para las direcciones URL y los documentos importados

Revise estas instrucciones de formato para obtener los mejores resultados de su contenido.

Consideraciones de formato

Después de importar un archivo o una dirección URL, QnA Maker convierte y almacena el contenido en formato de Markdown. El proceso de conversión agrega nuevas líneas al texto, como \n\n. Conocer el formato de Markdown le ayuda a comprender el contenido convertido y a administrar el contenido de la base de conocimiento.

Si agrega o edita el contenido directamente en la base de conocimiento, use el formato de Markdown para crear contenido de texto enriquecido o cambiar el contenido de dicho formato que ya está en la respuesta. QnA Maker admite gran parte del formato de Markdown para aportar funcionalidades de texto enriquecido al contenido. Sin embargo, es posible que la aplicación cliente, como un bot de chat, no admita el mismo conjunto de formatos de Markdown. Es importante probar la presentación de las respuestas de la aplicación cliente.

Vea una lista completa de tipos de contenido y ejemplos.

Formato básico de documentos

QnA Maker identifica las secciones y subsecciones, así como las relaciones, en el archivo según las indicaciones visuales, como:

  • tamaño de fuente
  • estilo de fuente
  • numeración
  • colores

Nota

Actualmente no se admite la extracción de imágenes de los documentos cargados.

Manuales de productos

Un manual suele ser material de orientación que acompaña a un producto. Ayuda al usuario a configurar, usar y mantener el producto y a solucionar problemas con el mismo. Cuando QnA Maker procesa un manual, extrae los títulos y subtítulos como preguntas y el contenido ulterior como respuestas. Consulte un ejemplo aquí.

A continuación se muestra un ejemplo de un manual con una página de índice y contenido jerárquico

Product Manual example for a knowledge base

Nota:

La extracción funciona mejor en manuales que tienen una tabla de contenido o una página de índice y una estructura clara con títulos jerárquicos.

Folletos, instrucciones, documentos y otros archivos

También se pueden procesar muchos otros tipos de documentos para generar pares de preguntas y respuestas, siempre que tengan una estructura y un diseño claros. Entre ellas se incluyen las siguientes: folletos, instrucciones, informes, documentos técnicos, documentos científicos, directivas, libros, etc. Consulte un ejemplo aquí.

A continuación se muestra un ejemplo de documento semiestructurado, sin un índice:

Azure Blob storage semi-structured Doc

Compatibilidad con documentos no estructurados

La característica de respuesta a preguntas personalizada ahora admite documentos no estructurados. Se puede considerar que un documento que no tiene su contenido organizado de una manera jerárquica bien definida, al que le falta una estructura de conjunto o cuyo contenido fluye libremente es un documento no estructurado.

A continuación se muestra un ejemplo de un documento PDF no estructurado:

Unstructured document example for a knowledge base

Actualmente, esta funcionalidad solo está disponible por medio de la carga de documentos y solo para los formatos de archivo PDF y DOC.

Importante

La compatibilidad con archivos o contenido no estructurado solo está disponible en la característica de respuesta a preguntas.

Documento de preguntas y respuestas estructurado

El formato de tipo pregunta-respuestas estructurado en los archivos de documento (DOC) consiste en alternar preguntas y respuestas por línea, una pregunta por línea seguida de su respuesta en la línea siguiente, tal como se muestra a continuación:

Question1

Answer1

Question2

Answer2

A continuación se muestra un ejemplo de un documento de Word de preguntas y respuestas estructurado:

Structured QnA document example for a knowledge base

Archivos TXT, TSV y XLS estructurados

Las preguntas y respuestas en forma de archivos .txt, .tsv o .xls estructurados también se pueden cargar en QnA Maker para crear o ampliar una base de conocimiento. Pueden ser texto sin formato o pueden tener contenido en formato RTF o HTML. Los pares de preguntas y respuestas tienen un campo de metadatos opcional que se puede usar para agruparlos en categorías.

Pregunta Respuesta Metadatos (1 clave: 1 valor)
Pregunta1 Respuesta1 Key1:Value1 | Key2:Value2
Pregunta2 Respuesta2 Key:Value

Se ignoran las columnas adicionales del archivo de origen.

Ejemplo de archivo de Excel estructurado

A continuación se muestra un ejemplo de archivo .xls de preguntas y respuestas estructurado, con contenido HTML:

Structured QnA excel example for a knowledge base

Ejemplo de preguntas alternativas para una sola respuesta en un archivo de Excel

A continuación se muestra un ejemplo de un archivo .xls de QnA estructurado, con varias preguntas alternativas para una sola respuesta:

Example of alternate questions for single answer in Excel file

Una vez importado el archivo, el par pregunta-respuesta se encuentra en la base de conocimiento, como se muestra a continuación:

Screenshot of alternate questions for single answer imported into knowledge base

Formato de datos estructurado mediante importación

Al importar una base de conocimiento, se reemplaza el contenido de la base de conocimiento existente. La importación requiere un archivo .tsv estructurado que contiene información del origen de datos. Esta información ayuda a QnA Maker a agrupar los pares pregunta-respuesta y a atribuirlos a un origen de datos particular. Los pares de preguntas y respuestas tienen un campo de metadatos opcional que se puede usar para agruparlos en categorías.

Pregunta Respuesta Source Metadatos (1 clave: 1 valor)
Pregunta1 Respuesta1 URL1 Key1:Value1 | Key2:Value2
Pregunta2 Respuesta2 Editorial Key:Value

Formato de documento de varios turnos

  • Use encabezados y subtítulos para denotar la jerarquía. Por ejemplo, puede agregar h1 para indicar las preguntas y respuestas principales y h2 para las que se deben tomar como aviso. Use el tamaño de encabezado pequeño para indicar la jerarquía subsiguiente. No utilice el estilo, el color u otro mecanismo para inferir la estructura en el documento, QnA Maker no extraerá las indicaciones multiturno.
  • El primer carácter del encabezado debe escribirse en mayúsculas.
  • No termine un encabezado con un signo de interrogación, ?.

Documentos de muestra:
Surface Pro (docx)
Ventajas de Contoso (docx)
Ventajas de Contoso (pdf)

Preguntas más frecuentes sobre las direcciones URL

QnA Maker puede admitir páginas web de preguntas más frecuentes de 3 formas diferentes:

  • Páginas de preguntas más frecuentes sin formato
  • Páginas de preguntas más frecuentes con vínculos
  • Páginas de preguntas más frecuentes con una página principal de temas

Páginas de preguntas más frecuentes sin formato

Este es el tipo más común de página de preguntas más frecuentes, en la que las respuestas siguen inmediatamente las preguntas de la misma página.

Aquí tiene un ejemplo de una página de preguntas más frecuentes sin formato:

Plain FAQ page example for a knowledge base

En este tipo de página de preguntas más frecuentes, las preguntas se agregan juntas y se vinculan a respuestas que están en secciones diferentes de la misma página o en páginas distintas.

A continuación se muestra un ejemplo de una página de preguntas más frecuentes con vínculos en las secciones que se encuentran en la misma página:

Section Link FAQ page example for a knowledge base

Este tipo de preguntas más frecuentes tiene una página de temas en la que cada tema se vincula a un conjunto de preguntas y respuestas correspondiente en una página diferente. QnA Maker rastrea todas las páginas vinculadas para extraer las preguntas y respuestas correspondientes.

A continuación, se muestra un ejemplo de una página de temas con vínculos a secciones de preguntas más frecuentes en páginas distintas.

Deep link FAQ page example for a knowledge base

Direcciones URL de soporte técnico

QnA Maker puede procesar páginas web de soporte semiestructuradas, como artículos web que describan cómo realizar una tarea determinada, cómo diagnosticar y resolver un problema determinado y cuáles son las mejores prácticas para un determinado proceso. La extracción funciona mejor en contenido con una estructura clara y con encabezados jerárquicos.

Nota

La extracción para artículos de soporte técnico es una característica nueva que se encuentra en sus primeras etapas. Funciona mejor con páginas simples, que están bien estructuradas y no contienen encabezados ni pies de página complejos.

QnA Maker supports extraction from semi-structured web pages where a clear structure is presented with hierarchical headings

Importación y exportación de la base de conocimiento

Los archivos TSV y XLS, de las bases de conocimiento exportadas, solo se pueden usar importando los archivos de la página Configuración en el portal QnA Maker. No se pueden usar como orígenes de datos durante la creación de la base de conocimiento ni desde las funciones + Agregar archivo o + Agregar URL de la página Configuración.

Al importar la knowledge base mediante estos archivos TSV y XLS, los pares de preguntas y respuestas se agregan al origen editorial y no a los orígenes de los que se extrajeron estos pares en la knowledge base exportada.

Pasos siguientes

Vea una lista completa de tipos de contenido y ejemplos.