Instrucciones de formato para las direcciones URL y los documentos importados
Revise estas instrucciones de formato para obtener los mejores resultados de su contenido.
Consideraciones de formato
Después de importar un archivo o una dirección URL, QnA Maker convierte y almacena el contenido en formato de Markdown. El proceso de conversión agrega nuevas líneas al texto, como \n\n
. Conocer el formato de Markdown le ayuda a comprender el contenido convertido y a administrar el contenido de la base de conocimiento.
Si agrega o edita el contenido directamente en la base de conocimiento, use el formato de Markdown para crear contenido de texto enriquecido o cambiar el contenido de dicho formato que ya está en la respuesta. QnA Maker admite gran parte del formato de Markdown para aportar funcionalidades de texto enriquecido al contenido. Sin embargo, es posible que la aplicación cliente, como un bot de chat, no admita el mismo conjunto de formatos de Markdown. Es importante probar la presentación de las respuestas de la aplicación cliente.
Vea una lista completa de tipos de contenido y ejemplos.
Formato básico de documentos
QnA Maker identifica las secciones y subsecciones, así como las relaciones, en el archivo según las indicaciones visuales, como:
- tamaño de fuente
- estilo de fuente
- numeración
- colores
Nota
Actualmente no se admite la extracción de imágenes de los documentos cargados.
Manuales de productos
Un manual suele ser material de orientación que acompaña a un producto. Ayuda al usuario a configurar, usar y mantener el producto y a solucionar problemas con el mismo. Cuando QnA Maker procesa un manual, extrae los títulos y subtítulos como preguntas y el contenido ulterior como respuestas. Consulte un ejemplo aquí.
A continuación se muestra un ejemplo de un manual con una página de índice y contenido jerárquico
Nota
La extracción funciona mejor en manuales que tienen una tabla de contenido o una página de índice y una estructura clara con títulos jerárquicos.
Folletos, instrucciones, documentos y otros archivos
También se pueden procesar muchos otros tipos de documentos para generar pares de preguntas y respuestas, siempre que tengan una estructura y un diseño claros. Entre ellas se incluyen las siguientes: folletos, instrucciones, informes, documentos técnicos, documentos científicos, directivas, libros, etc. Consulte un ejemplo aquí.
A continuación se muestra un ejemplo de documento semiestructurado, sin un índice:
Compatibilidad con documentos no estructurados
La característica de respuesta a preguntas personalizada ahora admite documentos no estructurados. Se puede considerar que un documento que no tiene su contenido organizado de una manera jerárquica bien definida, al que le falta una estructura de conjunto o cuyo contenido fluye libremente es un documento no estructurado.
A continuación se muestra un ejemplo de un documento PDF no estructurado:
Actualmente, esta funcionalidad solo está disponible por medio de la carga de documentos y solo para los formatos de archivo PDF y DOC.
Importante
La compatibilidad con archivos o contenido no estructurado solo está disponible en la característica de respuesta a preguntas.
Documento de preguntas y respuestas estructurado
El formato de tipo pregunta-respuestas estructurado en los archivos de documento (DOC) consiste en alternar preguntas y respuestas por línea, una pregunta por línea seguida de su respuesta en la línea siguiente, tal como se muestra a continuación:
Question1
Answer1
Question2
Answer2
A continuación se muestra un ejemplo de un documento de Word de preguntas y respuestas estructurado:
Archivos TXT, TSV y XLS estructurados
Las preguntas y respuestas en forma de archivos .txt, .tsv o .xls estructurados también se pueden cargar en QnA Maker para crear o ampliar una base de conocimiento. Pueden ser texto sin formato o pueden tener contenido en formato RTF o HTML. Los pares de preguntas y respuestas tienen un campo de metadatos opcional que se puede usar para agruparlos en categorías.
Pregunta | Respuesta | Metadatos (1 clave: 1 valor) |
---|---|---|
Pregunta1 | Respuesta1 | Key1:Value1 | Key2:Value2 |
Pregunta2 | Respuesta2 | Key:Value |
Se ignoran las columnas adicionales del archivo de origen.
Ejemplo de archivo de Excel estructurado
A continuación se muestra un ejemplo de archivo .xls de preguntas y respuestas estructurado, con contenido HTML:
Ejemplo de preguntas alternativas para una sola respuesta en un archivo de Excel
A continuación se muestra un ejemplo de un archivo .xls de QnA estructurado, con varias preguntas alternativas para una sola respuesta:
Una vez importado el archivo, el par pregunta-respuesta se encuentra en la base de conocimiento, como se muestra a continuación:
Formato de datos estructurado mediante importación
Al importar una base de conocimiento, se reemplaza el contenido de la base de conocimiento existente. La importación requiere un archivo .tsv estructurado que contiene información del origen de datos. Esta información ayuda a QnA Maker a agrupar los pares pregunta-respuesta y a atribuirlos a un origen de datos particular. Los pares de preguntas y respuestas tienen un campo de metadatos opcional que se puede usar para agruparlos en categorías.
Pregunta | Respuesta | Source | Metadatos (1 clave: 1 valor) |
---|---|---|---|
Pregunta1 | Respuesta1 | URL1 | Key1:Value1 | Key2:Value2 |
Pregunta2 | Respuesta2 | Editorial | Key:Value |
Formato de documento de varios turnos
- Use encabezados y subtítulos para denotar la jerarquía. Por ejemplo, puede agregar h1 para indicar las preguntas y respuestas principales y h2 para las que se deben tomar como aviso. Use el tamaño de encabezado pequeño para indicar la jerarquía subsiguiente. No utilice el estilo, el color u otro mecanismo para inferir la estructura en el documento, QnA Maker no extraerá las indicaciones multiturno.
- El primer carácter del encabezado debe escribirse en mayúsculas.
- No termine un encabezado con un signo de interrogación,
?
.
Documentos de muestra:
Surface Pro (docx)
Ventajas de Contoso (docx)
Ventajas de Contoso (pdf)
Preguntas más frecuentes sobre las direcciones URL
QnA Maker puede admitir páginas web de preguntas más frecuentes de 3 formas diferentes:
- Páginas de preguntas más frecuentes sin formato
- Páginas de preguntas más frecuentes con vínculos
- Páginas de preguntas más frecuentes con una página principal de temas
Páginas de preguntas más frecuentes sin formato
Este es el tipo más común de página de preguntas más frecuentes, en la que las respuestas siguen inmediatamente las preguntas de la misma página.
Aquí tiene un ejemplo de una página de preguntas más frecuentes sin formato:
Páginas de preguntas más frecuentes con vínculos
En este tipo de página de preguntas más frecuentes, las preguntas se agregan juntas y se vinculan a respuestas que están en secciones diferentes de la misma página o en páginas distintas.
A continuación se muestra un ejemplo de una página de preguntas más frecuentes con vínculos en las secciones que se encuentran en la misma página:
Vínculos de páginas de temas primarios a páginas de respuestas secundarias
Este tipo de preguntas más frecuentes tiene una página de temas en la que cada tema se vincula a un conjunto de preguntas y respuestas correspondiente en una página diferente. QnA Maker rastrea todas las páginas vinculadas para extraer las preguntas y respuestas correspondientes.
A continuación, se muestra un ejemplo de una página de temas con vínculos a secciones de preguntas más frecuentes en páginas distintas.
Direcciones URL de soporte técnico
QnA Maker puede procesar páginas web de soporte semiestructuradas, como artículos web que describan cómo realizar una tarea determinada, cómo diagnosticar y resolver un problema determinado y cuáles son las mejores prácticas para un determinado proceso. La extracción funciona mejor en contenido con una estructura clara y con encabezados jerárquicos.
Nota
La extracción para artículos de soporte técnico es una característica nueva que se encuentra en sus primeras etapas. Funciona mejor con páginas simples, que están bien estructuradas y no contienen encabezados ni pies de página complejos.
Importación y exportación de la base de conocimiento
Los archivos TSV y XLS, de las bases de conocimiento exportadas, solo se pueden usar importando los archivos de la página Configuración en el portal QnA Maker. No se pueden usar como orígenes de datos durante la creación de la base de conocimiento ni desde las funciones + Agregar archivo o + Agregar URL de la página Configuración.
Al importar la knowledge base mediante estos archivos TSV y XLS, los pares de preguntas y respuestas se agregan al origen editorial y no a los orígenes de los que se extrajeron estos pares en la knowledge base exportada.
Pasos siguientes
Vea una lista completa de tipos de contenido y ejemplos.