Instructions de format pour la fonctionnalité Réponses aux questions

Passez en revue ces instructions de mise en forme afin d’obtenir les meilleurs résultats pour votre contenu.

Mise en forme - Éléments à prendre en compte

Après l’importation d’un fichier ou d’une URL, la fonctionnalité Réponses aux questions convertit et stocke votre contenu dans le format Markdown. Le processus de conversion ajoute de nouvelles lignes dans le texte, telles que \n\n. Une connaissance du format Markdown vous aide à comprendre le contenu converti et à gérer le contenu de votre base de connaissances.

Si vous ajoutez ou modifiez votre contenu directement dans votre base de connaissances, utilisez la mise en forme Markdown pour créer un contenu de texte enrichi ou modifiez le contenu du format Markdown qui est déjà dans la réponse. La fonctionnalité Réponses aux questions prend en charge une grande partie du format Markdown pour offrir des fonctionnalités de texte enrichi à votre contenu. Toutefois, l’application cliente, telle qu’un bot de chat, peut ne pas prendre en charge le même ensemble de formats Markdown. Il est important de tester l’affichage des réponses de l’application cliente.

Mise en forme de base du document

La fonctionnalité Réponses aux questions identifie les sections, sous-sections et relations dans le fichier en fonction d’indices visuels, notamment :

  • la taille de police
  • le style de police
  • la numérotation
  • les couleurs

Notes

Actuellement, nous ne prenons pas en charge l’extraction d’images à partir de documents chargés.

Manuels de produit

Un manuel comprend habituellement des supports d’orientation qui accompagnent un produit. Il aide l’utilisateur à configurer, utiliser, gérer et dépanner le produit. Lorsque la fonctionnalité Réponses aux questions traite un manuel, elle extrait les titres et les sous-titres sous forme de questions et le contenu qui suit sous forme de réponses. Un exemple vous est proposé ici.

Voici un exemple de manuel avec une page d’index et du contenu hiérarchique

Exemple de manuel de produit pour une base de connaissances

Notes

L’extraction est plus efficace sur les manuels qui ont une table des matières et/ou une page d’index, mais aussi une structure clairement définie avec des en-têtes hiérarchiques.

Brochures, instructions, livres blancs et autres fichiers

De nombreux autres types de documents peuvent également être traités pour générer des paires de questions-réponses, à condition qu’ils aient une structure et une disposition claires. notamment : brochures, instructions, rapports, livres blancs, articles scientifiques, stratégies, ouvrages, etc. Un exemple vous est proposé ici.

Voici un exemple de document semi-structuré, sans index :

Document semi-structuré de stockage Blob Azure

Prise en charge des documents non structurés

Réponses aux questions personnalisées prend maintenant en charge les documents non structurés. Un document dont le contenu n’est pas organisé d’une manière hiérarchique bien définie, n’a pas de structure définie ou est libre de toute mise en forme peut être considéré comme un document non structuré.

Voici ci-dessous un exemple de document PDF non structuré :

Exemple de document non structuré pour une base de connaissances

Notes

Les paires de Q/R ne sont pas extraites sous l’onglet « Modifier les sources » pour les sources non structurées.

Important

La prise en charge des fichiers/contenus non structurés est disponible uniquement dans Réponses aux questions.

Document de réponses aux questions structurée

Le format des questions-réponses structurées dans les fichiers DOC consiste à alterner les questions et les réponses ligne par ligne, une question sur une ligne suivie de sa réponse sur la ligne suivante, comme indiqué ci-dessous :

Question1

Answer1

Question2

Answer2

Voici un exemple de document Word de réponses aux questions structurée :

Exemple de document structuré de réponses aux questions pour une base de connaissances

Fichiers TXT, TSV et XLS structurés

Les réponses aux questions sous forme de fichiers .txt, .tsv ou .xls structurés peuvent également être chargés vers la fonctionnalité Réponses aux questions pour créer ou augmenter une base de connaissances. Il peuvent être en texte brut, ou peuvent avoir du contenu au format RTF ou HTML. Les paires de questions-réponses ont un champ de métadonnées facultatif qui peut être utilisé pour regrouper des paires de questions-réponses en catégories.

Question Réponse Métadonnées (1 clé : 1 valeur)
Question1 Réponse1 Key1:Value1 | Key2:Value2
Question2 Réponse2 Key:Value

Toutes les autres colonnes du fichier source sont ignorées.

Format de données structurées via l’importation

L’importation d’une base de connaissances remplace le contenu de la base de connaissances existante. L’importation nécessite un fichier .tsv structuré qui contient des informations sur la source de données. Ces informations aident à regrouper les paires de questions-réponses et à les attribuer à une source de données en particulier. Les paires de questions-réponses ont un champ de métadonnées facultatif qui peut être utilisé pour regrouper des paires de questions-réponses en catégories. Le format d’importation doit être similaire au format de base de connaissances exporté.

Question Réponse Source Métadonnées (1 clé : 1 valeur) QnaId
Question1 Réponse1 Url1 Key1:Value1 | Key2:Value2 QnaId 1
Question2 Réponse2 Éditorial Key:Value QnaId 2

Mise en forme multitour du document

  • Utilisez des titres et sous-titres pour montrer la hiérarchie. Par exemple, vous pouvez utiliser h1 pour indiquer la réponse à la question parente et h2 pour indiquer la réponse à la question à considérer comme une invite. Utilisez une petite taille de titre pour dénoter la hiérarchie suivante. N’utilisez pas de style, de couleur ou d’autre mécanisme pour montrer la structure de votre document. La fonctionnalité Réponses aux questions n’extraie pas les invites multitours.
  • Le premier caractère de l’en-tête doit être en majuscule.
  • Ne pas terminer un titre par un point d’interrogation (?).

Exemples de documents :
Surface Pro (docx)
Contoso Benefits (docx)
Contoso Benefits (pdf)

URL de FAQ

La fonctionnalité Réponses aux questions peut prendre en charge les pages web de forum aux questions sous trois formes différentes :

  • Pages de FAQ simples
  • Pages de FAQ avec des liens
  • Pages de FAQ avec une page d’accueil Rubriques

Pages de FAQ simples

Il s’agit du type le plus courant de page de FAQ, dans lequel les réponses suivent immédiatement les questions dans la même page.

Dans ce type de page de FAQ, les questions sont regroupées puis associées à des réponses qui se trouvent soit dans différentes sections de la même page, soit dans différentes pages.

Voici un exemple de page de FAQ avec des liens dans des sections qui se trouvent dans la même page :

Exemple de page de FAQ avec liens de sections pour une base de connaissances

Ce type de FAQ comporte une page Rubriques sur laquelle chaque rubrique est liée à un ensemble de questions et de réponses correspondant sur une autre page. La fonctionnalité Réponses aux questions analyse toutes les pages associées pour extraire les questions & réponses correspondantes.

Voici un exemple de page Rubriques comportant des liens vers des sections de FAQ sur d’autres pages.

Exemple de page de FAQ avec liens ciblés pour une base de connaissances

URL de support technique

La fonctionnalité Réponses aux questions peut traiter des pages web de support semi-structurées, telles que des articles web décrivant comment effectuer une tâche donnée, comment diagnostiquer et résoudre un problème donné, ainsi que les meilleures pratiques pour un processus donné. L’extraction fonctionne de façon optimale sur du contenu ayant une structure claire avec des titres hiérarchiques.

Notes

L’extraction pour les articles de support est une nouvelle fonctionnalité à un stade de développement encore précoce. Il convient idéalement pour les pages simples, qui sont bien structurées et qui ne contiennent pas d’en-têtes ou pieds de page complexes.

Importer et exporter une base de connaissances

L’utilisation de fichiers TSV et XLS provenant de bases de connaissances exportées n’est possible qu’en les important à partir de la page Paramètres de Language Studio. Il est impossible de les utiliser en tant que sources de données lors de la création de la base de connaissances ou à partir de la fonctionnalité + Ajouter un fichier ou + Ajouter une URL dans la page Paramètres.

Lorsque vous importez la base de connaissances via ces fichiers TSV et XLS, les paires de questions-réponses sont ajoutées à la source éditoriale et non aux sources à partir desquelles la question et les réponses ont été extraites dans la base de connaissances exportée.

Étapes suivantes