Partager via


Formats de données acceptés par le workflow d’orchestration

Quand les données sont utilisées par votre modèle pour l’entraînement, elles doivent être dans un format spécifique. Quand vous étiquetez vos données dans Language Studio, elles sont converties au format JSON décrit dans cet article. Vous pouvez aussi étiqueter manuellement vos fichiers.

Format de fichier JSON

Si vous chargez un fichier de balises, celui-ci doit respecter ce format.

{
  "projectFileVersion": "{API-VERSION}",
  "stringIndexType": "Utf16CodeUnit",
  "metadata": {
    "projectKind": "Orchestration",
    "projectName": "{PROJECT-NAME}",
    "multilingual": false,
    "description": "This is a description",
    "language": "{LANGUAGE-CODE}"
  },
  "assets": {
    "projectKind": "Orchestration",
    "intents": [
      {
        "category": "{INTENT1}",
        "orchestration": {
          "targetProjectKind": "Luis|Conversation|QuestionAnswering",
          "luisOrchestration": {
            "appId": "{APP-ID}",
            "appVersion": "0.1",
            "slotName": "production"
          },
          "conversationOrchestration": {
            "projectName": "{PROJECT-NAME}",
            "deploymentName": "{DEPLOYMENT-NAME}"
          },
          "questionAnsweringOrchestration": {
            "projectName": "{PROJECT-NAME}"
          }
        }
      }
    ],
    "utterances": [
      {
        "text": "utterance 1",
        "language": "{LANGUAGE-CODE}",
        "dataset": "{DATASET}",
        "intent": "intent1"
      }
    ]
  }
}
Clé Espace réservé Valeur Exemple
api-version {API-VERSION} Version de l’API que vous appelez. La valeur référencée ici correspond à la dernière version du modèle publiée. 2022-03-01-preview
confidenceThreshold {CONFIDENCE-THRESHOLD} Il s’agit du score de seuil sous lequel l’intention sera prédite comme aucune intention 0.7
projectName {PROJECT-NAME} Nom de votre projet. Cette valeur respecte la casse. EmailApp
multilingual false L’orchestration ne prend pas en charge la fonctionnalité multilingue false
language {LANGUAGE-CODE} Chaîne spécifiant le code de langue des énoncés utilisés dans votre projet. Consultez Support multilingue pour plus d’informations sur les codes de langue pris en charge. en-us
intents [] Tableau contenant l’ensemble des types d’intention contenus dans le projet. Il s’agit des intentions utilisées dans le projet d’orchestration. []

Format d’énoncé

[
    {
        "intent": "intent1",
        "language": "{LANGUAGE-CODE}",
        "text": "{Utterance-Text}",
    },
    {
        "intent": "intent2",
        "language": "{LANGUAGE-CODE}",
        "text": "{Utterance-Text}",
    }
]

Étapes suivantes