Formats de données acceptés par le workflow d’orchestration
Quand les données sont utilisées par votre modèle pour l’entraînement, elles doivent être dans un format spécifique. Quand vous étiquetez vos données dans Language Studio, elles sont converties au format JSON décrit dans cet article. Vous pouvez aussi étiqueter manuellement vos fichiers.
Format de fichier JSON
Si vous chargez un fichier de balises, celui-ci doit respecter ce format.
{
"projectFileVersion": "{API-VERSION}",
"stringIndexType": "Utf16CodeUnit",
"metadata": {
"projectKind": "Orchestration",
"projectName": "{PROJECT-NAME}",
"multilingual": false,
"description": "This is a description",
"language": "{LANGUAGE-CODE}"
},
"assets": {
"projectKind": "Orchestration",
"intents": [
{
"category": "{INTENT1}",
"orchestration": {
"targetProjectKind": "Luis|Conversation|QuestionAnswering",
"luisOrchestration": {
"appId": "{APP-ID}",
"appVersion": "0.1",
"slotName": "production"
},
"conversationOrchestration": {
"projectName": "{PROJECT-NAME}",
"deploymentName": "{DEPLOYMENT-NAME}"
},
"questionAnsweringOrchestration": {
"projectName": "{PROJECT-NAME}"
}
}
}
],
"utterances": [
{
"text": "utterance 1",
"language": "{LANGUAGE-CODE}",
"dataset": "{DATASET}",
"intent": "intent1"
}
]
}
}
Clé | Espace réservé | Valeur | Exemple |
---|---|---|---|
api-version |
{API-VERSION} |
Version de l’API que vous appelez. La valeur référencée ici correspond à la dernière version du modèle publiée. | 2022-03-01-preview |
confidenceThreshold |
{CONFIDENCE-THRESHOLD} |
Il s’agit du score de seuil sous lequel l’intention sera prédite comme aucune intention | 0.7 |
projectName |
{PROJECT-NAME} |
Nom de votre projet. Cette valeur respecte la casse. | EmailApp |
multilingual |
false |
L’orchestration ne prend pas en charge la fonctionnalité multilingue | false |
language |
{LANGUAGE-CODE} |
Chaîne spécifiant le code de langue des énoncés utilisés dans votre projet. Consultez Support multilingue pour plus d’informations sur les codes de langue pris en charge. | en-us |
intents |
[] |
Tableau contenant l’ensemble des types d’intention contenus dans le projet. Il s’agit des intentions utilisées dans le projet d’orchestration. | [] |
Format d’énoncé
[
{
"intent": "intent1",
"language": "{LANGUAGE-CODE}",
"text": "{Utterance-Text}",
},
{
"intent": "intent2",
"language": "{LANGUAGE-CODE}",
"text": "{Utterance-Text}",
}
]
Étapes suivantes
- Vous pouvez importer vos données étiquetées directement dans votre projet. Découvrir comment importer un projet
- Pour plus d’informations sur l’étiquetage de vos données, consultez l’article Guide pratique. Une fois que vous avez fini d’étiqueter vos données, vous pouvez effectuer l’apprentissage de votre modèle.