Formatos de datos aceptados por el flujo de trabajo de orquestación
Cuando el modelo usa los datos para el aprendizaje, espera que los datos tengan un formato específico. Al etiquetar los datos en Language Studio, se convierten al formato JSON descrito en este artículo. También puede etiquetar manualmente los archivos.
Formato de archivo JSON
Si carga un archivo de etiquetas, debe seguir este formato.
{
"projectFileVersion": "{API-VERSION}",
"stringIndexType": "Utf16CodeUnit",
"metadata": {
"projectKind": "Orchestration",
"projectName": "{PROJECT-NAME}",
"multilingual": false,
"description": "This is a description",
"language": "{LANGUAGE-CODE}"
},
"assets": {
"projectKind": "Orchestration",
"intents": [
{
"category": "{INTENT1}",
"orchestration": {
"targetProjectKind": "Luis|Conversation|QuestionAnswering",
"luisOrchestration": {
"appId": "{APP-ID}",
"appVersion": "0.1",
"slotName": "production"
},
"conversationOrchestration": {
"projectName": "{PROJECT-NAME}",
"deploymentName": "{DEPLOYMENT-NAME}"
},
"questionAnsweringOrchestration": {
"projectName": "{PROJECT-NAME}"
}
}
}
],
"utterances": [
{
"text": "utterance 1",
"language": "{LANGUAGE-CODE}",
"dataset": "{DATASET}",
"intent": "intent1"
}
]
}
}
Clave | Marcador de posición | Valor | Ejemplo |
---|---|---|---|
api-version |
{API-VERSION} |
Versión de la API a la que se llama. El valor al que se hace referencia aquí es para la versión del modelo publicada. | 2022-03-01-preview |
confidenceThreshold |
{CONFIDENCE-THRESHOLD} |
Esta es la puntuación de umbral por debajo de la cual la intención se predice como intención None | 0.7 |
projectName |
{PROJECT-NAME} |
Nombre del proyecto. Este valor distingue mayúsculas de minúsculas. | EmailApp |
multilingual |
false |
La orquestación no admite la característica multilingüe | false |
language |
{LANGUAGE-CODE} |
Cadena que especifica el código de idioma de las expresiones que se usan en el proyecto. Consulte Compatibilidad con idiomas para obtener más información sobre los códigos de idioma admitidos. | en-us |
intents |
[] |
Matriz que contiene todos los tipos de intención que hay en el proyecto. Estas son las intenciones que se usan en el proyecto de orquestación. | [] |
Formato de expresión
[
{
"intent": "intent1",
"language": "{LANGUAGE-CODE}",
"text": "{Utterance-Text}",
},
{
"intent": "intent2",
"language": "{LANGUAGE-CODE}",
"text": "{Utterance-Text}",
}
]
Pasos siguientes
- Puede importar los datos etiquetados directamente en el proyecto. Más información sobre cómo importar un proyecto
- Consulte el artículo de procedimientos para más información sobre el etiquetado de los datos. Cuando haya terminado de etiquetar los datos, puede entrenar el modelo.
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente las Cuestiones de GitHub como mecanismo de retroalimentación para el contenido y lo sustituiremos por un nuevo sistema de retroalimentación. Para más información, consulta:Enviar y ver comentarios de