Compartir vía


Formatos de datos aceptados por el flujo de trabajo de orquestación

Cuando el modelo usa los datos para el aprendizaje, espera que los datos tengan un formato específico. Al etiquetar los datos en Language Studio, se convierten al formato JSON descrito en este artículo. También puede etiquetar manualmente los archivos.

Formato de archivo JSON

Si carga un archivo de etiquetas, debe seguir este formato.

{
  "projectFileVersion": "{API-VERSION}",
  "stringIndexType": "Utf16CodeUnit",
  "metadata": {
    "projectKind": "Orchestration",
    "projectName": "{PROJECT-NAME}",
    "multilingual": false,
    "description": "This is a description",
    "language": "{LANGUAGE-CODE}"
  },
  "assets": {
    "projectKind": "Orchestration",
    "intents": [
      {
        "category": "{INTENT1}",
        "orchestration": {
          "targetProjectKind": "Luis|Conversation|QuestionAnswering",
          "luisOrchestration": {
            "appId": "{APP-ID}",
            "appVersion": "0.1",
            "slotName": "production"
          },
          "conversationOrchestration": {
            "projectName": "{PROJECT-NAME}",
            "deploymentName": "{DEPLOYMENT-NAME}"
          },
          "questionAnsweringOrchestration": {
            "projectName": "{PROJECT-NAME}"
          }
        }
      }
    ],
    "utterances": [
      {
        "text": "utterance 1",
        "language": "{LANGUAGE-CODE}",
        "dataset": "{DATASET}",
        "intent": "intent1"
      }
    ]
  }
}
Clave Marcador de posición Valor Ejemplo
api-version {API-VERSION} Versión de la API a la que se llama. El valor al que se hace referencia aquí es para la versión del modelo publicada. 2022-03-01-preview
confidenceThreshold {CONFIDENCE-THRESHOLD} Esta es la puntuación de umbral por debajo de la cual la intención se predice como intención None 0.7
projectName {PROJECT-NAME} Nombre del proyecto. Este valor distingue mayúsculas de minúsculas. EmailApp
multilingual false La orquestación no admite la característica multilingüe false
language {LANGUAGE-CODE} Cadena que especifica el código de idioma de las expresiones que se usan en el proyecto. Consulte Compatibilidad con idiomas para obtener más información sobre los códigos de idioma admitidos. en-us
intents [] Matriz que contiene todos los tipos de intención que hay en el proyecto. Estas son las intenciones que se usan en el proyecto de orquestación. []

Formato de expresión

[
    {
        "intent": "intent1",
        "language": "{LANGUAGE-CODE}",
        "text": "{Utterance-Text}",
    },
    {
        "intent": "intent2",
        "language": "{LANGUAGE-CODE}",
        "text": "{Utterance-Text}",
    }
]

Pasos siguientes