Transcriptions - Transcribe

Referencia

Servicio:: Azure AI Services

Versión de la API:: 2024-11-15

Transcripción sincrónica de un archivo de audio.

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Parámetros de identificador URI

Nombre	En	Requerido	Tipo	Description
audio	formData	True	file binary	Contenido del archivo de audio que se va a transcribir. El archivo de audio debe tener menos de 2 horas de duración de audio y un tamaño inferior a 250 MB.
definition	formData		string	Metadatos de una solicitud de transcripción. Este campo contiene un objeto serializado por JSON de tipo `TranscribeDefinition`.
endpoint	path	True	string	Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com).
api-version	query	True	string	Versión de api solicitada.

Encabezado de la solicitud

Media Types: "multipart/form-data"

Nombre	Requerido	Tipo	Description
Ocp-Apim-Subscription-Key	True	string	Proporcione aquí la clave de la cuenta de Cognitive Services.

Respuestas

Nombre	Tipo	Description
200 OK	TranscribeResult	De acuerdo
Other Status Codes	Error	Error.

Seguridad

Ocp-Apim-Subscription-Key

Proporcione aquí la clave de la cuenta de Cognitive Services.

Tipo: apiKey
En: header

Ejemplos

Transcribe an audio file

Solicitud de ejemplo

HTTP

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Respuesta de muestra

status code:: 200

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

Definiciones

Nombre	Description
ChannelCombinedPhrases	Transcripción completa por canal.
DetailedErrorCode	DetailedErrorCode
Error	Error
ErrorCode	ErrorCode
InnerError	InnerError
Phrase	Frase transcrita.
TranscribeResult	Resultado de la operación de transcripción.
Word	Palabra con marca de tiempo en el formulario de presentación.

ChannelCombinedPhrases

Transcripción completa por canal.

Nombre	Tipo	Description
channel	integer	Índice de canal basado en 0. Solo está presente si la separación de canales está habilitada.
text	string	Texto transcrito.

DetailedErrorCode

Nombre	Tipo	Description
AudioLengthLimitExceeded	string	El archivo de audio es mayor que la duración máxima permitida.
BadChannelConfiguration	string	Hay una discrepancia entre los canales de audio de los datos, en la configuración o los requisitos de la aplicación.
DataImportFailed	string	Error en la importación de datos.
DeleteNotAllowed	string	Eliminar no permitido.
DeployNotAllowed	string	No se permite la implementación.
DeployingFailedModel	string	Se ha producido un error en la implementación del modelo.
EmptyAudioFile	string	El archivo de audio está vacío.
EmptyRequest	string	Solicitud vacía.
EndpointCannotBeDefault	string	El punto de conexión no puede ser predeterminado.
EndpointLoggingNotSupported	string	No se admite el registro de puntos de conexión.
EndpointNotUpdatable	string	Punto de conexión no actualizable.
EndpointWithoutLogging	string	Punto de conexión sin registro.
ExceededNumberOfRecordingsUris	string	Se superó el número de uris de grabaciones.
FailedDataset	string	Conjunto de datos con errores.
Forbidden	string	Prohibido.
InUseViolation	string	En infracción de uso.
InaccessibleCustomerStorage	string	Almacenamiento de clientes inaccesible.
InvalidAdaptationMapping	string	Asignación de adaptación no válida.
InvalidAudioFormat	string	No se admite el formato de audio de entrada.
InvalidBaseModel	string	Modelo base no válido.
InvalidCallbackUri	string	URI de devolución de llamada no válido.
InvalidChannelSpecification	string	No se admite la selección de canales en la solicitud de transcripción (por ejemplo, no se han seleccionado 0 ni 1).
InvalidChannels	string	Canales no válidos.
InvalidCollection	string	Colección no válida.
InvalidDataset	string	Conjunto de datos no válido.
InvalidDocument	string	Documento no válido.
InvalidDocumentBatch	string	Lote de documentos no válido.
InvalidLocale	string	Configuración regional no válida.
InvalidLogDate	string	Fecha de registro no válida.
InvalidLogEndTime	string	Hora de finalización del registro no válida.
InvalidLogId	string	Identificador de registro no válido.
InvalidLogStartTime	string	Hora de inicio del registro no válida.
InvalidModel	string	Modelo no válido.
InvalidModelUri	string	URI de modelo no válido.
InvalidParameter	string	Parámetro no válido.
InvalidParameterValue	string	Valor de parámetro no válido.
InvalidPayload	string	Carga no válida.
InvalidPermissions	string	Permisos no válidos.
InvalidPrerequisite	string	Requisito previo no válido.
InvalidProductId	string	Identificador de producto no válido.
InvalidProject	string	Proyecto no válido.
InvalidProjectKind	string	Tipo de proyecto no válido.
InvalidRecordingsUri	string	URI de grabaciones no válidos.
InvalidRequestBodyFormat	string	Formato de cuerpo de la solicitud no válido.
InvalidSasValidityDuration	string	Duración de validez de sas no válida.
InvalidSkipTokenForLogs	string	Token de omisión no válido para los registros.
InvalidSourceAzureResourceId	string	Identificador de recurso de Azure de origen no válido.
InvalidSubscription	string	Suscripción no válida.
InvalidTest	string	Prueba no válida.
InvalidTimeToLive	string	Tiempo de vida no válido.
InvalidTopForLogs	string	Top no válido para los registros.
InvalidTranscription	string	Transcripción no válida.
InvalidWebHookEventKind	string	Tipo de evento web hook no válido.
MissingInputRecords	string	Faltan registros de entrada.
ModelCopyAuthorizationExpired	string	ModelCopyAuthorization expirado.
ModelDeploymentNotCompleteState	string	La implementación del modelo no está completa.
ModelDeprecated	string	Modelo en desuso.
ModelExists	string	El modelo existe.
ModelMismatch	string	Error de coincidencia del modelo.
ModelNotDeployable	string	El modelo no se puede implementar.
ModelVersionIncorrect	string	Versión del modelo incorrecta.
MultipleLanguagesIdentified	string	Identificación del idioma reconocido varios idiomas. No se puede determinar ningún idioma dominante.
NoLanguageIdentified	string	La identificación del idioma no reconoció ningún idioma.
NoUtf8WithBom	string	No hay utf8 con bom.
OnlyOneOfUrlsOrContainerOrDataset	string	Solo una de direcciones URL o contenedor o conjunto de datos.
ProjectGenderMismatch	string	No coinciden los géneros del proyecto.
QuotaViolation	string	Infracción de cuota.
SingleDefaultEndpoint	string	Punto de conexión predeterminado único.
SkuLimitsExist	string	Existen límites de SKU.
SubscriptionNotFound	string	No se encontró la suscripción.
UnexpectedError	string	Error inesperado.
UnsupportedClassBasedAdaptation	string	Adaptación basada en clases no admitidas.
UnsupportedDelta	string	Delta no admitido.
UnsupportedDynamicConfiguration	string	Configuración dinámica no admitida.
UnsupportedFilter	string	Filtro no admitido.
UnsupportedLanguageCode	string	Código de lenguaje no admitido.
UnsupportedOrderBy	string	Orden no admitido por.
UnsupportedPagination	string	Paginación no admitida.
UnsupportedTimeRange	string	Intervalo de tiempo no admitido.

Error

Nombre	Tipo	Description
code	ErrorCode	ErrorCode Códigos de error de alto nivel.
details	Error[]	Detalles de apoyo adicionales relacionados con el error o las directivas esperadas.
innerError	InnerError	InnerError Nuevo formato de error interno que se ajusta a las directrices de Cognitive Services API que están disponibles en https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contiene las propiedades necesarias ErrorCode, message y propiedades opcionales de destino, details(key value pair), inner error(this can be nested).
message	string	Mensaje de error de alto nivel.
target	string	Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en caso de documento no válido.

ErrorCode

Nombre	Tipo	Description
Conflict	string	Representa el código de error en conflicto.
Forbidden	string	Representa el código de error prohibido.
InternalCommunicationFailed	string	Representa el código de error de comunicación interna con error.
InternalServerError	string	Representa el código de error interno del servidor.
InvalidArgument	string	Representa el código de error de argumento no válido.
InvalidRequest	string	Representa el código de error de solicitud no válido.
NotAllowed	string	Representa el código de error no permitido.
NotFound	string	Representa el código de error no encontrado.
PipelineError	string	Representa el código de error de canalización.
ServiceUnavailable	string	Representa el código de error del servicio no disponible.
TooManyRequests	string	Representa el código de error de demasiadas solicitudes.
Unauthorized	string	Representa el código de error no autorizado.
UnprocessableEntity	string	Representa el código de error de entidad no procesado.
UnsupportedMediaType	string	Representa el código de error de tipo de medio no admitido.

InnerError

Nombre	Tipo	Description
code	DetailedErrorCode	DetailedErrorCode Enumeración detallada del código de error.
details	object	Detalles de apoyo adicionales relacionados con el error o las directivas esperadas.
innerError	InnerError	InnerError Nuevo formato de error interno que se ajusta a las directrices de Cognitive Services API que están disponibles en https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contiene las propiedades necesarias ErrorCode, message y propiedades opcionales de destino, details(key value pair), inner error(this can be nested).
message	string	Mensaje de error de alto nivel.
target	string	Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en caso de documento no válido.

Phrase

Frase transcrita.

Nombre	Tipo	Description
channel	integer	Índice de canal basado en 0. Solo está presente si la separación de canales está habilitada.
confidence	number	Valor de confianza de la frase.
durationMilliseconds	integer	Duración de la frase en milisegundos.
locale	string	Configuración regional de la frase.
offsetMilliseconds	integer	Desplazamiento inicial de la frase en milisegundos.
speaker	integer	Número entero único asignado a cada altavoz detectado en el audio sin un orden determinado. Solo está presente si la diarización del hablante está habilitada.
text	string	Texto transcrito de la frase.
words	Word[]	Las palabras que componen la frase. Solo está presente si las marcas de tiempo de nivel de palabra están habilitadas.

TranscribeResult

Resultado de la operación de transcripción.

Nombre	Tipo	Description
combinedPhrases	ChannelCombinedPhrases[]	Transcripción completa de cada canal.
durationMilliseconds	integer	Duración del audio en milisegundos.
phrases	Phrase[]	Los resultados de la transcripción se segmentan en frases.

Word

Palabra con marca de tiempo en el formulario de presentación.

Nombre	Tipo	Description
durationMilliseconds	integer	Duración de la palabra en milisegundos.
offsetMilliseconds	integer	Desplazamiento inicial de la palabra en milisegundos.
text	string	Palabra reconocida, incluida la puntuación.

Compartir a través de