Compartir a través de


Transcriptions - Transcribe

Transcripción sincrónica de un archivo de audio.

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Parámetros de identificador URI

Nombre En Requerido Tipo Description
audio
formData True

file

binary

Contenido del archivo de audio que se va a transcribir. El archivo de audio debe tener menos de 2 horas de duración de audio y un tamaño inferior a 250 MB.

definition
formData

string

Metadatos de una solicitud de transcripción. Este campo contiene un objeto serializado por JSON de tipo TranscribeDefinition.

endpoint
path True

string

Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Versión de api solicitada.

Encabezado de la solicitud

Media Types: "multipart/form-data"

Nombre Requerido Tipo Description
Ocp-Apim-Subscription-Key True

string

Proporcione aquí la clave de la cuenta de Cognitive Services.

Respuestas

Nombre Tipo Description
200 OK

TranscribeResult

De acuerdo

Other Status Codes

Error

Error.

Seguridad

Ocp-Apim-Subscription-Key

Proporcione aquí la clave de la cuenta de Cognitive Services.

Tipo: apiKey
En: header

Ejemplos

Transcribe an audio file

Solicitud de ejemplo

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Respuesta de muestra

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

Definiciones

Nombre Description
ChannelCombinedPhrases

Transcripción completa por canal.

DetailedErrorCode

DetailedErrorCode

Error

Error

ErrorCode

ErrorCode

InnerError

InnerError

Phrase

Frase transcrita.

TranscribeResult

Resultado de la operación de transcripción.

Word

Palabra con marca de tiempo en el formulario de presentación.

ChannelCombinedPhrases

Transcripción completa por canal.

Nombre Tipo Description
channel

integer

Índice de canal basado en 0. Solo está presente si la separación de canales está habilitada.

text

string

Texto transcrito.

DetailedErrorCode

DetailedErrorCode

Nombre Tipo Description
AudioLengthLimitExceeded

string

El archivo de audio es mayor que la duración máxima permitida.

BadChannelConfiguration

string

Hay una discrepancia entre los canales de audio de los datos, en la configuración o los requisitos de la aplicación.

DataImportFailed

string

Error en la importación de datos.

DeleteNotAllowed

string

Eliminar no permitido.

DeployNotAllowed

string

No se permite la implementación.

DeployingFailedModel

string

Se ha producido un error en la implementación del modelo.

EmptyAudioFile

string

El archivo de audio está vacío.

EmptyRequest

string

Solicitud vacía.

EndpointCannotBeDefault

string

El punto de conexión no puede ser predeterminado.

EndpointLoggingNotSupported

string

No se admite el registro de puntos de conexión.

EndpointNotUpdatable

string

Punto de conexión no actualizable.

EndpointWithoutLogging

string

Punto de conexión sin registro.

ExceededNumberOfRecordingsUris

string

Se superó el número de uris de grabaciones.

FailedDataset

string

Conjunto de datos con errores.

Forbidden

string

Prohibido.

InUseViolation

string

En infracción de uso.

InaccessibleCustomerStorage

string

Almacenamiento de clientes inaccesible.

InvalidAdaptationMapping

string

Asignación de adaptación no válida.

InvalidAudioFormat

string

No se admite el formato de audio de entrada.

InvalidBaseModel

string

Modelo base no válido.

InvalidCallbackUri

string

URI de devolución de llamada no válido.

InvalidChannelSpecification

string

No se admite la selección de canales en la solicitud de transcripción (por ejemplo, no se han seleccionado 0 ni 1).

InvalidChannels

string

Canales no válidos.

InvalidCollection

string

Colección no válida.

InvalidDataset

string

Conjunto de datos no válido.

InvalidDocument

string

Documento no válido.

InvalidDocumentBatch

string

Lote de documentos no válido.

InvalidLocale

string

Configuración regional no válida.

InvalidLogDate

string

Fecha de registro no válida.

InvalidLogEndTime

string

Hora de finalización del registro no válida.

InvalidLogId

string

Identificador de registro no válido.

InvalidLogStartTime

string

Hora de inicio del registro no válida.

InvalidModel

string

Modelo no válido.

InvalidModelUri

string

URI de modelo no válido.

InvalidParameter

string

Parámetro no válido.

InvalidParameterValue

string

Valor de parámetro no válido.

InvalidPayload

string

Carga no válida.

InvalidPermissions

string

Permisos no válidos.

InvalidPrerequisite

string

Requisito previo no válido.

InvalidProductId

string

Identificador de producto no válido.

InvalidProject

string

Proyecto no válido.

InvalidProjectKind

string

Tipo de proyecto no válido.

InvalidRecordingsUri

string

URI de grabaciones no válidos.

InvalidRequestBodyFormat

string

Formato de cuerpo de la solicitud no válido.

InvalidSasValidityDuration

string

Duración de validez de sas no válida.

InvalidSkipTokenForLogs

string

Token de omisión no válido para los registros.

InvalidSourceAzureResourceId

string

Identificador de recurso de Azure de origen no válido.

InvalidSubscription

string

Suscripción no válida.

InvalidTest

string

Prueba no válida.

InvalidTimeToLive

string

Tiempo de vida no válido.

InvalidTopForLogs

string

Top no válido para los registros.

InvalidTranscription

string

Transcripción no válida.

InvalidWebHookEventKind

string

Tipo de evento web hook no válido.

MissingInputRecords

string

Faltan registros de entrada.

ModelCopyAuthorizationExpired

string

ModelCopyAuthorization expirado.

ModelDeploymentNotCompleteState

string

La implementación del modelo no está completa.

ModelDeprecated

string

Modelo en desuso.

ModelExists

string

El modelo existe.

ModelMismatch

string

Error de coincidencia del modelo.

ModelNotDeployable

string

El modelo no se puede implementar.

ModelVersionIncorrect

string

Versión del modelo incorrecta.

MultipleLanguagesIdentified

string

Identificación del idioma reconocido varios idiomas. No se puede determinar ningún idioma dominante.

NoLanguageIdentified

string

La identificación del idioma no reconoció ningún idioma.

NoUtf8WithBom

string

No hay utf8 con bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Solo una de direcciones URL o contenedor o conjunto de datos.

ProjectGenderMismatch

string

No coinciden los géneros del proyecto.

QuotaViolation

string

Infracción de cuota.

SingleDefaultEndpoint

string

Punto de conexión predeterminado único.

SkuLimitsExist

string

Existen límites de SKU.

SubscriptionNotFound

string

No se encontró la suscripción.

UnexpectedError

string

Error inesperado.

UnsupportedClassBasedAdaptation

string

Adaptación basada en clases no admitidas.

UnsupportedDelta

string

Delta no admitido.

UnsupportedDynamicConfiguration

string

Configuración dinámica no admitida.

UnsupportedFilter

string

Filtro no admitido.

UnsupportedLanguageCode

string

Código de lenguaje no admitido.

UnsupportedOrderBy

string

Orden no admitido por.

UnsupportedPagination

string

Paginación no admitida.

UnsupportedTimeRange

string

Intervalo de tiempo no admitido.

Error

Error

Nombre Tipo Description
code

ErrorCode

ErrorCode
Códigos de error de alto nivel.

details

Error[]

Detalles de apoyo adicionales relacionados con el error o las directivas esperadas.

innerError

InnerError

InnerError
Nuevo formato de error interno que se ajusta a las directrices de Cognitive Services API que están disponibles en https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contiene las propiedades necesarias ErrorCode, message y propiedades opcionales de destino, details(key value pair), inner error(this can be nested).

message

string

Mensaje de error de alto nivel.

target

string

Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en caso de documento no válido.

ErrorCode

ErrorCode

Nombre Tipo Description
Conflict

string

Representa el código de error en conflicto.

Forbidden

string

Representa el código de error prohibido.

InternalCommunicationFailed

string

Representa el código de error de comunicación interna con error.

InternalServerError

string

Representa el código de error interno del servidor.

InvalidArgument

string

Representa el código de error de argumento no válido.

InvalidRequest

string

Representa el código de error de solicitud no válido.

NotAllowed

string

Representa el código de error no permitido.

NotFound

string

Representa el código de error no encontrado.

PipelineError

string

Representa el código de error de canalización.

ServiceUnavailable

string

Representa el código de error del servicio no disponible.

TooManyRequests

string

Representa el código de error de demasiadas solicitudes.

Unauthorized

string

Representa el código de error no autorizado.

UnprocessableEntity

string

Representa el código de error de entidad no procesado.

UnsupportedMediaType

string

Representa el código de error de tipo de medio no admitido.

InnerError

InnerError

Nombre Tipo Description
code

DetailedErrorCode

DetailedErrorCode
Enumeración detallada del código de error.

details

object

Detalles de apoyo adicionales relacionados con el error o las directivas esperadas.

innerError

InnerError

InnerError
Nuevo formato de error interno que se ajusta a las directrices de Cognitive Services API que están disponibles en https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Contiene las propiedades necesarias ErrorCode, message y propiedades opcionales de destino, details(key value pair), inner error(this can be nested).

message

string

Mensaje de error de alto nivel.

target

string

Origen del error. Por ejemplo, sería "documentos" o "id. de documento" en caso de documento no válido.

Phrase

Frase transcrita.

Nombre Tipo Description
channel

integer

Índice de canal basado en 0. Solo está presente si la separación de canales está habilitada.

confidence

number

Valor de confianza de la frase.

durationMilliseconds

integer

Duración de la frase en milisegundos.

locale

string

Configuración regional de la frase.

offsetMilliseconds

integer

Desplazamiento inicial de la frase en milisegundos.

speaker

integer

Número entero único asignado a cada altavoz detectado en el audio sin un orden determinado. Solo está presente si la diarización del hablante está habilitada.

text

string

Texto transcrito de la frase.

words

Word[]

Las palabras que componen la frase. Solo está presente si las marcas de tiempo de nivel de palabra están habilitadas.

TranscribeResult

Resultado de la operación de transcripción.

Nombre Tipo Description
combinedPhrases

ChannelCombinedPhrases[]

Transcripción completa de cada canal.

durationMilliseconds

integer

Duración del audio en milisegundos.

phrases

Phrase[]

Los resultados de la transcripción se segmentan en frases.

Word

Palabra con marca de tiempo en el formulario de presentación.

Nombre Tipo Description
durationMilliseconds

integer

Duración de la palabra en milisegundos.

offsetMilliseconds

integer

Desplazamiento inicial de la palabra en milisegundos.

text

string

Palabra reconocida, incluida la puntuación.