Partilhar via


Transcriptions - Transcribe

Transcrição síncrona de um arquivo de áudio.

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Parâmetros do URI

Name Em Necessário Tipo Description
audio
formData True

file

binary

O conteúdo do arquivo de áudio a ser transcrito. O arquivo de áudio deve ter menos de 2 horas de duração de áudio e menos de 250 MB de tamanho.

definition
formData

string

Metadados para um pedido de transcrição. Este campo contém um objeto serializado por JSON do tipo TranscribeDefinition.

endpoint
path True

string

Pontos de extremidade de Serviços Cognitivos suportados (protocolo e nome do host, por exemplo: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

A versão da api solicitada.

Cabeçalho do Pedido

Media Types: "multipart/form-data"

Name Necessário Tipo Description
Ocp-Apim-Subscription-Key True

string

Forneça a chave da sua conta de serviços cognitivos aqui.

Respostas

Name Tipo Description
200 OK

TranscribeResult

OK

Other Status Codes

Error

Ocorreu um erro.

Segurança

Ocp-Apim-Subscription-Key

Forneça a chave da sua conta de serviços cognitivos aqui.

Tipo: apiKey
Em: header

Exemplos

Transcribe an audio file

Pedido de amostra

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Resposta da amostra

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

Definições

Name Description
ChannelCombinedPhrases

A transcrição completa por canal.

DetailedErrorCode

DetailedErrorCode

Error

Erro

ErrorCode

Código de erro

InnerError

InnerError

Phrase

Uma frase transcrita.

TranscribeResult

O resultado da operação de transcrição.

Word

Palavra com carimbo de data/hora no formulário de exibição.

ChannelCombinedPhrases

A transcrição completa por canal.

Name Tipo Description
channel

integer

O índice de canal baseado em 0. Presente apenas se a separação de canais estiver ativada.

text

string

O texto transcrito.

DetailedErrorCode

DetailedErrorCode

Name Tipo Description
AudioLengthLimitExceeded

string

O arquivo de áudio é maior do que a duração máxima permitida.

BadChannelConfiguration

string

Há uma incompatibilidade entre os canais de áudio nos dados, na configuração ou nos requisitos do aplicativo.

DataImportFailed

string

Falha na importação de dados.

DeleteNotAllowed

string

Excluir não permitido.

DeployNotAllowed

string

Implantação não permitida.

DeployingFailedModel

string

Implantação de modelo com falha.

EmptyAudioFile

string

O arquivo de áudio está vazio.

EmptyRequest

string

Pedido vazio.

EndpointCannotBeDefault

string

O ponto de extremidade não pode ser padrão.

EndpointLoggingNotSupported

string

Não há suporte para registro de ponto final.

EndpointNotUpdatable

string

Ponto final não atualizável.

EndpointWithoutLogging

string

Ponto de extremidade sem registro.

ExceededNumberOfRecordingsUris

string

Excedeu o número de gravações uris.

FailedDataset

string

Conjunto de dados com falha.

Forbidden

string

Proibido.

InUseViolation

string

Violação em uso.

InaccessibleCustomerStorage

string

Armazenamento inacessível do cliente.

InvalidAdaptationMapping

string

Mapeamento de adaptação inválido.

InvalidAudioFormat

string

O formato de entrada de áudio não é suportado.

InvalidBaseModel

string

Modelo base inválido.

InvalidCallbackUri

string

Uri de retorno de chamada inválido.

InvalidChannelSpecification

string

A seleção de canais na solicitação de transcrição não é suportada (por exemplo, nem 0 nem 1 foram selecionados).

InvalidChannels

string

Canais inválidos.

InvalidCollection

string

Coleção inválida.

InvalidDataset

string

Conjunto de dados inválido.

InvalidDocument

string

Documento inválido.

InvalidDocumentBatch

string

Lote de documentos inválido.

InvalidLocale

string

Localidade inválida.

InvalidLogDate

string

Data de registo inválida.

InvalidLogEndTime

string

Hora de fim de log inválida.

InvalidLogId

string

ID de log inválido.

InvalidLogStartTime

string

Hora de início de log inválida.

InvalidModel

string

Modelo inválido.

InvalidModelUri

string

Uri de modelo inválido.

InvalidParameter

string

Parâmetro inválido.

InvalidParameterValue

string

Valor de parâmetro inválido.

InvalidPayload

string

Carga útil inválida.

InvalidPermissions

string

Permissões inválidas.

InvalidPrerequisite

string

Pré-requisito inválido.

InvalidProductId

string

ID do produto inválida.

InvalidProject

string

Projeto inválido.

InvalidProjectKind

string

Tipo de projeto inválido.

InvalidRecordingsUri

string

Gravações inválidas uri.

InvalidRequestBodyFormat

string

Formato de corpo de solicitação inválido.

InvalidSasValidityDuration

string

Duração de validade sas inválida.

InvalidSkipTokenForLogs

string

Token de pulo inválido para logs.

InvalidSourceAzureResourceId

string

ID de recurso do Azure de origem inválida.

InvalidSubscription

string

Subscrição inválida.

InvalidTest

string

Teste inválido.

InvalidTimeToLive

string

Tempo de vida inválido.

InvalidTopForLogs

string

Parte superior inválida para logs.

InvalidTranscription

string

Transcrição inválida.

InvalidWebHookEventKind

string

Tipo de evento de gancho da Web inválido.

MissingInputRecords

string

Registros de entrada ausentes.

ModelCopyAuthorizationExpired

string

ModelCopyAuthorization expirado.

ModelDeploymentNotCompleteState

string

Implantação do modelo não concluída estado.

ModelDeprecated

string

Modelo preterido.

ModelExists

string

Modelo existe.

ModelMismatch

string

Incompatibilidade de modelos.

ModelNotDeployable

string

Modelo não implantável.

ModelVersionIncorrect

string

Versão do modelo incorreta.

MultipleLanguagesIdentified

string

A Identificação Linguística reconheceu vários idiomas. Nenhuma língua dominante pôde ser determinada.

NoLanguageIdentified

string

A Identificação Linguística não reconhecia nenhuma língua.

NoUtf8WithBom

string

Não utf8 com bom.

OnlyOneOfUrlsOrContainerOrDataset

string

Apenas um dos urls ou contêiner ou conjunto de dados.

ProjectGenderMismatch

string

Desfasamento entre homens e mulheres no projeto.

QuotaViolation

string

Violação de quotas.

SingleDefaultEndpoint

string

Ponto de extremidade padrão único.

SkuLimitsExist

string

Existem limites de Sku.

SubscriptionNotFound

string

Subscrição não encontrada.

UnexpectedError

string

Erro inesperado.

UnsupportedClassBasedAdaptation

string

Adaptação baseada em classe sem suporte.

UnsupportedDelta

string

Delta não suportado.

UnsupportedDynamicConfiguration

string

Configuração dinâmica não suportada.

UnsupportedFilter

string

Filtro não suportado.

UnsupportedLanguageCode

string

Código de idioma não suportado.

UnsupportedOrderBy

string

Ordem não suportada por.

UnsupportedPagination

string

Paginação não suportada.

UnsupportedTimeRange

string

Intervalo de tempo não suportado.

Error

Erro

Name Tipo Description
code

ErrorCode

Código de erro
Códigos de erro de alto nível.

details

Error[]

Detalhes adicionais de suporte sobre o erro e/ou políticas esperadas.

innerError

InnerError

InnerError
Novo formato de Erro Interno que está em conformidade com as Diretrizes da API de Serviços Cognitivos que está disponível em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Isso contém as propriedades necessárias ErrorCode, mensagem e destino de propriedades opcionais, detalhes (par de valores de chave), erro interno (isso pode ser aninhado).

message

string

Mensagem de erro de alto nível.

target

string

A origem do erro. Por exemplo, seria "documentos" ou "id do documento" no caso de documento inválido.

ErrorCode

Código de erro

Name Tipo Description
Conflict

string

Representando o código de erro de conflito.

Forbidden

string

Representando o código de erro proibido.

InternalCommunicationFailed

string

Representando o código de erro de falha de comunicação interna.

InternalServerError

string

Representando o código de erro interno do servidor.

InvalidArgument

string

Representando o código de erro de argumento inválido.

InvalidRequest

string

Representando o código de erro de solicitação inválida.

NotAllowed

string

Representando o código de erro não permitido.

NotFound

string

Representando o código de erro não encontrado.

PipelineError

string

Representando o código de erro do pipeline.

ServiceUnavailable

string

Representando o código de erro indisponível do serviço.

TooManyRequests

string

Representando o código de erro de muitas solicitações.

Unauthorized

string

Representando o código de erro não autorizado.

UnprocessableEntity

string

Representando o código de erro de entidade não processável.

UnsupportedMediaType

string

Representando o código de erro de tipo de mídia não suportado.

InnerError

InnerError

Name Tipo Description
code

DetailedErrorCode

DetailedErrorCode
Código de erro detalhado enum.

details

object

Detalhes adicionais de suporte sobre o erro e/ou políticas esperadas.

innerError

InnerError

InnerError
Novo formato de Erro Interno que está em conformidade com as Diretrizes da API de Serviços Cognitivos que está disponível em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Isso contém as propriedades necessárias ErrorCode, mensagem e destino de propriedades opcionais, detalhes (par de valores de chave), erro interno (isso pode ser aninhado).

message

string

Mensagem de erro de alto nível.

target

string

A origem do erro. Por exemplo, seria "documentos" ou "id do documento" no caso de documento inválido.

Phrase

Uma frase transcrita.

Name Tipo Description
channel

integer

O índice de canal baseado em 0. Presente apenas se a separação de canais estiver ativada.

confidence

number

O valor de confiança para a frase.

durationMilliseconds

integer

A duração da frase em milissegundos.

locale

string

A localidade da frase.

offsetMilliseconds

integer

O deslocamento inicial da frase em milissegundos.

speaker

integer

Um número inteiro exclusivo que é atribuído a cada alto-falante detetado no áudio sem ordem específica. Presente apenas se a diarização do alto-falante estiver ativada.

text

string

O texto transcrito da frase.

words

Word[]

As palavras que compõem a frase. Presente somente se os carimbos de data/hora no nível da palavra estiverem habilitados.

TranscribeResult

O resultado da operação de transcrição.

Name Tipo Description
combinedPhrases

ChannelCombinedPhrases[]

A transcrição completa para cada canal.

durationMilliseconds

integer

A duração do áudio em milissegundos.

phrases

Phrase[]

Os resultados da transcrição segmentados em frases.

Word

Palavra com carimbo de data/hora no formulário de exibição.

Name Tipo Description
durationMilliseconds

integer

A duração da palavra em milissegundos.

offsetMilliseconds

integer

O deslocamento inicial da palavra em milissegundos.

text

string

A palavra reconhecida, incluindo pontuação.