Compartilhar via


Transcriptions - Transcribe

Transcrição síncrona de um arquivo de áudio.

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Parâmetros de URI

Nome Em Obrigatório Tipo Description
audio
formData True

file (binary)

O conteúdo do arquivo de áudio a ser transcrito. O arquivo de áudio deve ter menos de 2 horas de duração de áudio e menor que 250 MB de tamanho.

definition
formData

string

Metadados para uma solicitação de transcrição. Este campo contém um objeto serializado em JSON do tipo TranscribeDefinition.

endpoint
path True

string

Pontos de extremidade dos Serviços Cognitivos com suporte (protocolo e nome do host, por exemplo: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

A versão da API solicitada.

Cabeçalho da solicitação

Media Types: "multipart/form-data"

Nome Obrigatório Tipo Description
Ocp-Apim-Subscription-Key True

string

Forneça a chave da conta de serviços cognitivos aqui.

Respostas

Nome Tipo Description
200 OK

TranscribeResult

OKEY

Other Status Codes

Error

Ocorreu um erro.

Segurança

Ocp-Apim-Subscription-Key

Forneça a chave da conta de serviços cognitivos aqui.

Tipo: apiKey
Em: header

Exemplos

Transcribe an audio file

Solicitação de exemplo

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Resposta de exemplo

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

Definições

Nome Description
ChannelCombinedPhrases

A transcrição completa por canal.

DetailedErrorCode

DetailedErrorCode

Error

Erro

ErrorCode

ErrorCode

InnerError

InnerError

Phrase

Uma frase transcrita.

TranscribeResult

O resultado da operação de transcrever.

Word

Palavra com carimbo de data/hora no formulário de exibição.

ChannelCombinedPhrases

A transcrição completa por canal.

Nome Tipo Description
channel

integer (int32)

O índice de canal baseado em 0. Só estará presente se a separação de canal estiver habilitada.

text

string

O texto transcrito.

DetailedErrorCode

DetailedErrorCode

Valor Description
AudioLengthLimitExceeded

O arquivo de áudio é maior que a duração máxima permitida.

BadChannelConfiguration

Há uma incompatibilidade entre canais de áudio nos dados, na configuração ou nos requisitos do aplicativo.

DataImportFailed

Falha na importação de dados.

DeleteNotAllowed

Exclusão não permitida.

DeployNotAllowed

Implantação não permitida.

DeployingFailedModel

Implantação de modelo com falha.

EmptyAudioFile

O arquivo de áudio está vazio.

EmptyRequest

Solicitação vazia.

EndpointCannotBeDefault

O ponto de extremidade não pode ser padrão.

EndpointLoggingNotSupported

Não há suporte para o registro em log do ponto de extremidade.

EndpointNotUpdatable

Ponto de extremidade não atualizável.

EndpointWithoutLogging

Ponto de extremidade sem registro em log.

ExceededNumberOfRecordingsUris

Número excedido de uris de gravações.

FailedDataset

Conjunto de dados com falha.

Forbidden

Proibido.

InUseViolation

Em violação de uso.

InaccessibleCustomerStorage

Armazenamento de clientes inacessível.

InvalidAdaptationMapping

Mapeamento de adaptação inválido.

InvalidAudioFormat

Não há suporte para o formato de áudio de entrada.

InvalidBaseModel

Modelo base inválido.

InvalidCallbackUri

URI de retorno de chamada inválido.

InvalidChannelSpecification

Não há suporte para a seleção de canais na solicitação de transcrição (por exemplo, nem 0 nem 1 foram selecionados).)

InvalidChannels

Canais inválidos.

InvalidCollection

Coleção inválida.

InvalidDataset

Conjunto de dados inválido.

InvalidDocument

Documento inválido.

InvalidDocumentBatch

Lote de Documentos Inválido.

InvalidLocale

Localidade inválida.

InvalidLogDate

Data de log inválida.

InvalidLogEndTime

Hora de término do log inválida.

InvalidLogId

ID de log inválida.

InvalidLogStartTime

Hora de início do log inválida.

InvalidModel

Modelo inválido.

InvalidModelUri

URI de modelo inválido.

InvalidParameter

Parâmetro inválido.

InvalidParameterValue

Valor de parâmetro inválido.

InvalidPayload

Conteúdo inválido.

InvalidPermissions

Permissões inválidas.

InvalidPrerequisite

Pré-requisito inválido.

InvalidProductId

ID do produto inválido.

InvalidProject

Projeto inválido.

InvalidProjectKind

Tipo de projeto inválido.

InvalidRecordingsUri

URI de gravações inválido.

InvalidRequestBodyFormat

Formato do corpo da solicitação inválido.

InvalidSasValidityDuration

Duração de validade sas inválida.

InvalidSkipTokenForLogs

Token de ignorar inválido para logs.

InvalidSourceAzureResourceId

ID de recurso do Azure de origem inválida.

InvalidSubscription

Assinatura inválida.

InvalidTest

Teste inválido.

InvalidTimeToLive

Tempo de vida inválido.

InvalidTopForLogs

Parte superior inválida para logs.

InvalidTranscription

Transcrição inválida.

InvalidWebHookEventKind

Tipo de evento de gancho da Web inválido.

MissingInputRecords

Registros de entrada ausentes.

ModelCopyAuthorizationExpired

ModelCopyAuthorization expirado.

ModelDeploymentNotCompleteState

Implantação de modelo não completa o estado.

ModelDeprecated

Modelo preterido.

ModelExists

O modelo existe.

ModelMismatch

Incompatibilidade de modelo.

ModelNotDeployable

Modelo não implantável.

ModelVersionIncorrect

Versão do modelo incorreta.

MultipleLanguagesIdentified

Identificação de Idiomas reconheceu vários idiomas. Nenhuma linguagem dominante poderia ser determinada.

NoLanguageIdentified

A Identificação de Idiomas não reconheceu nenhum idioma.

NoUtf8WithBom

Não utf8 com bom.

OnlyOneOfUrlsOrContainerOrDataset

Apenas uma das URLs, contêiner ou conjunto de dados.

ProjectGenderMismatch

Incompatibilidade de gênero do projeto.

QuotaViolation

Violação de cota.

SingleDefaultEndpoint

Ponto de extremidade padrão único.

SkuLimitsExist

Existem limites de SKU.

SubscriptionNotFound

Assinatura não encontrada.

UnexpectedError

Erro inesperado.

UnsupportedClassBasedAdaptation

Adaptação baseada em classe sem suporte.

UnsupportedDelta

Delta sem suporte.

UnsupportedDynamicConfiguration

Configuração dinâmica sem suporte.

UnsupportedFilter

Filtro sem suporte.

UnsupportedLanguageCode

Código de idioma sem suporte.

UnsupportedOrderBy

Ordem sem suporte por.

UnsupportedPagination

Paginação sem suporte.

UnsupportedTimeRange

Intervalo de tempo sem suporte.

Error

Erro

Nome Tipo Description
code

ErrorCode

ErrorCode
Códigos de erro de alto nível.

details

Error[]

Detalhes adicionais de suporte sobre o erro e/ou as políticas esperadas.

innerError

InnerError

InnerError
Novo formato de Erro Interno que está em conformidade com as Diretrizes de API dos Serviços Cognitivos que está disponível em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Isso contém as propriedades necessárias ErrorCode, destino de mensagens e propriedades opcionais, detalhes (par de valor de chave), erro interno(isso pode ser aninhado).

message

string

Mensagem de erro de alto nível.

target

string

A origem do erro. Por exemplo, seriam "documentos" ou "id de documento" em caso de documento inválido.

ErrorCode

ErrorCode

Valor Description
Conflict

Representando o código de erro de conflito.

Forbidden

Representando o código de erro proibido.

InternalCommunicationFailed

Representando o código de erro de falha de comunicação interna.

InternalServerError

Representando o código de erro interno do servidor.

InvalidArgument

Representando o código de erro de argumento inválido.

InvalidRequest

Representando o código de erro de solicitação inválido.

NotAllowed

Representando o código de erro não permitido.

NotFound

Representando o código de erro não encontrado.

PipelineError

Representando o código de erro do pipeline.

ServiceUnavailable

Representando o código de erro indisponível do serviço.

TooManyRequests

Representando o código de erro de muitas solicitações.

Unauthorized

Representando o código de erro não autorizado.

UnprocessableEntity

Representando o código de erro de entidade não processável.

UnsupportedMediaType

Representando o código de erro de tipo de mídia sem suporte.

InnerError

InnerError

Nome Tipo Description
code

DetailedErrorCode

DetailedErrorCode
Enumeração detalhada do código de erro.

details

object

Detalhes adicionais de suporte sobre o erro e/ou as políticas esperadas.

innerError

InnerError

InnerError
Novo formato de Erro Interno que está em conformidade com as Diretrizes de API dos Serviços Cognitivos que está disponível em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Isso contém as propriedades necessárias ErrorCode, destino de mensagens e propriedades opcionais, detalhes (par de valor de chave), erro interno(isso pode ser aninhado).

message

string

Mensagem de erro de alto nível.

target

string

A origem do erro. Por exemplo, seriam "documentos" ou "id de documento" em caso de documento inválido.

Phrase

Uma frase transcrita.

Nome Tipo Description
channel

integer (int32)

O índice de canal baseado em 0. Só estará presente se a separação de canal estiver habilitada.

confidence

number (float)

O valor de confiança da frase.

durationMilliseconds

integer (int32)

A duração da frase em milissegundos.

locale

string

A localidade da frase.

offsetMilliseconds

integer (int32)

O deslocamento inicial da frase em milissegundos.

speaker

integer (int32)

Um número inteiro exclusivo atribuído a cada alto-falante detectado no áudio sem uma ordem específica. Só estará presente se a diarização do locutor estiver habilitada.

text

string

O texto transcrito da frase.

words

Word[]

As palavras que compõem a frase. Só estará presente se os carimbos de data/hora de nível de palavra estiverem habilitados.

TranscribeResult

O resultado da operação de transcrever.

Nome Tipo Description
combinedPhrases

ChannelCombinedPhrases[]

A transcrição completa de cada canal.

durationMilliseconds

integer (int32)

A duração do áudio em milissegundos.

phrases

Phrase[]

Os resultados da transcrição segmentados em frases.

Word

Palavra com carimbo de data/hora no formulário de exibição.

Nome Tipo Description
durationMilliseconds

integer (int32)

A duração da palavra em milissegundos.

offsetMilliseconds

integer (int32)

O deslocamento inicial da palavra em milissegundos.

text

string

A palavra reconhecida, incluindo pontuação.