Transcriptions - Transcribe

Referência

Serviço:: Azure AI Services

Versão da API:: 2024-11-15

Transcrição síncrona de um arquivo de áudio.

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Parâmetros do URI

Name	Em	Necessário	Tipo	Description
audio	formData	True	file binary	O conteúdo do arquivo de áudio a ser transcrito. O arquivo de áudio deve ter menos de 2 horas de duração de áudio e menos de 250 MB de tamanho.
definition	formData		string	Metadados para um pedido de transcrição. Este campo contém um objeto serializado por JSON do tipo `TranscribeDefinition`.
endpoint	path	True	string	Pontos de extremidade de Serviços Cognitivos suportados (protocolo e nome do host, por exemplo: https://westus.api.cognitive.microsoft.com).
api-version	query	True	string	A versão da api solicitada.

Cabeçalho do Pedido

Media Types: "multipart/form-data"

Name	Necessário	Tipo	Description
Ocp-Apim-Subscription-Key	True	string	Forneça a chave da sua conta de serviços cognitivos aqui.

Respostas

Name	Tipo	Description
200 OK	TranscribeResult	OK
Other Status Codes	Error	Ocorreu um erro.

Segurança

Ocp-Apim-Subscription-Key

Forneça a chave da sua conta de serviços cognitivos aqui.

Tipo: apiKey
Em: header

Exemplos

Transcribe an audio file

Pedido de amostra

HTTP

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

Resposta da amostra

Código de estado:: 200

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

Definições

Name	Description
ChannelCombinedPhrases	A transcrição completa por canal.
DetailedErrorCode	DetailedErrorCode
Error	Erro
ErrorCode	Código de erro
InnerError	InnerError
Phrase	Uma frase transcrita.
TranscribeResult	O resultado da operação de transcrição.
Word	Palavra com carimbo de data/hora no formulário de exibição.

ChannelCombinedPhrases

A transcrição completa por canal.

Name	Tipo	Description
channel	integer	O índice de canal baseado em 0. Presente apenas se a separação de canais estiver ativada.
text	string	O texto transcrito.

DetailedErrorCode

Name	Tipo	Description
AudioLengthLimitExceeded	string	O arquivo de áudio é maior do que a duração máxima permitida.
BadChannelConfiguration	string	Há uma incompatibilidade entre os canais de áudio nos dados, na configuração ou nos requisitos do aplicativo.
DataImportFailed	string	Falha na importação de dados.
DeleteNotAllowed	string	Excluir não permitido.
DeployNotAllowed	string	Implantação não permitida.
DeployingFailedModel	string	Implantação de modelo com falha.
EmptyAudioFile	string	O arquivo de áudio está vazio.
EmptyRequest	string	Pedido vazio.
EndpointCannotBeDefault	string	O ponto de extremidade não pode ser padrão.
EndpointLoggingNotSupported	string	Não há suporte para registro de ponto final.
EndpointNotUpdatable	string	Ponto final não atualizável.
EndpointWithoutLogging	string	Ponto de extremidade sem registro.
ExceededNumberOfRecordingsUris	string	Excedeu o número de gravações uris.
FailedDataset	string	Conjunto de dados com falha.
Forbidden	string	Proibido.
InUseViolation	string	Violação em uso.
InaccessibleCustomerStorage	string	Armazenamento inacessível do cliente.
InvalidAdaptationMapping	string	Mapeamento de adaptação inválido.
InvalidAudioFormat	string	O formato de entrada de áudio não é suportado.
InvalidBaseModel	string	Modelo base inválido.
InvalidCallbackUri	string	Uri de retorno de chamada inválido.
InvalidChannelSpecification	string	A seleção de canais na solicitação de transcrição não é suportada (por exemplo, nem 0 nem 1 foram selecionados).
InvalidChannels	string	Canais inválidos.
InvalidCollection	string	Coleção inválida.
InvalidDataset	string	Conjunto de dados inválido.
InvalidDocument	string	Documento inválido.
InvalidDocumentBatch	string	Lote de documentos inválido.
InvalidLocale	string	Localidade inválida.
InvalidLogDate	string	Data de registo inválida.
InvalidLogEndTime	string	Hora de fim de log inválida.
InvalidLogId	string	ID de log inválido.
InvalidLogStartTime	string	Hora de início de log inválida.
InvalidModel	string	Modelo inválido.
InvalidModelUri	string	Uri de modelo inválido.
InvalidParameter	string	Parâmetro inválido.
InvalidParameterValue	string	Valor de parâmetro inválido.
InvalidPayload	string	Carga útil inválida.
InvalidPermissions	string	Permissões inválidas.
InvalidPrerequisite	string	Pré-requisito inválido.
InvalidProductId	string	ID do produto inválida.
InvalidProject	string	Projeto inválido.
InvalidProjectKind	string	Tipo de projeto inválido.
InvalidRecordingsUri	string	Gravações inválidas uri.
InvalidRequestBodyFormat	string	Formato de corpo de solicitação inválido.
InvalidSasValidityDuration	string	Duração de validade sas inválida.
InvalidSkipTokenForLogs	string	Token de pulo inválido para logs.
InvalidSourceAzureResourceId	string	ID de recurso do Azure de origem inválida.
InvalidSubscription	string	Subscrição inválida.
InvalidTest	string	Teste inválido.
InvalidTimeToLive	string	Tempo de vida inválido.
InvalidTopForLogs	string	Parte superior inválida para logs.
InvalidTranscription	string	Transcrição inválida.
InvalidWebHookEventKind	string	Tipo de evento de gancho da Web inválido.
MissingInputRecords	string	Registros de entrada ausentes.
ModelCopyAuthorizationExpired	string	ModelCopyAuthorization expirado.
ModelDeploymentNotCompleteState	string	Implantação do modelo não concluída estado.
ModelDeprecated	string	Modelo preterido.
ModelExists	string	Modelo existe.
ModelMismatch	string	Incompatibilidade de modelos.
ModelNotDeployable	string	Modelo não implantável.
ModelVersionIncorrect	string	Versão do modelo incorreta.
MultipleLanguagesIdentified	string	A Identificação Linguística reconheceu vários idiomas. Nenhuma língua dominante pôde ser determinada.
NoLanguageIdentified	string	A Identificação Linguística não reconhecia nenhuma língua.
NoUtf8WithBom	string	Não utf8 com bom.
OnlyOneOfUrlsOrContainerOrDataset	string	Apenas um dos urls ou contêiner ou conjunto de dados.
ProjectGenderMismatch	string	Desfasamento entre homens e mulheres no projeto.
QuotaViolation	string	Violação de quotas.
SingleDefaultEndpoint	string	Ponto de extremidade padrão único.
SkuLimitsExist	string	Existem limites de Sku.
SubscriptionNotFound	string	Subscrição não encontrada.
UnexpectedError	string	Erro inesperado.
UnsupportedClassBasedAdaptation	string	Adaptação baseada em classe sem suporte.
UnsupportedDelta	string	Delta não suportado.
UnsupportedDynamicConfiguration	string	Configuração dinâmica não suportada.
UnsupportedFilter	string	Filtro não suportado.
UnsupportedLanguageCode	string	Código de idioma não suportado.
UnsupportedOrderBy	string	Ordem não suportada por.
UnsupportedPagination	string	Paginação não suportada.
UnsupportedTimeRange	string	Intervalo de tempo não suportado.

Error

Erro

Name	Tipo	Description
code	ErrorCode	Código de erro Códigos de erro de alto nível.
details	Error[]	Detalhes adicionais de suporte sobre o erro e/ou políticas esperadas.
innerError	InnerError	InnerError Novo formato de Erro Interno que está em conformidade com as Diretrizes da API de Serviços Cognitivos que está disponível em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Isso contém as propriedades necessárias ErrorCode, mensagem e destino de propriedades opcionais, detalhes (par de valores de chave), erro interno (isso pode ser aninhado).
message	string	Mensagem de erro de alto nível.
target	string	A origem do erro. Por exemplo, seria "documentos" ou "id do documento" no caso de documento inválido.

ErrorCode

Código de erro

Name	Tipo	Description
Conflict	string	Representando o código de erro de conflito.
Forbidden	string	Representando o código de erro proibido.
InternalCommunicationFailed	string	Representando o código de erro de falha de comunicação interna.
InternalServerError	string	Representando o código de erro interno do servidor.
InvalidArgument	string	Representando o código de erro de argumento inválido.
InvalidRequest	string	Representando o código de erro de solicitação inválida.
NotAllowed	string	Representando o código de erro não permitido.
NotFound	string	Representando o código de erro não encontrado.
PipelineError	string	Representando o código de erro do pipeline.
ServiceUnavailable	string	Representando o código de erro indisponível do serviço.
TooManyRequests	string	Representando o código de erro de muitas solicitações.
Unauthorized	string	Representando o código de erro não autorizado.
UnprocessableEntity	string	Representando o código de erro de entidade não processável.
UnsupportedMediaType	string	Representando o código de erro de tipo de mídia não suportado.

InnerError

Name	Tipo	Description
code	DetailedErrorCode	DetailedErrorCode Código de erro detalhado enum.
details	object	Detalhes adicionais de suporte sobre o erro e/ou políticas esperadas.
innerError	InnerError	InnerError Novo formato de Erro Interno que está em conformidade com as Diretrizes da API de Serviços Cognitivos que está disponível em https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow. Isso contém as propriedades necessárias ErrorCode, mensagem e destino de propriedades opcionais, detalhes (par de valores de chave), erro interno (isso pode ser aninhado).
message	string	Mensagem de erro de alto nível.
target	string	A origem do erro. Por exemplo, seria "documentos" ou "id do documento" no caso de documento inválido.

Phrase

Uma frase transcrita.

Name	Tipo	Description
channel	integer	O índice de canal baseado em 0. Presente apenas se a separação de canais estiver ativada.
confidence	number	O valor de confiança para a frase.
durationMilliseconds	integer	A duração da frase em milissegundos.
locale	string	A localidade da frase.
offsetMilliseconds	integer	O deslocamento inicial da frase em milissegundos.
speaker	integer	Um número inteiro exclusivo que é atribuído a cada alto-falante detetado no áudio sem ordem específica. Presente apenas se a diarização do alto-falante estiver ativada.
text	string	O texto transcrito da frase.
words	Word[]	As palavras que compõem a frase. Presente somente se os carimbos de data/hora no nível da palavra estiverem habilitados.

TranscribeResult

O resultado da operação de transcrição.

Name	Tipo	Description
combinedPhrases	ChannelCombinedPhrases[]	A transcrição completa para cada canal.
durationMilliseconds	integer	A duração do áudio em milissegundos.
phrases	Phrase[]	Os resultados da transcrição segmentados em frases.

Word

Palavra com carimbo de data/hora no formulário de exibição.

Name	Tipo	Description
durationMilliseconds	integer	A duração da palavra em milissegundos.
offsetMilliseconds	integer	O deslocamento inicial da palavra em milissegundos.
text	string	A palavra reconhecida, incluindo pontuação.

Partilhar via