Transcriptions - Transcribe
Transcrição síncrona de um arquivo de áudio.
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15
Parâmetros do URI
Name | Em | Necessário | Tipo | Description |
---|---|---|---|---|
audio
|
formData | True |
file binary |
O conteúdo do arquivo de áudio a ser transcrito. O arquivo de áudio deve ter menos de 2 horas de duração de áudio e menos de 250 MB de tamanho. |
definition
|
formData |
string |
Metadados para um pedido de transcrição. Este campo contém um objeto serializado por JSON do tipo |
|
endpoint
|
path | True |
string |
Pontos de extremidade de Serviços Cognitivos suportados (protocolo e nome do host, por exemplo: https://westus.api.cognitive.microsoft.com). |
api-version
|
query | True |
string |
A versão da api solicitada. |
Cabeçalho do Pedido
Media Types: "multipart/form-data"
Name | Necessário | Tipo | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Forneça a chave da sua conta de serviços cognitivos aqui. |
Respostas
Name | Tipo | Description |
---|---|---|
200 OK |
OK |
|
Other Status Codes |
Ocorreu um erro. |
Segurança
Ocp-Apim-Subscription-Key
Forneça a chave da sua conta de serviços cognitivos aqui.
Tipo:
apiKey
Em:
header
Exemplos
Transcribe an audio file
Pedido de amostra
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15
Resposta da amostra
{
"durationMilliseconds": 2000,
"combinedPhrases": [
{
"text": "Weather"
}
],
"phrases": [
{
"offsetMilliseconds": 40,
"durationMilliseconds": 320,
"text": "Weather",
"words": [
{
"text": "weather",
"offsetMilliseconds": 40,
"durationMilliseconds": 320
}
],
"locale": "en-US",
"confidence": 0.78983736
}
]
}
Definições
Name | Description |
---|---|
Channel |
A transcrição completa por canal. |
Detailed |
DetailedErrorCode |
Error |
Erro |
Error |
Código de erro |
Inner |
InnerError |
Phrase |
Uma frase transcrita. |
Transcribe |
O resultado da operação de transcrição. |
Word |
Palavra com carimbo de data/hora no formulário de exibição. |
ChannelCombinedPhrases
A transcrição completa por canal.
Name | Tipo | Description |
---|---|---|
channel |
integer |
O índice de canal baseado em 0. Presente apenas se a separação de canais estiver ativada. |
text |
string |
O texto transcrito. |
DetailedErrorCode
DetailedErrorCode
Name | Tipo | Description |
---|---|---|
AudioLengthLimitExceeded |
string |
O arquivo de áudio é maior do que a duração máxima permitida. |
BadChannelConfiguration |
string |
Há uma incompatibilidade entre os canais de áudio nos dados, na configuração ou nos requisitos do aplicativo. |
DataImportFailed |
string |
Falha na importação de dados. |
DeleteNotAllowed |
string |
Excluir não permitido. |
DeployNotAllowed |
string |
Implantação não permitida. |
DeployingFailedModel |
string |
Implantação de modelo com falha. |
EmptyAudioFile |
string |
O arquivo de áudio está vazio. |
EmptyRequest |
string |
Pedido vazio. |
EndpointCannotBeDefault |
string |
O ponto de extremidade não pode ser padrão. |
EndpointLoggingNotSupported |
string |
Não há suporte para registro de ponto final. |
EndpointNotUpdatable |
string |
Ponto final não atualizável. |
EndpointWithoutLogging |
string |
Ponto de extremidade sem registro. |
ExceededNumberOfRecordingsUris |
string |
Excedeu o número de gravações uris. |
FailedDataset |
string |
Conjunto de dados com falha. |
Forbidden |
string |
Proibido. |
InUseViolation |
string |
Violação em uso. |
InaccessibleCustomerStorage |
string |
Armazenamento inacessível do cliente. |
InvalidAdaptationMapping |
string |
Mapeamento de adaptação inválido. |
InvalidAudioFormat |
string |
O formato de entrada de áudio não é suportado. |
InvalidBaseModel |
string |
Modelo base inválido. |
InvalidCallbackUri |
string |
Uri de retorno de chamada inválido. |
InvalidChannelSpecification |
string |
A seleção de canais na solicitação de transcrição não é suportada (por exemplo, nem 0 nem 1 foram selecionados). |
InvalidChannels |
string |
Canais inválidos. |
InvalidCollection |
string |
Coleção inválida. |
InvalidDataset |
string |
Conjunto de dados inválido. |
InvalidDocument |
string |
Documento inválido. |
InvalidDocumentBatch |
string |
Lote de documentos inválido. |
InvalidLocale |
string |
Localidade inválida. |
InvalidLogDate |
string |
Data de registo inválida. |
InvalidLogEndTime |
string |
Hora de fim de log inválida. |
InvalidLogId |
string |
ID de log inválido. |
InvalidLogStartTime |
string |
Hora de início de log inválida. |
InvalidModel |
string |
Modelo inválido. |
InvalidModelUri |
string |
Uri de modelo inválido. |
InvalidParameter |
string |
Parâmetro inválido. |
InvalidParameterValue |
string |
Valor de parâmetro inválido. |
InvalidPayload |
string |
Carga útil inválida. |
InvalidPermissions |
string |
Permissões inválidas. |
InvalidPrerequisite |
string |
Pré-requisito inválido. |
InvalidProductId |
string |
ID do produto inválida. |
InvalidProject |
string |
Projeto inválido. |
InvalidProjectKind |
string |
Tipo de projeto inválido. |
InvalidRecordingsUri |
string |
Gravações inválidas uri. |
InvalidRequestBodyFormat |
string |
Formato de corpo de solicitação inválido. |
InvalidSasValidityDuration |
string |
Duração de validade sas inválida. |
InvalidSkipTokenForLogs |
string |
Token de pulo inválido para logs. |
InvalidSourceAzureResourceId |
string |
ID de recurso do Azure de origem inválida. |
InvalidSubscription |
string |
Subscrição inválida. |
InvalidTest |
string |
Teste inválido. |
InvalidTimeToLive |
string |
Tempo de vida inválido. |
InvalidTopForLogs |
string |
Parte superior inválida para logs. |
InvalidTranscription |
string |
Transcrição inválida. |
InvalidWebHookEventKind |
string |
Tipo de evento de gancho da Web inválido. |
MissingInputRecords |
string |
Registros de entrada ausentes. |
ModelCopyAuthorizationExpired |
string |
ModelCopyAuthorization expirado. |
ModelDeploymentNotCompleteState |
string |
Implantação do modelo não concluída estado. |
ModelDeprecated |
string |
Modelo preterido. |
ModelExists |
string |
Modelo existe. |
ModelMismatch |
string |
Incompatibilidade de modelos. |
ModelNotDeployable |
string |
Modelo não implantável. |
ModelVersionIncorrect |
string |
Versão do modelo incorreta. |
MultipleLanguagesIdentified |
string |
A Identificação Linguística reconheceu vários idiomas. Nenhuma língua dominante pôde ser determinada. |
NoLanguageIdentified |
string |
A Identificação Linguística não reconhecia nenhuma língua. |
NoUtf8WithBom |
string |
Não utf8 com bom. |
OnlyOneOfUrlsOrContainerOrDataset |
string |
Apenas um dos urls ou contêiner ou conjunto de dados. |
ProjectGenderMismatch |
string |
Desfasamento entre homens e mulheres no projeto. |
QuotaViolation |
string |
Violação de quotas. |
SingleDefaultEndpoint |
string |
Ponto de extremidade padrão único. |
SkuLimitsExist |
string |
Existem limites de Sku. |
SubscriptionNotFound |
string |
Subscrição não encontrada. |
UnexpectedError |
string |
Erro inesperado. |
UnsupportedClassBasedAdaptation |
string |
Adaptação baseada em classe sem suporte. |
UnsupportedDelta |
string |
Delta não suportado. |
UnsupportedDynamicConfiguration |
string |
Configuração dinâmica não suportada. |
UnsupportedFilter |
string |
Filtro não suportado. |
UnsupportedLanguageCode |
string |
Código de idioma não suportado. |
UnsupportedOrderBy |
string |
Ordem não suportada por. |
UnsupportedPagination |
string |
Paginação não suportada. |
UnsupportedTimeRange |
string |
Intervalo de tempo não suportado. |
Error
Erro
Name | Tipo | Description |
---|---|---|
code |
Código de erro |
|
details |
Error[] |
Detalhes adicionais de suporte sobre o erro e/ou políticas esperadas. |
innerError |
InnerError |
|
message |
string |
Mensagem de erro de alto nível. |
target |
string |
A origem do erro. Por exemplo, seria "documentos" ou "id do documento" no caso de documento inválido. |
ErrorCode
Código de erro
Name | Tipo | Description |
---|---|---|
Conflict |
string |
Representando o código de erro de conflito. |
Forbidden |
string |
Representando o código de erro proibido. |
InternalCommunicationFailed |
string |
Representando o código de erro de falha de comunicação interna. |
InternalServerError |
string |
Representando o código de erro interno do servidor. |
InvalidArgument |
string |
Representando o código de erro de argumento inválido. |
InvalidRequest |
string |
Representando o código de erro de solicitação inválida. |
NotAllowed |
string |
Representando o código de erro não permitido. |
NotFound |
string |
Representando o código de erro não encontrado. |
PipelineError |
string |
Representando o código de erro do pipeline. |
ServiceUnavailable |
string |
Representando o código de erro indisponível do serviço. |
TooManyRequests |
string |
Representando o código de erro de muitas solicitações. |
Unauthorized |
string |
Representando o código de erro não autorizado. |
UnprocessableEntity |
string |
Representando o código de erro de entidade não processável. |
UnsupportedMediaType |
string |
Representando o código de erro de tipo de mídia não suportado. |
InnerError
InnerError
Name | Tipo | Description |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
Detalhes adicionais de suporte sobre o erro e/ou políticas esperadas. |
innerError |
InnerError |
|
message |
string |
Mensagem de erro de alto nível. |
target |
string |
A origem do erro. Por exemplo, seria "documentos" ou "id do documento" no caso de documento inválido. |
Phrase
Uma frase transcrita.
Name | Tipo | Description |
---|---|---|
channel |
integer |
O índice de canal baseado em 0. Presente apenas se a separação de canais estiver ativada. |
confidence |
number |
O valor de confiança para a frase. |
durationMilliseconds |
integer |
A duração da frase em milissegundos. |
locale |
string |
A localidade da frase. |
offsetMilliseconds |
integer |
O deslocamento inicial da frase em milissegundos. |
speaker |
integer |
Um número inteiro exclusivo que é atribuído a cada alto-falante detetado no áudio sem ordem específica. Presente apenas se a diarização do alto-falante estiver ativada. |
text |
string |
O texto transcrito da frase. |
words |
Word[] |
As palavras que compõem a frase. Presente somente se os carimbos de data/hora no nível da palavra estiverem habilitados. |
TranscribeResult
O resultado da operação de transcrição.
Name | Tipo | Description |
---|---|---|
combinedPhrases |
A transcrição completa para cada canal. |
|
durationMilliseconds |
integer |
A duração do áudio em milissegundos. |
phrases |
Phrase[] |
Os resultados da transcrição segmentados em frases. |
Word
Palavra com carimbo de data/hora no formulário de exibição.
Name | Tipo | Description |
---|---|---|
durationMilliseconds |
integer |
A duração da palavra em milissegundos. |
offsetMilliseconds |
integer |
O deslocamento inicial da palavra em milissegundos. |
text |
string |
A palavra reconhecida, incluindo pontuação. |