Batch Syntheses - Create
Crea un processo di sintesi batch, la lunghezza massima consentita del contenuto del payload è di 2 megabyte.
PUT {endpoint}/texttospeech/batchsyntheses/{id}?api-version=2024-04-01
Parametri dell'URI
Nome | In | Necessario | Tipo | Descrizione |
---|---|---|---|---|
endpoint
|
path | True |
string |
Endpoint di Servizi cognitivi supportati (protocollo e nome host, ad esempio: https://eastus.api.cognitive.microsoft.com). |
id
|
path | True |
string minLength: 3maxLength: 64 pattern: ^[a-zA-Z0-9][a-zA-Z0-9._-]{1,62}[a-zA-Z0-9]$ |
ID della risorsa. |
api-version
|
query | True |
string minLength: 1 |
Versione dell'API da usare per questa operazione. |
Intestazione della richiesta
Nome | Necessario | Tipo | Descrizione |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Specificare la chiave di sottoscrizione di Servizi cognitivi qui. |
Operation-Id |
string minLength: 3maxLength: 64 pattern: ^[a-zA-Z0-9][a-zA-Z0-9._-]{1,62}[a-zA-Z0-9]$ |
ID del monitoraggio dello stato per l'operazione. Se l'intestazione Operation-Id corrisponde a un'operazione esistente e la richiesta non è identica alla richiesta precedente, avrà esito negativo con una richiesta 400 non valida. |
Corpo della richiesta
Nome | Necessario | Tipo | Descrizione |
---|---|---|---|
inputKind | True |
Tipo di testo di input. |
|
customVoices |
object |
Mappa vocale personalizzata del nome vocale e dell'ID distribuzione. |
|
description |
string |
Descrizione dell'attività di sintesi batch. |
|
id |
string minLength: 3maxLength: 64 pattern: ^[a-zA-Z0-9][a-zA-Z0-9._-]{1,62}[a-zA-Z0-9]$ |
ID risorsa |
|
inputs |
Input di testo o SSML, sono consentiti fino a 10000 elementi. |
||
properties |
Proprietà dettagliate dell'attività di sintesi batch. |
||
synthesisConfig |
Configurazione della sintesi vocale per l'input di testo normale. |
Risposte
Nome | Tipo | Descrizione |
---|---|---|
201 Created |
Creato Intestazioni
|
|
Other Status Codes |
Si è verificato un errore. Intestazioni x-ms-error-code: string |
Sicurezza
Ocp-Apim-Subscription-Key
Specificare la chiave di sottoscrizione di Servizi cognitivi qui.
Tipo:
apiKey
In:
header
Esempio
Create a batch synthesis job with ssml input and user provided container output. |
Create a batch synthesis job with text input. |
Create a batch synthesis job with ssml input and user provided container output.
Esempio di richiesta
PUT {endpoint}/texttospeech/batchsyntheses/my-batch-synthesis-job-ssml-input-1?api-version=2024-04-01
{
"inputKind": "SSML",
"inputs": [
{
"content": "<speak version=\"1.0\" xml:lang=\"en-US\"><voice name=\"en-US-JennyNeural\">The rainbow has seven colors.</voice></speak>"
}
],
"properties": {
"destinationContainerUrl": "https://contoso.blob.core.windows.net/default?sv=2021-04-10&st=2024-03-15T04%3A47%3A54Z&se=2025-03-16T04%3A47%3A00Z&sr=c&sp=racwdl&sig=Masked",
"decompressOutputFiles": true
}
}
Risposta di esempio
operation-location: https://eastus.api.cognitive.microsoft.com/texttospeech/operations/f43cb3f3-e35d-4df7-9b0f-9f2a49693d1af?api-version=2024-04-01
operation-id: f43cb3f3-e35d-4df7-9b0f-9f2a49693d1a
{
"id": "my-batch-synthesis-job-ssml-input-1",
"status": "NotStarted",
"createdDateTime": "2024-03-15T06:03:33.808822Z",
"lastActionDateTime": "2024-03-15T06:03:33.8088223Z",
"inputKind": "SSML",
"customVoices": {},
"properties": {
"timeToLiveInHours": 744,
"outputFormat": "riff-24khz-16bit-mono-pcm",
"concatenateResult": false,
"decompressOutputFiles": true,
"wordBoundaryEnabled": false,
"sentenceBoundaryEnabled": false,
"destinationContainerUrl": "https://contoso.blob.core.windows.net/default?sv=2021-04-10&st=2024-03-15T04%3A47%3A54Z&se=2025-03-16T04%3A47%3A00Z&sr=c&sp=racwdl&sig=Masked"
}
}
Create a batch synthesis job with text input.
Esempio di richiesta
PUT {endpoint}/texttospeech/batchsyntheses/my-batch-synthesis-job-text-input-1?api-version=2024-04-01
{
"inputKind": "PlainText",
"synthesisConfig": {
"voice": "en-US-JennyNeural"
},
"inputs": [
{
"content": "The rainbow has seven colors."
}
]
}
Risposta di esempio
operation-location: https://eastus.api.cognitive.microsoft.com/texttospeech/operations/06c7f835-e07b-4ac8-b33c-5b6df4a4eeef?api-version=2024-04-01
operation-id: 06c7f835-e07b-4ac8-b33c-5b6df4a4eeef
{
"id": "my-batch-synthesis-job-text-input-1",
"status": "NotStarted",
"createdDateTime": "2024-03-15T06:19:18.0059236Z",
"lastActionDateTime": "2024-03-15T06:19:18.0059238Z",
"inputKind": "PlainText",
"customVoices": {},
"properties": {
"timeToLiveInHours": 744,
"outputFormat": "riff-24khz-16bit-mono-pcm",
"concatenateResult": false,
"decompressOutputFiles": false,
"wordBoundaryEnabled": false,
"sentenceBoundaryEnabled": false
},
"synthesisConfig": {
"voice": "en-US-JennyNeural"
}
}
Definizioni
Nome | Descrizione |
---|---|
Batch |
Attività di sintesi bagno. |
Batch |
Impostazione audio in background. |
Batch |
Dettagli di fatturazione per la sintesi del bagno. |
Batch |
Configurazione della sintesi vocale per l'input di testo normale. |
Batch |
Errore di sintesi batch. |
Batch |
Input di sintesi batch. |
Batch |
Output di Sintesi batch. |
Batch |
Proprietà dettagliate dell'attività di sintesi batch. |
Error |
Oggetto error. |
Error |
Codice di errore di primo livello |
Error |
Risposta di errore. |
Inner |
Oggetto contenente informazioni più specifiche sull'errore. |
Input |
Tipo di testo di input. |
Status |
Stato di una risorsa. |
BatchSynthesis
Attività di sintesi bagno.
Nome | Tipo | Descrizione |
---|---|---|
createdDateTime |
string (date-time) |
Timestamp al momento della creazione dell'oggetto. |
customVoices |
object |
Mappa vocale personalizzata del nome vocale e dell'ID distribuzione. |
description |
string |
Descrizione dell'attività di sintesi batch. |
id |
string minLength: 3maxLength: 64 pattern: ^[a-zA-Z0-9][a-zA-Z0-9._-]{1,62}[a-zA-Z0-9]$ |
ID risorsa |
inputKind |
Tipo di testo di input. |
|
inputs |
Input di testo o SSML, sono consentiti fino a 10000 elementi. |
|
lastActionDateTime |
string (date-time) |
Timestamp quando è stato immesso lo stato corrente. |
outputs |
Output di Sintesi batch. |
|
properties |
Proprietà dettagliate dell'attività di sintesi batch. |
|
status |
Stato di una risorsa. |
|
synthesisConfig |
Configurazione della sintesi vocale per l'input di testo normale. |
BatchSynthesisBackgroundAudioDefinition
Impostazione audio in background.
Nome | Tipo | Descrizione |
---|---|---|
fadein |
integer (int64) |
Valore dissolvenza dell'audio in background. Riferimento https://learn.microsoft.com/azure/ai-services/speech-service/speech-synthesis-markup-voice#add-background-audio. |
fadeout |
integer (int64) |
Valore di dissolvenza dell'audio in background. Riferimento https://learn.microsoft.com/azure/ai-services/speech-service/speech-synthesis-markup-voice#add-background-audio. |
src |
string (uri) |
Origine del file audio. Riferimento https://learn.microsoft.com/azure/ai-services/speech-service/speech-synthesis-markup-voice#add-background-audio. |
volume |
number (double) |
Valore del volume dell'audio in background. Riferimento https://learn.microsoft.com/azure/ai-services/speech-service/speech-synthesis-markup-voice#add-background-audio. |
BatchSynthesisBillingDetails
Dettagli di fatturazione per la sintesi del bagno.
Nome | Tipo | Descrizione |
---|---|---|
aoaiCharacters |
integer (int64) |
Numero di caratteri fatturabili per le voci AOAI nel file di input. |
aoaiHDCharacters |
integer (int64) |
Numero di caratteri fatturabili per le voci HD AOAI nel file di input. |
customNeuralCharacters |
integer (int64) |
Numero di caratteri fatturabili per voci neurali personalizzate nel file di input. |
neuralCharacters |
integer (int64) |
Numero di caratteri fatturabili per le voci neurali predefinite nel file di input. |
personalVoiceCharacters |
integer (int64) |
Numero di caratteri fatturabili per le voci personali nel file di input. |
BatchSynthesisConfig
Configurazione della sintesi vocale per l'input di testo normale.
Nome | Tipo | Descrizione |
---|---|---|
backgroundAudio |
Impostazione audio in background. |
|
pitch |
string |
Pitch per l'input PlainText. Per i valori supportati, vedere https://learn.microsoft.com/azure/ai-services/speech-service/speech-synthesis-markup-voice#adjust-prosody. |
rate |
string |
Velocità di pronuncia per l'input PlainText. Per i valori supportati, vedere https://learn.microsoft.com/azure/ai-services/speech-service/speech-synthesis-markup-voice#adjust-prosody. |
style |
string |
Nome dello stile per l'input PlainText. |
voice |
string minLength: 1 |
Nome vocale per l'input PlainText. È possibile trovare l'elenco voci della piattaforma qui https://learn.microsoft.com/azure/ai-services/speech-service/language-support?tabs=tts. |
volume |
string |
Volume per l'input PlainText. Per i valori supportati, vedere https://learn.microsoft.com/azure/ai-services/speech-service/speech-synthesis-markup-voice#adjust-prosody. |
BatchSynthesisError
Errore di sintesi batch.
Nome | Tipo | Descrizione |
---|---|---|
code |
string |
Codice di errore di primo livello |
message |
string |
Messaggio di errore |
BatchSynthesisInput
Input di sintesi batch.
Nome | Tipo | Descrizione |
---|---|---|
content |
string minLength: 1 |
Potrebbe trattarsi di SSML o testo normale. |
BatchSynthesisOutputs
Output di Sintesi batch.
Nome | Tipo | Descrizione |
---|---|---|
result |
string |
SAS URL del file di risultati. Sarebbe un percorso relativo quando viene specificato "destinationContainerUrl". |
summary |
string |
Quando BatchSynthesisProperties.decompressOutputFiles è true, qui verrà fornito il percorso del file di riepilogo del processo. |
BatchSynthesisProperties
Proprietà dettagliate dell'attività di sintesi batch.
Nome | Tipo | Descrizione |
---|---|---|
billingDetails |
Dettagli di fatturazione per la sintesi del bagno. |
|
concatenateResult |
boolean |
Indica se il risultato della sintesi è concatenato. |
decompressOutputFiles |
boolean |
Indica se il risultato della sintesi è decompresso nel contenitore di destinazione. Ha effetto solo quando viene specificato "destinationContainerUrl" o "BYOS". |
destinationContainerUrl |
string (uri) |
Contenitore di destinazione richiesto. Si tratta di un URL con firma di accesso condiviso ad hoc del servizio in un contenitore scrivibile nell'archiviazione BLOB di Azure. |
destinationPath |
string |
Il percorso di destinazione nel contenitore di destinazione, per impostazione predefinita null, funziona solo quando viene specificato "DestinationContainerUrl", il prefisso del percorso finale degli output deve essere {DestinationPath}/{TaskId}/, o {TaskId} se non specificato. |
durationInMilliseconds |
integer (int32) |
Durata audio generata in millisecondi. |
error |
Errore di sintesi batch. |
|
failedAudioCount |
integer (int32) |
Numero di audio non riusciti. |
outputFormat |
string |
Formato di output audio richiesto. Riferimento https://learn.microsoft.com/azure/ai-services/speech-service/batch-synthesis-properties#batch-synthesis-properties. |
sentenceBoundaryEnabled |
boolean |
Indica se verrà generato l'output del limite della frase. |
sizeInBytes |
integer (int64) |
Dimensioni audio generate in byte. |
succeededAudioCount |
integer (int32) |
Numero di audio riusciti. |
timeToLiveInHours |
integer (int32) |
Per quanto tempo l'attività batch verrà mantenuta nel sistema dopo il completamento. Quando l'attività batch raggiunge il tempo di esecuzione dopo il completamento (riuscito o non riuscito), l'attività batch verrà eliminata automaticamente. La durata supportata più lunga è di 744 ore (31 giorni). Il valore predefinito è 744 ore. |
wordBoundaryEnabled |
boolean |
Indica se verrà generato l'output del limite di parola. |
Error
Oggetto error.
Nome | Tipo | Descrizione |
---|---|---|
code |
Codice di errore di primo livello |
|
details |
Error[] |
Ulteriori dettagli di supporto relativi all'errore e/o ai criteri previsti. |
innererror |
Oggetto contenente informazioni più specifiche sull'errore. |
|
message |
string |
Messaggio di errore di alto livello. |
target |
string |
Indica l'origine dell'errore. |
ErrorCode
Codice di errore di primo livello
Valore | Descrizione |
---|---|
BadArgument | |
BadRequest | |
Forbidden | |
InternalServerError | |
NotFound | |
ServiceUnavailable | |
TooManyRequests | |
Unauthorized | |
UnsupportedMediaType |
ErrorResponse
Risposta di errore.
Nome | Tipo | Descrizione |
---|---|---|
error |
Oggetto error. |
InnerError
Oggetto contenente informazioni più specifiche sull'errore.
Nome | Tipo | Descrizione |
---|---|---|
code |
string |
Codice di errore dettagliato per facilitare la diagnostica. |
innererror |
Oggetto contenente informazioni più specifiche sull'errore. |
|
message |
string |
Messaggio di errore dettagliato. |
target |
string |
Indica l'origine dell'errore. |
InputKind
Tipo di testo di input.
Valore | Descrizione |
---|---|
PlainText | |
SSML |
Status
Stato di una risorsa.
Valore | Descrizione |
---|---|
Failed | |
NotStarted | |
Running | |
Succeeded |