Adicionar consentimento de talento de voz ao projeto de voz profissional
Um talento de voz é um indivíduo ou alto-falante alvo cujas vozes são gravadas e usadas para criar modelos neurais de voz.
Antes de treinar uma voz neural, você deve enviar uma gravação da declaração de consentimento do talento de voz. A declaração de talento de voz é uma gravação do talento de voz lendo uma declaração de que eles consentem com o uso de seus dados de fala para treinar um modelo de voz personalizado. A declaração de consentimento também é usada para verificar se o talento de voz é a mesma pessoa que o orador nos dados de treinamento.
Gorjeta
Antes de começar no Speech Studio, defina sua persona de voz e escolha o talento de voz certo.
Você pode encontrar a declaração de consentimento verbal em vários idiomas no GitHub. O idioma da declaração verbal deve ser o mesmo da sua gravação. Veja também a divulgação para talentos de voz.
Adicionar talento de voz
Para adicionar um perfil de talento de voz e carregar sua declaração de consentimento, siga estas etapas:
- Inicie sessão no Speech Studio.
- Selecione Voz> personalizada Seu nome> de projeto Configurar talento>de voz Adicionar talento de voz.
- No assistente Adicionar novos talentos de voz, descreva as características da voz que você vai criar. Os cenários especificados aqui devem ser consistentes com o que você forneceu no formulário de inscrição.
- Selecione Seguinte.
- Na página Carregar declaração de talento de voz, siga as instruções para carregar a declaração de talento de voz que você gravou previamente. Certifique-se de que a declaração verbal foi gravada com as mesmas configurações, ambiente e estilo de fala que seus dados de treinamento.
- Insira o nome do talento de voz e o nome da empresa. O nome do talento de voz deve ser o nome da pessoa que gravou a declaração de consentimento. Insira o nome no mesmo idioma usado na declaração gravada. O nome da empresa deve corresponder ao nome da empresa que foi falado na declaração gravada. Certifique-se de que o nome da empresa está inserido no mesmo idioma da declaração registrada.
- Selecione Seguinte.
- Analise os detalhes do talento de voz e da persona e selecione Enviar.
Depois que o status de talento de voz for Bem-sucedido, você poderá continuar a treinar seu modelo de voz personalizado.
Próximos passos
Com o recurso de voz profissional, é necessário que cada voz seja criada com o consentimento explícito do usuário. É necessária uma declaração gravada do usuário reconhecendo que o cliente (proprietário do recurso Azure AI Speech) criará e usará sua voz.
Para adicionar o consentimento de talentos de voz ao projeto de voz profissional, você obtém o arquivo de áudio de consentimento pré-gravado de um URL acessível publicamente (Consents_Create) ou carrega o arquivo de áudio (Consents_Post). Neste artigo, você adiciona o consentimento de uma URL.
Declaração de consentimento
Você precisa de uma gravação de áudio do usuário falando a declaração de consentimento.
Você pode obter o texto da declaração de consentimento para cada localidade do repositório GitHub de texto para fala. Consulte SpeakerAuthorization.txt para obter a declaração de consentimento para a en-US
localidade:
"I [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."
Adicionar consentimento de um URL
Para adicionar consentimento a um projeto de voz profissional a partir da URL de um arquivo de áudio, use a operação Consents_Create da API de voz personalizada. Construa o corpo da solicitação de acordo com as seguintes instruções:
- Defina a propriedade necessária
projectId
. Consulte Criar um projeto. - Defina a propriedade necessária
voiceTalentName
. O nome do talento de voz deve ser o nome da pessoa que gravou a declaração de consentimento. Insira o nome no mesmo idioma usado na declaração gravada. O nome do talento de voz não pode ser alterado posteriormente. - Defina a propriedade necessária
companyName
. O nome da empresa deve corresponder ao nome da empresa falado na declaração gravada. Certifique-se de que o nome da empresa está inserido no mesmo idioma da declaração registrada. O nome da empresa não pode ser alterado posteriormente. - Defina a propriedade necessária
audioUrl
. A URL do arquivo de áudio de consentimento de talento de voz. Use um URI com o token de assinaturas de acesso compartilhado (SAS). - Defina a propriedade necessária
locale
. Este deve ser o local do consentimento. A localidade não pode ser alterada posteriormente. Você pode encontrar a lista de localidades de texto para fala aqui.
Faça uma solicitação HTTP PUT usando o URI, conforme mostrado no exemplo de Consents_Create a seguir.
- Substitua
YourResourceKey
pela chave de recurso de fala. - Substitua
YourResourceRegion
pela região de recursos de Fala. - Substitua
JessicaConsentId
por um ID de consentimento de sua escolha. O ID sensível a maiúsculas e minúsculas será usado no URI do consentimento e não poderá ser alterado posteriormente.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
"locale": "en-US"
} ' "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"
Deverá receber um corpo de resposta no seguinte formato:
{
"id": "JessicaConsentId",
"description": "Consent for Jessica voice",
"projectId": "ProjectId",
"voiceTalentName": "Jessica Smith",
"companyName": "Contoso",
"locale": "en-US",
"status": "NotStarted",
"createdDateTime": "2023-04-01T05:30:00.000Z",
"lastActionDateTime": "2023-04-02T10:15:30.000Z"
}
O cabeçalho de resposta contém a Operation-Location
propriedade. Use este URI para obter detalhes sobre a operação Consents_Create . Aqui está um exemplo do cabeçalho da resposta:
Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314