Adicionar consentimento de talento de voz ao projeto de voz profissional

Artigo
10/16/2024

Um talento de voz é um indivíduo ou alto-falante alvo cujas vozes são gravadas e usadas para criar modelos neurais de voz.

Antes de treinar uma voz neural, você deve enviar uma gravação da declaração de consentimento do talento de voz. A declaração de talento de voz é uma gravação do talento de voz lendo uma declaração de que eles consentem com o uso de seus dados de fala para treinar um modelo de voz personalizado. A declaração de consentimento também é usada para verificar se o talento de voz é a mesma pessoa que o orador nos dados de treinamento.

Gorjeta

Antes de começar no Speech Studio, defina sua persona de voz e escolha o talento de voz certo.

Você pode encontrar a declaração de consentimento verbal em vários idiomas no GitHub. O idioma da declaração verbal deve ser o mesmo da sua gravação. Veja também a divulgação para talentos de voz.

Adicionar talento de voz

Para adicionar um perfil de talento de voz e carregar sua declaração de consentimento, siga estas etapas:

Inicie sessão no Speech Studio.
Selecione Voz> personalizada Seu nome> de projeto Configurar talento>de voz Adicionar talento de voz.
No assistente Adicionar novos talentos de voz, descreva as características da voz que você vai criar. Os cenários especificados aqui devem ser consistentes com o que você forneceu no formulário de inscrição.
Selecione Seguinte.
Na página Carregar declaração de talento de voz, siga as instruções para carregar a declaração de talento de voz que você gravou previamente. Certifique-se de que a declaração verbal foi gravada com as mesmas configurações, ambiente e estilo de fala que seus dados de treinamento.
Insira o nome do talento de voz e o nome da empresa. O nome do talento de voz deve ser o nome da pessoa que gravou a declaração de consentimento. Insira o nome no mesmo idioma usado na declaração gravada. O nome da empresa deve corresponder ao nome da empresa que foi falado na declaração gravada. Certifique-se de que o nome da empresa está inserido no mesmo idioma da declaração registrada.
Selecione Seguinte.
Analise os detalhes do talento de voz e da persona e selecione Enviar.

Depois que o status de talento de voz for Bem-sucedido, você poderá continuar a treinar seu modelo de voz personalizado.

Próximos passos

Adicionar dados de treinamento ao projeto de voz profissional

Com o recurso de voz profissional, é necessário que cada voz seja criada com o consentimento explícito do usuário. É necessária uma declaração gravada do usuário reconhecendo que o cliente (proprietário do recurso Azure AI Speech) criará e usará sua voz.

Para adicionar o consentimento de talentos de voz ao projeto de voz profissional, você obtém o arquivo de áudio de consentimento pré-gravado de um URL acessível publicamente (Consents_Create) ou carrega o arquivo de áudio (Consents_Post). Neste artigo, você adiciona o consentimento de uma URL.

Você precisa de uma gravação de áudio do usuário falando a declaração de consentimento.

Você pode obter o texto da declaração de consentimento para cada localidade do repositório GitHub de texto para fala. Consulte SpeakerAuthorization.txt para obter a declaração de consentimento para a en-US localidade:

"I  [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

Para adicionar consentimento a um projeto de voz profissional a partir da URL de um arquivo de áudio, use a operação Consents_Create da API de voz personalizada. Construa o corpo da solicitação de acordo com as seguintes instruções:

Defina a propriedade necessária projectId . Consulte Criar um projeto.
Defina a propriedade necessária voiceTalentName . O nome do talento de voz deve ser o nome da pessoa que gravou a declaração de consentimento. Insira o nome no mesmo idioma usado na declaração gravada. O nome do talento de voz não pode ser alterado posteriormente.
Defina a propriedade necessária companyName . O nome da empresa deve corresponder ao nome da empresa falado na declaração gravada. Certifique-se de que o nome da empresa está inserido no mesmo idioma da declaração registrada. O nome da empresa não pode ser alterado posteriormente.
Defina a propriedade necessária audioUrl . A URL do arquivo de áudio de consentimento de talento de voz. Use um URI com o token de assinaturas de acesso compartilhado (SAS).
Defina a propriedade necessária locale . Este deve ser o local do consentimento. A localidade não pode ser alterada posteriormente. Você pode encontrar a lista de localidades de texto para fala aqui.

Faça uma solicitação HTTP PUT usando o URI, conforme mostrado no exemplo de Consents_Create a seguir.

Substitua YourResourceKey pela chave de recurso de fala.
Substitua YourResourceRegion pela região de recursos de Fala.
Substitua JessicaConsentId por um ID de consentimento de sua escolha. O ID sensível a maiúsculas e minúsculas será usado no URI do consentimento e não poderá ser alterado posteriormente.

curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

Deverá receber um corpo de resposta no seguinte formato:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

O cabeçalho de resposta contém a Operation-Location propriedade. Use este URI para obter detalhes sobre a operação Consents_Create . Aqui está um exemplo do cabeçalho da resposta:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

Próximos passos

Adicionar dados de treinamento ao projeto de voz profissional

Partilhar via

Adicionar talento de voz

Próximos passos

Próximos passos

Comentários

Recursos adicionais

Partilhar via

Adicionar talento de voz

Próximos passos

Declaração de consentimento

Adicionar consentimento de um URL

Próximos passos

Comentários

Recursos adicionais