Partilhar via


Adicionar consentimento de talento de voz ao projeto de voz profissional

Um talento de voz é um indivíduo ou alto-falante alvo cujas vozes são gravadas e usadas para criar modelos neurais de voz.

Antes de treinar uma voz neural, você deve enviar uma gravação da declaração de consentimento do talento de voz. A declaração de talento de voz é uma gravação do talento de voz lendo uma declaração de que eles consentem com o uso de seus dados de fala para treinar um modelo de voz personalizado. A declaração de consentimento também é usada para verificar se o talento de voz é a mesma pessoa que o orador nos dados de treinamento.

Gorjeta

Antes de começar no Speech Studio, defina sua persona de voz e escolha o talento de voz certo.

Você pode encontrar a declaração de consentimento verbal em vários idiomas no GitHub. O idioma da declaração verbal deve ser o mesmo da sua gravação. Veja também a divulgação para talentos de voz.

Adicionar talento de voz

Para adicionar um perfil de talento de voz e carregar sua declaração de consentimento, siga estas etapas:

  1. Inicie sessão no Speech Studio.
  2. Selecione Voz> personalizada Seu nome> de projeto Configurar talento>de voz Adicionar talento de voz.
  3. No assistente Adicionar novos talentos de voz, descreva as características da voz que você vai criar. Os cenários especificados aqui devem ser consistentes com o que você forneceu no formulário de inscrição.
  4. Selecione Seguinte.
  5. Na página Carregar declaração de talento de voz, siga as instruções para carregar a declaração de talento de voz que você gravou previamente. Certifique-se de que a declaração verbal foi gravada com as mesmas configurações, ambiente e estilo de fala que seus dados de treinamento. Captura de tela da caixa de diálogo de upload da declaração de talento de voz.
  6. Insira o nome do talento de voz e o nome da empresa. O nome do talento de voz deve ser o nome da pessoa que gravou a declaração de consentimento. Insira o nome no mesmo idioma usado na declaração gravada. O nome da empresa deve corresponder ao nome da empresa que foi falado na declaração gravada. Certifique-se de que o nome da empresa está inserido no mesmo idioma da declaração registrada.
  7. Selecione Seguinte.
  8. Analise os detalhes do talento de voz e da persona e selecione Enviar.

Depois que o status de talento de voz for Bem-sucedido, você poderá continuar a treinar seu modelo de voz personalizado.

Próximos passos

Com o recurso de voz profissional, é necessário que cada voz seja criada com o consentimento explícito do usuário. É necessária uma declaração gravada do usuário reconhecendo que o cliente (proprietário do recurso Azure AI Speech) criará e usará sua voz.

Para adicionar o consentimento de talentos de voz ao projeto de voz profissional, você obtém o arquivo de áudio de consentimento pré-gravado de um URL acessível publicamente (Consents_Create) ou carrega o arquivo de áudio (Consents_Post). Neste artigo, você adiciona o consentimento de uma URL.

Você precisa de uma gravação de áudio do usuário falando a declaração de consentimento.

Você pode obter o texto da declaração de consentimento para cada localidade do repositório GitHub de texto para fala. Consulte SpeakerAuthorization.txt para obter a declaração de consentimento para a en-US localidade:

"I  [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

Para adicionar consentimento a um projeto de voz profissional a partir da URL de um arquivo de áudio, use a operação Consents_Create da API de voz personalizada. Construa o corpo da solicitação de acordo com as seguintes instruções:

  • Defina a propriedade necessária projectId . Consulte Criar um projeto.
  • Defina a propriedade necessária voiceTalentName . O nome do talento de voz deve ser o nome da pessoa que gravou a declaração de consentimento. Insira o nome no mesmo idioma usado na declaração gravada. O nome do talento de voz não pode ser alterado posteriormente.
  • Defina a propriedade necessária companyName . O nome da empresa deve corresponder ao nome da empresa falado na declaração gravada. Certifique-se de que o nome da empresa está inserido no mesmo idioma da declaração registrada. O nome da empresa não pode ser alterado posteriormente.
  • Defina a propriedade necessária audioUrl . A URL do arquivo de áudio de consentimento de talento de voz. Use um URI com o token de assinaturas de acesso compartilhado (SAS).
  • Defina a propriedade necessária locale . Este deve ser o local do consentimento. A localidade não pode ser alterada posteriormente. Você pode encontrar a lista de localidades de texto para fala aqui.

Faça uma solicitação HTTP PUT usando o URI, conforme mostrado no exemplo de Consents_Create a seguir.

  • Substitua YourResourceKey pela chave de recurso de fala.
  • Substitua YourResourceRegion pela região de recursos de Fala.
  • Substitua JessicaConsentId por um ID de consentimento de sua escolha. O ID sensível a maiúsculas e minúsculas será usado no URI do consentimento e não poderá ser alterado posteriormente.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

Deverá receber um corpo de resposta no seguinte formato:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

O cabeçalho de resposta contém a Operation-Location propriedade. Use este URI para obter detalhes sobre a operação Consents_Create . Aqui está um exemplo do cabeçalho da resposta:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

Próximos passos