Compartilhar via


Voz personalizada lite

Voz Personalizada Lite é um tipo de projeto onde você pode demonstrar e avaliar a voz personalizada antes de investir em gravações profissionais para criar uma voz de maior qualidade. Não é necessário nenhum aplicativo para fins de demonstração e avaliação. No entanto, a Microsoft restringe e seleciona os exemplos de gravação e teste para uso com voz personalizada lite. Você deve solicitar acesso total à afinação de voz profissional para a implementação e utilização do modelo de voz lite personalizado para fins comerciais. Nesse caso, solicite acesso no formulário de admissão.

Observação

Custom voice lite só está disponível no Speech Studio. Ele não está disponível por meio do portal do Azure AI Foundry, da API REST ou dos SDKs.

Com um projeto de lite de voz personalizado, você grava sua voz online lendo de 20 a 50 scripts predefinidos fornecidos pela Microsoft. Depois de gravar pelo menos 20 exemplos, você pode começar a treinar um modelo. Depois que o modelo for treinado com êxito, você poderá examinar o modelo e conferir 20 exemplos de saída produzidos com outro conjunto de scripts predefinidos.

Consulte os idiomas com suporte para voz personalizada.

Comparar tipos de projeto

A tabela a seguir resume as principais diferenças entre a voz personalizada lite e o ajuste fino de voz profissional.

Itens Lite Profissional
Cenários de destino Demonstração ou avaliação Cenários Professional como vozes de marca e de caractere para chatbots ou leitura de conteúdo de áudio.
Dados de treinamento Gravar online usando o Speech Studio Traga seus próprios dados. É recomendável gravar em um estúdio profissional.
Scripts para gravação Fornecido no Speech Studio Use seus próprios scripts que corresponderem ao cenário de caso de uso. A Microsoft fornece scripts de exemplo para referência.
Tamanho de dados necessário 20 a 50 enunciados 300 a 2000 enunciados
Tempo de treinamento Menos de uma hora de computação Aproximadamente 20 a 40 horas de computação
Qualidade do serviço de voz Qualidade moderada Alta qualidade
Disponibilidade Qualquer pessoa pode gravar exemplos online e treinar um modelo para fins de demonstração e avaliação. O acesso completo à voz personalizada é necessário se você quiser implantar o modelo de voz personalizada lite para uso comercial. O carregamento de dados não é restrito, mas você só pode ajustar uma voz profissional depois que o acesso for aprovado. O ajuste de voz profissional é limitado de acordo com critérios de elegibilidade e uso. Solicite acesso no formulário de entrada.
Preços Os preços por unidade são aplicados igualmente tanto para voz personalizada lite quanto para ajuste fino de voz profissional. Verifique os detalhes de preços aqui. Os preços por unidade são aplicados igualmente tanto para voz personalizada lite quanto para ajuste fino de voz profissional. Verifique os detalhes de preços aqui.

Criar um projeto de voz personalizada lite

Para criar um projeto de voz lite personalizado, siga estas etapas:

  1. Entre no Speech Studio.

  2. Selecione a assinatura e o recurso de Fala com que vai trabalhar.

  3. Selecione Voz personalizada>Criar um projeto.

  4. Selecione Voz neural personalizada Lite>Avançar. Para criar um projeto de voz personalizada profissional, consulte a documentação de ajuste fino de voz profissional.

  5. Siga as instruções fornecidas pelo assistente para criar seu projeto.

    Importante

    O projeto de voz personalizada lite expira após 90 dias, a menos que a declaração verbal gravada pelo talento vocal seja enviada.

  6. Selecione o novo projeto pelo nome ou escolha Ir para o projeto. Você verá estes itens de menu no painel esquerdo: Registrar e compilar, Revisar modelo e Implantar modelo.

    Captura de tela com uma visão geral do fluxo de trabalho de gravação, treinamento, teste e implantação do voz personalizada lite.

Gravar e criar um modelo de voz personalizada lite

Grave pelo menos 20 amostras de voz (até 50) com scripts fornecidos online. As amostras de voz gravadas aqui são usadas para criar uma versão sintética da sua voz.

Observação

Atualmente, o treinamento personalizado de voz só está disponível em algumas regiões. Confira as notas de rodapé na tabela regiões para mais informações.

Aqui estão algumas dicas para você gravar suas amostras de voz:

  • Use um bom microfone. Aumente a clareza das amostras usando um microfone de alta qualidade. Fale a cerca de 8 polegadas de distância do microfone para evitar ruídos bucais.
  • Evite ruídos de fundo. Grave em uma sala tranquila sem eco ou ruído de fundo.
  • Relaxe e fale naturalmente. Permita-se expressar emoções enquanto lê as frases.
  • Grave em uma tomada. Para manter um nível de energia consistente, grave todas as frases em uma sessão.
  • Pronuncie cada palavra corretamente e fale com clareza.

Para gravar e criar um modelo de lite de voz personalizado, siga estas etapas no Speech Studio:

  1. Selecione Voz personalizada> Nome do seu projeto >Gravar e compilar.
  2. Selecione Introdução.
  3. Leia atentamente os termos de uso do talento de voz. Marque a caixa de seleção para confirmar os termos de uso.
  4. Selecione Aceitar
  5. Pressione o ícone de microfone para iniciar a verificação de ruído. Essa verificação de ruído leva apenas alguns segundos e você não precisa falar durante ela.
  6. Se algum ruído tiver sido detectado, você poderá selecionar Verificar novamente para repetir a verificação de ruído. Se nenhum ruído tiver sido detectado, você poderá selecionar Concluído para prosseguir até a próxima etapa. Captura de tela dos resultados da verificação de ruído quando ruído foi detectado.
  7. Examine as dicas de gravação e selecione Entendido. Para obter os melhores resultados, vá para uma área silenciosa sem ruído de fundo antes de gravar as amostras de voz.
  8. Pressione o ícone de microfone para iniciar a gravação. Captura de tela do painel de exemplo de gravação.
  9. Pressione o ícone de parar para interromper a gravação.
  10. Examine as métricas da qualidade. Depois de gravar cada amostra, verifique a métricas da qualidade antes de continuar para a próxima.
  11. Grave mais amostras. Embora seja possível criar um modelo com apenas 20 amostras, é recomendável gravar até 50 amostras para obter uma melhor qualidade.
  12. Selecione Treinar modelo para iniciar o processo de treinamento.

O processo de treinamento leva aproximadamente uma hora de computação. Você pode verificar o progresso do processo de treinamento na página Examinar modelo.

Examinar modelo

Para revisar o modelo de voz lite personalizado e ouvir sua própria voz sintética, siga estas etapas:

  1. Selecione Voz personalizada> Nome do seu projeto >Examinar modelo. Aqui você pode examinar o nome do modelo de voz, o idioma do modelo, o tamanho dos dados de amostra e o progresso do treinamento. O nome da voz é composto pela palavra "Neural" acrescentada ao nome do projeto.
  2. Selecione o nome do modelo de voz para revisar os detalhes do modelo e ouvir a amostra de texto e os resultados da conversão de texto em fala.
  3. Selecione o ícone de reprodução para ouvir sua voz falar cada script. Captura de tela do painel de saída de examinar a amostra.

Enviar declaração do talento de voz

Uma declaração verbal gravada pelo talento de voz é necessária para que você possa implantar o modelo para uso comercial.

Para enviar a declaração verbal de talento de voz, siga estas etapas no Speech Studio:

  1. Selecione Voz personalizada> Nome do seu projeto >Implantar modelo>Gerenciar seu talento de voz. Captura de tela do painel de consentimento do talento de voz da gravação.
  2. Selecione o modelo.
  3. Insira o nome do talento de voz e o nome da empresa.
  4. Leia e grave a declaração. Selecione o ícone de microfone para iniciar a gravação. Selecione o ícone de parar para interromper a gravação.
  5. Selecione Enviar para enviar a declaração.
  6. Verifique o status de processamento na tabela de scripts na parte inferior do painel. Depois que o status for Êxito, você poderá implantar o modelo.

Implantar modelo

Para implantar um modelo de voz leve personalizado e usá-lo em seus aplicativos, você deve obter acesso completo à funcionalidade de voz personalizada. Solicite acesso no formulário de entrada. Dentro de aproximadamente 10 dias úteis, você recebe um email com o status de aprovação. Uma declaração verbal gravada pelo talento de voz também é necessária para que você possa implantar o modelo para uso comercial.

Para implantar um modelo de voz personalizada lite, siga estas etapas no Speech Studio:

  1. Selecione Voz personalizada> Nome do seu projeto >Implantar modelo>Implantar modelo.
  2. Selecione um nome do modelo de voz e, em seguida, selecione Avançar.
  3. Insira um nome e uma descrição para seu ponto de extremidade e, em seguida, selecione Avançar.
  4. Marque a caixa de seleção para concordar com os termos de uso e selecione Avançar.
  5. Selecione Implantar para implantar o contrato.

A partir daqui, você pode usar o modelo de voz lite personalizado da mesma forma como usaria um modelo de voz profissional. Por exemplo, é possível suspender ou retomar um ponto de extremidade após ele ser criado, como meio de limitar gastos e conservar recursos que não estão em uso. Também é possível acessar a voz na ferramenta Criação de Conteúdo de Áudio no Speech Studio.

Próximas etapas