Compartilhar via


Personalizar um modelo de fala

Importante

O prazo para migrar o conteúdo do Azure Video Indexer devido à desativação dos Serviços de Mídia do Azure já passou. Consulte o guia de desativação para obter mais informações.

Observação

A personalização do modelo de fala, incluindo o treinamento de pronúncia, só tem suporte em contas de avaliação do Azure do Video Indexer e contas do Resource Manager. Não há suporte em contas clássicas. Para obter diretrizes sobre como atualizar seu tipo de conta sem custo, consulte Atualizar sua conta do Azure AI Video Indexer. Para obter diretrizes sobre como usar a experiência de linguagem personalizada, consulte Personalizar um modelo de linguagem.

O Azure AI Video Indexer permite criar modelos de fala personalizados para personalizar o reconhecimento de fala carregando conjuntos de dados que são usados para criar um modelo de fala. Este artigo aborda as etapas para fazer isso por meio do site do Video Indexer. Você também pode usar a API, conforme descrito em Personalizar o modelo de fala usando a API.

Para obter uma visão geral detalhada e as práticas recomendadas para modelos de fala personalizados, consulte Personalizar um modelo de fala com o Azure AI Video Indexer.

Pré-requisitos

Criar um conjunto de dados

Como todos os modelos personalizados devem conter um conjunto de dados, começaremos com o processo de como criar e gerenciar conjuntos de dados.

  1. Selecione o botão Personalização do modelo.
  2. Selecione a guia Fala (nova).
  3. Selecione Carregar conjunto de dados.
  4. Selecione Texto simples ou Pronúncia no menu suspenso Tipo de conjunto de dados. Cada modelo de fala deve ter um conjunto de dados de texto sem formatação e, opcionalmente, pode ter um conjunto de dados de pronúncia.
  5. Selecione Procurar e selecione o arquivo de conjunto de dados. Você pode escolher apenas um.
  6. Selecione um idioma para o modelo. Escolha o idioma falado nos arquivos de mídia que você planeja indexar com esse modelo. O nome do conjunto de dados é preenchido previamente com o nome do arquivo, mas você pode modificar o nome.
  7. Opcionalmente, você pode adicionar uma descrição do conjunto de dados. Isso pode ser útil para distinguir cada conjunto de dados se você espera ter vários conjuntos de dados.
  8. Escolha Carregar. Quando a criação do conjunto de dados estiver concluída, você poderá usá-lo para treinamento e criação de novos modelos.

Revisar e atualizar um conjunto de dados

Você pode exibir um conjunto de dados e suas propriedades:

  • Clicando no nome do conjunto de dados
  • Passar o mouse sobre o conjunto de dados
  • Selecionando as reticências

Em seguida, selecione Exibir conjunto de dados.

Em seguida, você pode exibir o nome, a descrição, o idioma e o status do conjunto de dados, além das seguintes propriedades:

Número de linhas: indica o número de linhas carregadas com sucesso do número total de linhas no arquivo. Se todo o arquivo for carregado com sucesso, os números corresponderão (por exemplo, 10 de 10 normalizados). Se os números não corresponderem (por exemplo, 7 de 10 normalizados), isso significa que apenas algumas das linhas foram carregadas com êxito e o restante teve erros. As causas comuns de erros são problemas de formatação com uma linha, como não espaçar uma tabulação entre cada palavra em um arquivo de pronúncia. Revisar o texto simples e os dados de pronúncia para artigos de treinamento deve ser útil para encontrar o problema. Para solucionar a causa, revise os detalhes do erro, que estão contidos no relatório. Selecione Exibir relatório para exibir os detalhes do erro em relação às linhas que não foram carregadas com êxito (errorKind). Isso também pode ser visualizado selecionando a guia Relatório .

ID do conjunto de dados: cada conjunto de dados tem um GUID exclusivo, que é necessário ao usar a API para operações que fazem referência ao conjunto de dados.

Texto sem formatação (normalizado): contém o texto normalizado do arquivo de conjunto de dados carregado. O texto normalizado é o texto reconhecido em formato simples sem formatação.

Editar detalhes: para editar o nome ou a descrição de um conjunto de dados, ao passar o mouse sobre o conjunto de dados, selecione nas reticências e, em seguida, selecione Editar detalhes. Em seguida, você pode editar o nome e a descrição do conjunto de dados.

Observação

Os dados em um conjunto de dados não podem ser editados ou atualizados depois que o conjunto de dados for carregado. Se você precisar editar ou atualizar os dados em um conjunto de dados, baixe o conjunto de dados, execute as edições, salve o arquivo e carregue o novo arquivo de conjunto de dados.

Download: para baixar um arquivo de conjunto de dados, ao passar o mouse sobre o conjunto de dados, selecione nas reticências e, em seguida, selecione Baixar. Como alternativa, ao exibir o conjunto de dados, você pode selecionar Baixar e ter a opção de baixar o arquivo do conjunto de dados ou o relatório de upload no formato JSON.

Excluir: para excluir um conjunto de dados, ao passar o mouse sobre o conjunto de dados, selecione nas reticências e, em seguida, selecione Excluir.

Criar um modelo de fala personalizada

Os conjuntos de dados são usados na criação e treinamento de modelos. Depois de criar um conjunto de dados de texto sem formatação, você pode criar e começar a usar um modelo de fala personalizado.

Lembre-se do seguinte ao criar e usar modelos de fala personalizados:

  • Um novo modelo deve incluir pelo menos um conjunto de dados de texto sem formatação e pode ter vários conjuntos de dados de texto sem formatação.
  • É opcional incluir um conjunto de dados de pronúncia e não mais do que um pode ser incluído.
  • Depois que um modelo é criado, você não pode adicionar conjuntos de dados adicionais a ele ou realizar modificações em seus conjuntos de dados. Se você precisar adicionar ou modificar conjuntos de dados, crie um novo modelo.
  • Se você indexou um vídeo usando um modelo de fala personalizado e, em seguida, excluiu o modelo, a transcrição não será afetada, a menos que você execute uma reindexação.
  • Se você excluiu um conjunto de dados que foi usado para treinar um modelo personalizado, como o modelo de fala já foi treinado pelo conjunto de dados, ele continuará a usá-lo até que o modelo de fala seja excluído.
  • Se você excluir um modelo personalizado, ele não terá impacto na transcrição de vídeos que já foram indexados usando o modelo.

Treinar um modelo

Observação

Depois que um modelo é criado, os conjuntos de dados não podem ser adicionados. Um modelo só pode conter conjuntos de dados da mesma linguagem.

Há duas maneiras de treinar um modelo – por meio da guia do conjunto de dados e da guia do modelo.

Treinar um modelo por meio da guia Conjuntos de dados

  1. Visualize a lista de conjuntos de dados.
  2. Selecione um conjunto de dados de texto sem formatação. O ícone Treinar novo modelo acima pode ser selecionado.
  3. Selecione Treinar novo modelo.
  4. Insira um nome para o modelo, um idioma e, opcionalmente, adicione uma descrição.
  5. Selecione a guia Conjuntos de dados
  6. Selecione os conjuntos de dados que você deseja incluir no modelo.
  7. Selecione Criar e treinar.

Treinar um modelo por meio da guia Modelos

  1. Selecione a guia Modelo.
  2. Selecione o ícone Treinar novo modelo .
  3. Selecione os conjuntos de dados que você deseja que façam parte do modelo.
  4. Insira um nome para o modelo, um idioma e, opcionalmente, adicione uma descrição.
  5. Selecione a guia Conjuntos de Dados.
  6. Selecione os conjuntos de dados que você deseja incluir no modelo.
  7. Selecione Criar e treinar.

Revisar e atualizar um modelo

Exibir modelo: você pode visualizar um modelo e suas propriedades clicando no nome do modelo ou ao passar o mouse sobre o modelo, clicando nas reticências e selecionando Exibir modelo.

Você verá na guia Detalhes o nome, a descrição, o idioma e o status do modelo, além das seguintes propriedades:

ID do modelo: cada modelo tem um GUID exclusivo, que é necessário ao usar a API para operações que fazem referência ao modelo.

Criado em: a data em que o modelo foi criado.

Editar detalhes: Para editar o nome ou a descrição de um modelo, ao passar o mouse sobre o modelo, selecione nas reticências e, em seguida, selecione Editar detalhes. Você pode então editar o nome e a descrição do modelo.

Observação

Somente o nome e a descrição do modelo podem ser editados. Se você quiser fazer alterações em seus conjuntos de dados ou adicionar conjuntos de dados, um novo modelo deverá ser criado.

Excluir: para excluir um modelo, ao passar o mouse sobre o conjunto de dados, selecione nas reticências e, em seguida, selecione Excluir.

Conjuntos de dados incluídos: selecione na guia Conjuntos de dados incluídos para exibir os conjuntos de dados do modelo.

Usar um modelo de linguagem personalizado ao indexar um vídeo

Um modelo de linguagem personalizado não é usado por padrão para trabalhos de indexação, portanto, deve ser selecionado durante o processo de upload do índice.

  1. Durante o processo de upload, selecione a origem do modelo de linguagem personalizada no menu suspenso de linguagem .
  2. Escolha Carregar.

As mesmas etapas se aplicam quando você deseja reindexar um vídeo com um modelo personalizado.