Pesquisa de palavra-chave e conversão de fala em texto

Rede de Distribuição de Conteúdo do Azure
Azure AI Search
Player de Mídia do Azure
Azure AI Video Indexer
Serviço de aplicativo do Azure

Ideias de solução

Esse artigo é uma ideia de solução. Se você quiser que expandamos o conteúdo com mais informações, como possíveis casos de uso, serviços alternativos, considerações de implementação ou diretrizes de preços, informe-nos fornecendo comentários do GitHub.

Essa ideia da solução identifica a fala em arquivos de vídeo estáticos para gerenciar a fala como conteúdo padrão.

Arquitetura

Architecture diagram shows the flow from the source through Azure blob storage and live encoder to the streaming endpoint.

Baixe um Arquivo Visio dessa arquitetura.

Fluxo de dados

  • Armazenamento de Blob do Azure é um serviço para armazenar grandes quantidades de dados não estruturados que podem ser acessados de qualquer lugar do mundo por meio de HTTP ou HTTPS. Você pode usar o Armazenamento de Blob para expor dados publicamente para o mundo ou para armazenar dados do aplicativo de forma privada.
  • ACodificação do Azure converte arquivos de mídia de uma codificação para outra.
  • Um Ponto de extremidade de streaming do Azure representa um serviço de streaming que pode distribuir conteúdo diretamente a um aplicativo player do cliente ou a uma rede de distribuição de conteúdo (CDN) para distribuição posterior.
  • A Rede de Distribuição de Conteúdo fornece uma entrega de conteúdo segura e confiável com amplo alcance global e um conjunto de recursos avançados.
  • OPlayer de Mídia do Azure usa padrões do setor, como HTML5 (MSE/EME) para fornecer uma experiência de streaming adaptável enriquecida. Independentemente da tecnologia de reprodução usada, os desenvolvedores terão uma interface unificada do JavaScript para acessar APIs.
  • O Azure Cognitive Search fornece um serviço pronto para uso que é preenchido com dados e, em seguida, usado para adicionar funcionalidade de pesquisa a um aplicativo Web ou móvel.
  • Os Aplicativos Web hospedam o site ou aplicativo Web.
  • O Azure Media Indexer permite que você torne o conteúdo de seus arquivos de mídia pesquisável e gere uma transcrição de texto completo para legendas codificadas e palavras-chave. Os arquivos de mídia são processados individualmente ou em lotes.

Componentes

  • O Armazenamento de Blobs é um serviço que faz parte do Armazenamento do Azure. O Armazenamento de Blobs oferece armazenamento otimizado de objetos de nuvem para grandes quantidades de dados não estruturados.
  • Os Serviços de Mídia do Azure são uma plataforma baseada em nuvem que você pode usar para transmitir vídeo, aprimorar a acessibilidade e a distribuição e analisar o conteúdo do vídeo.
  • O Streaming ao vivo e sob demanda é um recurso dos Serviços de Mídia do Azure que fornece conteúdo para vários dispositivos em escala.
  • A Codificação do Azure fornece uma maneira de converter arquivos que contêm vídeo digital ou áudio de um formato padrão para outro.
  • O Player de Mídia do Azure reproduz vídeos em vários formatos.
  • A Rede de Distribuição de Conteúdo do Azure oferece uma solução global para fornecer conteúdo rapidamente. Esse serviço fornece aos usuários acesso rápido, confiável e seguro ao conteúdo estático e dinâmico da Web de seus aplicativos.
  • O Azure Cognitive Search é um serviço de pesquisa na nuvem que fornece infraestrutura, APIs e ferramentas para pesquisa. Você pode usar o Azure Cognitive Search para criar experiências de pesquisa em conteúdo privado e heterogêneo em aplicativos Web, móveis e corporativos.
  • O Serviço de Aplicativo fornece uma estrutura para criar, implantar e dimensionar aplicativos Web. O recurso Aplicativos Web é um serviço de hospedagem de aplicativos Web, APIs REST e back-ends móveis.
  • O Azure Media Indexer fornece uma maneira de tornar o conteúdo dos arquivos de mídia pesquisável. Ele também pode gerar uma transcrição de texto completo para legendas e palavras-chave fechadas.

Detalhes do cenário

Uma solução de conversão de fala em texto fornece uma maneira de identificar a fala em arquivos de vídeo estáticos para que você possa gerenciá-la como conteúdo padrão. Por exemplo, os funcionários podem usar essa tecnologia para pesquisar em vídeos de treinamento palavras ou frases faladas. Em seguida, eles podem navegar até o momento específico no vídeo que contém a palavra ou frase.

Ao usar essa solução, você pode carregar vídeos estáticos em um site do Azure. O Azure Media Indexer usa a API de Fala para indexar a fala nos vídeos e armazená-la em um banco de dados do Azure. Você pode pesquisar palavras ou frases usando o recurso Aplicativos Web do Serviço de Aplicativo do Azure. Em seguida, você pode recuperar uma lista de resultados. Ao selecionar um resultado, você pode ver o lugar no vídeo que menciona a palavra ou frase.

Essa solução é criada com base na Rede de Distribuição de Conteúdo dos serviços gerenciados do Azure e no Azure Cognitive Search.

Possíveis casos de uso

Essa solução se aplica a cenários que podem se beneficiar da capacidade de pesquisar fala gravada. Os exemplos incluem:

  • Treinamento e vídeos educativos.
  • Investigações criminais.
  • Análise de atendimento ao cliente.

Próximas etapas