Editar

Pesquisa de palavras-chave e conversão de voz em texto

Azure Content Delivery Network
Azure AI Search
Azure Media Player
Azure AI Video Indexer
Azure App Service

Ideias de soluções

Este artigo é uma ideia de solução. Se você quiser que expandamos o conteúdo com mais informações, como possíveis casos de uso, serviços alternativos, considerações de implementação ou orientação de preços, informe-nos fornecendo feedback do GitHub.

Esta ideia de solução identifica a fala em arquivos de vídeo estáticos para gerenciar a fala como conteúdo padrão.

Arquitetura

O diagrama de arquitetura mostra o fluxo da origem por meio do armazenamento de blob do Azure e do codificador ao vivo para o ponto de extremidade de streaming

Transfira um ficheiro do Visio desta arquitetura.

Fluxo de dados

  • O Armazenamento de Blobs do Azure armazena grandes quantidades de dados não estruturados que podem ser acessados de qualquer lugar do mundo via HTTP ou HTTPS. Você pode usar o Armazenamento de Blob para expor dados publicamente ao mundo ou para armazenar dados de aplicativos de forma privada.
  • O Azure Encoding converte arquivos de mídia de uma codificação para outra.
  • O ponto de extremidade de streaming do Azure representa um serviço de streaming que pode entregar conteúdo diretamente a um aplicativo de player cliente ou a uma rede de entrega de conteúdo para distribuição posterior.
  • A Content Delivery Network fornece entrega de conteúdo segura e confiável com amplo alcance global e um rico conjunto de recursos.
  • O Azure Media Player usa padrões do setor, como HTML5 (MSE/EME) para fornecer uma experiência de streaming adaptável enriquecida. Independentemente da tecnologia de reprodução usada, você tem uma interface JavaScript unificada para acessar APIs.
  • A Pesquisa Cognitiva do Azure fornece um serviço pronto a utilizar que é preenchido com dados e, em seguida, utilizado para adicionar funcionalidade de pesquisa a uma aplicação Web ou móvel.
  • As Aplicações Web alojam o Web site ou a aplicação Web.
  • O Azure Media Indexer torna o conteúdo dos seus ficheiros multimédia pesquisável e gera uma transcrição de texto completo para legendas ocultas e palavras-chave. Os arquivos de mídia são processados individualmente ou em lotes.

Componentes

  • O Armazenamento de Blobs é um serviço que faz parte do Armazenamento do Azure. O Blob Storage oferece armazenamento otimizado de objetos na nuvem para grandes quantidades de dados não estruturados.
  • Os Serviços de Multimédia do Azure são uma plataforma baseada na nuvem que pode utilizar para transmitir vídeo, melhorar a acessibilidade e a distribuição e analisar conteúdo de vídeo.
  • O streaming ao vivo e sob demanda é um recurso dos Serviços de Mídia do Azure que fornece conteúdo para vários dispositivos em escala.
  • A Codificação do Azure fornece uma maneira de converter arquivos que contêm vídeo ou áudio digital de um formato padrão para outro.
  • O Azure Media Player reproduz vídeos em vários formatos.
  • A Rede de Entrega de Conteúdo do Azure oferece uma solução global para a entrega rápida de conteúdo. Este serviço fornece aos seus utilizadores um acesso rápido, fiável e seguro ao conteúdo Web estático e dinâmico das suas aplicações.
  • A Pesquisa Cognitiva do Azure é um serviço de pesquisa na nuvem que fornece infraestrutura, APIs e ferramentas para pesquisa. Pode utilizar a Pesquisa Cognitiva do Azure para criar experiências de pesquisa sobre conteúdo privado e heterogéneo em aplicações Web, móveis e empresariais.
  • O Serviço de Aplicativo fornece uma estrutura para criar, implantar e dimensionar aplicativos Web. O recurso Aplicativos Web é um serviço para hospedar aplicativos Web, APIs REST e back-ends móveis.
  • O Azure Media Indexer fornece uma maneira de tornar o conteúdo de seus arquivos de mídia pesquisável. Também pode gerar uma transcrição de texto completo para legendas ocultas e palavras-chave.

Detalhes do cenário

Uma solução de conversão de fala em texto fornece uma maneira de identificar a fala em arquivos de vídeo estáticos para que você possa gerenciá-la como conteúdo padrão. Por exemplo, os funcionários podem usar essa tecnologia para pesquisar em vídeos de treinamento por palavras ou frases faladas. Em seguida, eles podem navegar até o momento específico no vídeo que contém a palavra ou frase.

Quando utiliza esta solução, pode carregar vídeos estáticos para um Web site do Azure. O Indexador de Mídia do Azure usa a API de Fala para indexar a fala nos vídeos e a armazena em um banco de dados do Azure. Você pode pesquisar palavras ou frases usando o recurso Aplicativos Web do Serviço de Aplicativo do Azure. Em seguida, você pode recuperar uma lista de resultados. Ao selecionar um resultado, você pode ver o local no vídeo que menciona a palavra ou frase.

Esta solução baseia-se na Rede de Entrega de Conteúdo dos serviços geridos do Azure e na Pesquisa Cognitiva do Azure.

Potenciais casos de utilização

Esta solução aplica-se a cenários que podem beneficiar da capacidade de pesquisar voz gravada. Exemplos incluem:

  • Vídeos de formação e educativos.
  • Investigações criminais.
  • Análise de atendimento ao cliente.

Próximos passos