Ricerca di parole chiave e riconoscimento vocale in testo

Rete per la distribuzione di contenuti di Azure
Ricerca di intelligenza artificiale di Azure
Azure Media Player
Video Indexer di Azure AI
Servizio app di Azure

Idee per le soluzioni

Questo articolo descrive un'idea di soluzione. L'architetto cloud può usare queste linee guida per visualizzare i componenti principali per un'implementazione tipica di questa architettura. Usare questo articolo come punto di partenza per progettare una soluzione ben progettata in linea con i requisiti specifici del carico di lavoro.

Questa soluzione identifica la voce nei file video statici per gestire la voce come contenuto standard.

Architettura

Diagramma dell'architettura che mostra il flusso dall'origine tramite l'archiviazione BLOB di Azure e il codificatore live all'endpoint di streaming

Scaricare un file di Visio di questa architettura.

Flusso di dati

  • Archiviazione BLOB di Azure archivia grandi quantità di dati non strutturati a cui è possibile accedere da qualsiasi parte del mondo tramite HTTP o HTTPS. È possibile usare l'archiviazione BLOB per esporre i dati pubblicamente al mondo o per archiviare i dati dell'applicazione privatamente.
  • Codifica di Azure converte i file multimediali da una codifica a un'altra.
  • L'endpoint di streaming di Azure rappresenta un servizio di streaming in grado di distribuire contenuto direttamente a un'applicazione lettore client o a una rete per la distribuzione di contenuti per un'ulteriore distribuzione.
  • rete per la distribuzione di contenuti offre una distribuzione sicura e affidabile di contenuti con ampia copertura globale e un set di funzionalità avanzato.
  • Azure Lettore multimediale usa standard di settore, ad esempio HTML5 (MSE/EME) per offrire un'esperienza di streaming adattiva arricchita. Indipendentemente dalla tecnologia di riproduzione usata, è disponibile un'interfaccia JavaScript unificata per accedere alle API.
  • Ricerca cognitiva di Azure fornisce un servizio pronto all'uso che viene popolato con i dati e quindi usato per aggiungere funzionalità di ricerca a un'applicazione Web o per dispositivi mobili.
  • App Web ospita il sito Web o l'applicazione Web.
  • Azure Media Indexer rende il contenuto dei file multimediali ricercabili e genera una trascrizione full-text per sottotitoli e parole chiave. I file multimediali vengono elaborati singolarmente o in batch.

Componenti

  • Archiviazione BLOB è un servizio che fa parte di Archiviazione di Azure. Archiviazione BLOB offre l'archiviazione ottimizzata di oggetti cloud per grandi quantità di dati non strutturati.
  • Lo streaming live e on demand è una funzionalità di Servizi multimediali di Azure che distribuisce contenuto a vari dispositivi su larga scala.
  • La codifica di Azure consente di convertire file contenenti video digitali o audio da un formato standard a un altro.
  • Azure Lettore multimediale riproduce video in diversi formati.
  • Azure rete per la distribuzione di contenuti offre una soluzione globale per la distribuzione rapida di contenuti. Questo servizio offre agli utenti l'accesso rapido, affidabile e sicuro al contenuto Web statico e dinamico delle app.
  • Ricerca cognitiva di Azure è un servizio di ricerca cloud che fornisce infrastruttura, API e strumenti per la ricerca. È possibile usare Ricerca cognitiva di Azure per creare esperienze di ricerca su contenuti privati, eterogenei nelle applicazioni Web, per dispositivi mobili e aziendali.
  • servizio app fornisce un framework per la compilazione, la distribuzione e il ridimensionamento delle app Web. La funzionalità App Web è un servizio per l'hosting di applicazioni Web, API REST e back-end per dispositivi mobili.
  • Azure Media Indexer consente di rendere ricercabile il contenuto dei file multimediali. Può anche generare una trascrizione full-text per sottotitoli e parole chiave.

Dettagli dello scenario

Una soluzione di riconoscimento vocale consente di identificare la voce nei file video statici in modo da poterla gestire come contenuto standard. Ad esempio, i dipendenti possono usare questa tecnologia per eseguire ricerche all'interno di video di formazione per parole o frasi pronunciate. Quindi possono passare al momento specifico nel video che contiene la parola o la frase.

Quando si usa questa soluzione, è possibile caricare video statici in un sito Web di Azure. Azure Media Indexer usa l'API Voce per indicizzare la voce all'interno dei video e archiviarla in un database di Azure. È possibile cercare parole o frasi usando la funzionalità App Web del servizio app Azure. È quindi possibile recuperare un elenco di risultati. Quando si seleziona un risultato, è possibile visualizzare la posizione nel video che menziona la parola o la frase.

Questa soluzione si basa sui servizi gestiti di Azure rete per la distribuzione di contenuti e Ricerca cognitiva di Azure.

Potenziali casi d'uso

Questa soluzione si applica agli scenari che possono trarre vantaggio dalla possibilità di eseguire ricerche vocali registrate. Alcuni esempi:

  • Video didattici e di formazione.
  • Indagini sul crimine.
  • Analisi del servizio clienti.

Passaggi successivi