Búsqueda de palabras clave y conversión de voz en texto

Azure Content Delivery Network
Azure AI Search
Azure Media Player
Video Indexer de Azure AI
Azure App Service

Ideas de solución

Este artículo es una idea de solución. Si te gustaría que ampliemos este artículo con más información, como posibles casos de uso, servicios alternativos, consideraciones de implementación o una guía de precios, comunícalo a través de los Comentarios de GitHub.

Esta idea de solución identifica el habla en archivos de vídeo estáticos para administrar la voz como contenido estándar.

Architecture

Architecture diagram shows the flow from the source through Azure blob storage and live encoder to the streaming endpoint.

Descargue un archivo Visio de esta arquitectura.

Flujo de datos

  • Azure Blob Storage almacena grandes cantidades de datos no estructurados a los que puede acceder desde cualquier lugar del mundo a través de HTTP o HTTPS. Puede usar Blob Storage para exponer datos públicamente al mundo, o bien para almacenar los datos de la aplicación de manera privada.
  • La codificación de Azure convierte los archivos multimedia de una codificación a otra.
  • Un punto de conexión de streaming Azure representa un servicio de streaming que puede entregar contenido directamente a una aplicación de reproducción de cliente o a una red de entrega de contenido (CDN) para su posterior distribución.
  • Content Delivery Network: proporciona una entrega de contenido fiable y segura con un amplio alcance global y una gran cantidad de características.
  • Azure Media Player: utiliza estándares del sector, como HTML5 (MSE/EME), para proporcionar una experiencia de streaming adaptable enriquecida. Independientemente de la tecnología de reproducción que se use, tendrá una interfaz JavaScript unificada para acceder a las API.
  • Azure Cognitive Search proporciona un servicio listo para usar que se rellena con datos y, a continuación, se usa para agregar funcionalidad de búsqueda a una aplicación web o móvil.
  • Web Apps hospeda el sitio web o la aplicación web.
  • Azure Media Indexer permite buscar el contenido de sus archivos multimedia y genera una transcripción de texto completo para el subtitulado y las palabras clave. Los archivos multimedia se procesan individualmente o en lotes.

Componentes

  • Blob Storage es un servicio que forma parte de Azure Storage. Blob Storage ofrece almacenamiento optimizado de objetos en la nube para grandes cantidades de datos no estructurados.
  • Azure Media Services es una plataforma basada en la nube que puede utilizar para transmitir vídeo, mejorar la accesibilidad y la distribución y analizar el contenido de vídeo.
  • El streaming en vivo y a petición es una característica de Azure Media Services que entrega contenido a varios dispositivos a escala.
  • La codificación de Azure proporciona una manera de convertir archivos que contienen vídeo digital o audio de un formato estándar a otro.
  • Azure Media Player reproduce vídeos que tienen varios formatos.
  • Azure Content Delivery Network ofrece una solución global para la entrega rápida de contenidos. Este servicio proporciona a los usuarios acceso rápido, confiable y seguro al contenido web estático y dinámico de las aplicaciones.
  • Azure Cognitive Search es un servicio de búsqueda en la nube que proporciona infraestructura, API y herramientas para la búsqueda. Puede usar Azure Cognitive Search para compilar experiencias de búsqueda a partir de contenido privado heterogéneo de aplicaciones web, móviles y empresariales.
  • App Service proporciona un marco para compilar, implementar y escalar aplicaciones web. La característica Web Apps es un servicio para hospedar aplicaciones web, API de REST y servidores back-end para dispositivos móviles.
  • Azure Media Indexer proporciona una manera de hacer que se pueda buscar contenido de los archivos multimedia. También puede generar una transcripción de texto completo para subtítulos y palabras clave.

Detalles del escenario

Una solución de conversión de voz en texto proporciona una manera de identificar la voz en archivos de vídeo estáticos para que pueda administrarla como contenido estándar. Por ejemplo, los empleados pueden usar esta tecnología para buscar vídeos de entrenamiento para palabras o frases habladas. A continuación, pueden navegar hasta el momento específico en el vídeo que contiene la palabra o frase.

Al usar esta solución, puede cargar vídeos estáticos en un sitio web de Azure. El Azure Media Indexer usa Speech API para indexar la voz dentro de los vídeos y la almacena en una base de datos de Azure. Puede buscar palabras o frases mediante la característica Web Apps de Azure App Service. A continuación, puede recuperar una lista de resultados. Al seleccionar un resultado, puede ver el lugar en el vídeo que menciona la palabra o frase.

Esta solución se basa en los servicios administrados de Azure: Content Delivery Network y Azure Cognitive Search.

Posibles casos de uso

Esta solución se aplica a escenarios que pueden beneficiarse de la capacidad de buscar voz grabada. Entre los ejemplos se incluyen:

  • Vídeos educativos y de formación.
  • Investigaciones criminales.
  • Análisis del servicio al cliente.

Pasos siguientes