Guía de configuración de indexación
Puede usar la configuración de indexación predeterminada o ajustarla. Puede elegir el lenguaje, la indexación, los modelos personalizados y la configuración de streaming que tienen implicaciones en la información generada, el costo y el rendimiento.
En este artículo se explica cada una de las opciones. Se aplican las mismas opciones al usar el sitio web de Azure AI Video Indexer que para usar la API (consulte la guía de API). Al indexar grandes volúmenes, siga la guía a escala.
Configuración predeterminada
De forma predeterminada, Video Indexer de Azure AI está configurado como:
- Idioma de origen: inglés.
- Privacidad: privada
- Configuración de audio y vídeo: estándar
- Calidad de streaming: velocidad de bits única
Idioma de origen del vídeo
Si conoce el idioma que se habla en el vídeo, selecciónelo en la lista de idiomas de origen del vídeo. Si no está seguro del idioma del vídeo, elija Detección automática de un solo idioma. Video Indexer de Azure AI usa la identificación del idioma (LID) para detectar el idioma de los vídeos y generar transcripciones e información con el idioma detectado.
Si el vídeo contiene varios idiomas y no está seguro de cuáles, seleccione Detección automática de varios idiomas. En este caso, se aplica la detección de varios idiomas (MLID) al cargar e indexar el vídeo.
Aunque la detección automática es una excelente opción cuando el idioma de los vídeos varía, hay dos puntos que se deben tener en cuenta al usar LID o MLID:
- LID/MLID no admite todos los idiomas admitidos por Video Indexer de Azure AI.
- La transcripción es de mayor calidad cuando se preselecciona el idioma adecuado del vídeo.
Obtenga más información sobre la compatibilidad con los idiomas y los idiomas admitidos.
Privacidad
Esta opción le permite determinar si la información solo debe ser accesible para los usuarios de la cuenta de Azure AI Video Indexer o para cualquier persona con un vínculo.
Opciones de indexación
Cada una de las opciones de indexación de audio y vídeo puede tener un precio diferente al usar la configuración de indexación predeterminada. Consulte Precios de Video Indexer de Azure AI para más información.
A continuación se muestran las opciones de tipo de indexación con los detalles de sus conclusiones proporcionadas. Para modificar el tipo de indexación, seleccione Configuración avanzada.
Nota:
El reconocimiento óptico de caracteres (OCR) se usa con varios tipos de información.
Configuración avanzada
Solo audio
- Básico: indexa y extrae información usando solo audio (ignorando vídeo) y proporciona las siguientes conclusiones: transcripción, traducción, formato de subtítulos y subtítulos (subtítulos).
- Estándar: indexa y extrae información usando solo audio (ignorando vídeo) y proporciona las siguientes conclusiones: transcripción, traducción, formato de subtítulos y subtítulos (subtítulos), detección automática de idioma, emociones, palabras clave, entidades con nombre (marcas, ubicaciones, personas), opiniones, hablantes, extracción de temas y modo carpa ration textual.
- Avanzado: indexa y extrae información usando solo audio (ignorando vídeo) y proporciona las siguientes conclusiones: transcripción, traducción, formato de subtítulos y subtítulos (subtítulos), detección automática de idioma, detección automática de eventos de audio, emociones, palabras clave, entidades con nombre (marcas, ubicaciones, personas), opiniones, oradores, extracción de temas y contaxis textual modo carpa ration.
Solo vídeo
- Básico: indexa y extrae información usando solo vídeo (ignorando audio) y proporciona las siguientes conclusiones: etiquetas, detección de objetos, OCR, escenas (fotogramas clave y capturas) y detección de fotogramas negros.
- Estándar: indexa y extrae información usando solo vídeo (ignorando audio) y proporciona las siguientes conclusiones: etiquetas (OCR), entidades con nombre (OCR: marcas, ubicaciones, personas), OCR, personas, escenas (fotogramas clave y capturas), marcos negros, con modo carpa ration y extracción de temas (OCR).
- Avanzado: indexa y extrae información usando solo vídeo (ignorando audio) y proporciona las siguientes conclusiones: etiquetas (OCR), persona coincidente, entidades con nombre (OCR : marcas, ubicaciones, personas), OCR, personas observadas, personas, escenas (fotogramas clave y disparos), detección de tableros de clapper, detección de patrones digitales, información de ropa destacada, detección de pizarra sin texto, detección de logotipos textuales, marcos negros,modo carpa conration y extracción de temas (OCR).
Audio y vídeo
- Básico: indexa y extrae información mediante audio y vídeo y proporciona las siguientes conclusiones: transcripción, traducción, formato de subtítulos y subtítulos (subtítulos), detección de objetos, OCR, escenas (fotogramas clave y capturas) y marcos negros.
- Estándar: indexa y extrae información mediante audio y vídeo y proporciona las siguientes conclusiones: transcripción, traducción, formato de subtítulos y subtítulos (subtítulos), detección automática de idioma, emociones, palabras clave, entidades con nombre (marcas, ubicaciones, personas), OCR, escenas (fotogramas clave y capturas), marcos negros, con modo carpa ration, personas, opiniones, hablantes, extracción de temas y texto conmodo carpa ration.
- Avanzado: indexa y extrae información mediante audio y vídeo y proporciona las siguientes conclusiones: transcripción, traducción, formato de subtítulos y subtítulos (subtítulos), detección automática de idioma, textual con modo carpa ration, detección de eventos de audio, emociones, palabras clave, persona coincidente, entidades con nombre (marcas, ubicaciones, personas), OCR, personas observadas, personas observadas, detección de patrones digitales, detección de patrones digitales, ropa destacada insight, detección de pizarra sin texto, opiniones, altavoces, escenas (fotogramas clave y capturas), detección de logotipos textuales, marcos negros, con modo carpa ration visual y extracción de temas.
Opciones de calidad de streaming
Hay dos opciones para transmitir vídeos indexados:
- Velocidad de bits única: si el alto del vídeo es mayor o igual que 720p HD, Video Indexer de Azure AI lo codifica con una resolución de 1280 x 720. De lo contrario, se codifica como 640 x 468.
- Sin streaming: se generan conclusiones, pero no se realiza ninguna operación de streaming y el vídeo no está disponible en el sitio web de Azure AI Video Indexer. Cuando se selecciona Sin streaming, no se le factura la codificación.
Excluir modelos
Puede excluir modelos al indexar mediante el sitio web y la API vi. Al cargar un vídeo para indexar mediante el sitio web, seleccione Configuración>avanzada Valores preestablecidos de indexación y, a continuación, seleccione los modelos de IA que se excluirán de los resultados de la indexación. Esto puede permitir la indexación más eficaz y los resultados vi solo que contienen la información que le interesa.
Personalización de modelos de contenido
Video Indexer de Azure AI permite personalizar algunos de sus modelos para adaptarlos a su caso de uso específico. Estos modelos incluyen marcas, idioma, persona y voz.
Información y almacenamiento multimedia
Almacenamiento de información
Toda la información de indexación y los metadatos se mantienen en las cuentas de almacenamiento administradas por VI y no se le cobra por este almacenamiento.
Almacenamiento multimedia
La cuenta VI está conectada a una cuenta de Azure Storage. Puede controlar y pagar por el uso de esta cuenta de almacenamiento. Los archivos siguientes se almacenan en esta cuenta cuando se indexa un vídeo:
- El archivo de origen. Se mantiene en caso de que quiera volver a indexar el vídeo en el futuro.
- Nuevo archivo codificado cuando la calidad de streaming se establece en una velocidad de bits única.
Eliminación de medios
Los medios indexados y todos sus archivos y conclusiones asociados se pueden eliminar de tres maneras:
- Elimine los archivos con el portal de Video Indexer.
- Use la solicitud Eliminar vídeo o Eliminar archivo de origen de vídeo.
- Si no necesita mantener el archivo multimedia original en el almacenamiento, al usar la API, establezca el
retentionPeriod
parámetro en entre 1 y 7. El vídeo indizado y todo lo relacionado con él, el archivo de origen, la información, etc. se eliminan de 1 a 7 días después de la indexación.