Opciones de configuración de indexación

2025-06-09

Puede usar la configuración de indexación predeterminada o puede ajustarlas. Puede elegir el lenguaje, la indexación, los modelos personalizados y la configuración de streaming que tienen implicaciones en la información generada, el costo y el rendimiento.

En este artículo se explica cada una de las opciones. Se aplican las mismas opciones al usar el sitio web de Azure AI Video Indexer que para usar la API (consulte la guía de API). Al indexar grandes volúmenes, siga la guía a escala.

Configuración predeterminada

De forma predeterminada, Video Indexer de Azure AI está configurado como:

Idioma de origen: inglés.
Privacidad: privada
Configuración de audio y vídeo: estándar
Calidad de streaming: velocidad de bits única

Idioma de origen del vídeo

Si conoce el idioma que se habla en el vídeo, selecciónelo en la lista de idiomas de origen del vídeo. Si no está seguro del idioma del vídeo, elija Detección automática de un solo idioma. Video Indexer de Azure AI usa la identificación del idioma (LID) para detectar el idioma de los vídeos y generar transcripciones e información con el idioma detectado.

Si el vídeo contiene varios idiomas y no está seguro de cuáles, seleccione Detección automática de varios idiomas. En este caso, se aplica la detección de varios idiomas (MLID) al cargar e indexar el vídeo.

Aunque la detección automática es una excelente opción cuando el idioma de los vídeos varía, hay dos puntos que se deben tener en cuenta al usar LID o MLID:

LID/MLID no admite todos los idiomas admitidos por Video Indexer de Azure AI.
La transcripción es de mayor calidad cuando se preselecciona el idioma adecuado del vídeo.

Obtenga más información sobre la compatibilidad con los idiomas y los idiomas admitidos.

Privacidad

Esta opción le permite determinar si la información solo debe ser accesible para los usuarios de la cuenta de Azure AI Video Indexer o para cualquier persona con un vínculo.

Opciones de indexación

Cada una de las opciones de indexación de audio y vídeo puede tener un precio diferente al usar la configuración de indexación predeterminada. Consulte los precios de Video Indexer de Azure AI para más detalles.

A continuación se muestran las opciones de tipo de indexación con los detalles de sus conclusiones proporcionadas. Para modificar el tipo de indexación, seleccione Configuración avanzada.

Nota:

El reconocimiento óptico de caracteres (OCR) se utiliza con varios tipos de análisis.

Configuración avanzada

Al seleccionar Configuración avanzada, puede elegir las siguientes opciones:

Solo sonido

Básico: indexa y extrae información usando solo audio (ignorando vídeo) y proporciona las siguientes conclusiones:
- Transcripción
- Traducción
- Formato de los subtítulos de salida (subtítulos)
Estándar: indexa y extrae información mediante solo audio (ignorando vídeo) y proporciona las siguientes conclusiones:
- Transcripción
- Traducción
- Formato de los subtítulos de salida (subtítulos)
- Detección automática de idioma
- Emociones
- Palabras clave
- Entidades con nombre (marcas, ubicaciones, personas)
- Sentimientos
- Altavoces
- Extracción de temas
- Moderación de contenido textual
Avanzado: indexa y extrae información mediante solo audio (ignorando vídeo) y proporciona las siguientes conclusiones:
- Transcripción
- Traducción
- Formato de los subtítulos de salida (subtítulos)
- Detección automática de idioma
- Detección de eventos de audio
- Emociones
- Palabras clave
- Entidades con nombre (marcas, ubicaciones, personas)
- Sentimientos
- Altavoces
- Extracción de temas
- Moderación de contenido textual

Solo vídeo

Básico: indexa y extrae información usando solo vídeo (ignorando audio) y proporciona las siguientes conclusiones:
- Etiquetas
- Detección de objetos
- Reconocimiento Óptico de Caracteres (OCR)
- Escenas (fotogramas clave y capturas)
- Detección de fotogramas negros
Estándar: indexa y extrae información usando solo vídeo (ignorando audio) y proporciona las siguientes conclusiones:
- Etiquetas (OCR)
- Entidades con nombre (OCR: marcas, ubicaciones, personas)
- Reconocimiento Óptico de Caracteres (OCR)
- Personas
- Escenas (fotogramas clave y capturas)
- Marco negro
- Moderación de contenido visual
- Extracción de temas (OCR)
Avanzado: indexa y extrae información usando solo vídeo (ignorando audio) y proporciona las siguientes conclusiones:
- Etiquetas (OCR)
- Persona coincidente
- Entidades con nombre (OCR: marcas, ubicaciones, personas)
- Reconocimiento Óptico de Caracteres (OCR)
- Personas observadas
- Personas
- Escenas (fotogramas clave y capturas)
- Detección de claqueta
- Detección de patrones digitales
- Información de ropa destacada
- Detección de careta sin texto
- Detección de logotipos de texto
- Marco negro
- Moderación de contenido visual
- Extracción de temas (OCR)

Audio y vídeo

Básico: indexa y extrae información mediante audio y vídeo y proporciona las siguientes conclusiones:
- Transcripción
- Traducción
- Formato de los subtítulos de salida (subtítulos)
- Detección de objetos
- Reconocimiento Óptico de Caracteres (OCR)
- Escenas (fotogramas clave y capturas)
- Marco negro
Estándar: indexa y extrae información mediante audio y vídeo y proporciona las siguientes conclusiones:
- Transcripción
- Traducción
- Formato de los subtítulos de salida (subtítulos)
- Detección automática de idioma
- Emociones
- Palabras clave
- Entidades con nombre (marcas, ubicaciones, personas)
- Reconocimiento Óptico de Caracteres (OCR)
- Escenas (fotogramas clave y capturas)
- Marco negro
- Moderación de contenido visual
- Personas
- Sentimientos
- Altavoces
- Extracción de temas
- Moderación de contenido textual
Avanzado: indexa y extrae información mediante audio y vídeo y proporciona las siguientes conclusiones:
- Transcripción
- Traducción
- Formato de los subtítulos de salida (subtítulos)
- Detección automática de idioma
- Moderación de contenido textual
- Detección de eventos de audio
- Emociones
- Palabras clave
- Persona coincidente
- Entidades con nombre (marcas, ubicaciones, personas)
- Reconocimiento Óptico de Caracteres (OCR)
- Personas observadas
- Personas
- Detección de claqueta
- Detección de patrones digitales
- Información de ropa destacada
- Detección de careta sin texto
- Sentimientos
- Altavoces
- Escenas (fotogramas clave y capturas)
- Detección de logotipos de texto
- Marco negro
- Moderación de contenido visual
- Extracción de temas

Opciones de calidad de streaming

Hay dos opciones para transmitir vídeos indexados:

Tasa de bits única: si el alto del vídeo es mayor o igual que 720p HD, Video Indexer de Azure AI lo codifica con una resolución de 1280 x 720. De lo contrario, se codifica como 640 x 468.
Sin streaming: se generan conclusiones, pero no se realiza ninguna operación de streaming y el vídeo no está disponible en el sitio web de Azure AI Video Indexer. Cuando no hay streaming seleccionado, no se le factura por codificación.

Excluir modelos

Puede excluir modelos al indexar mediante el sitio web y la API vi. Al cargar un vídeo para indexar mediante el sitio web, seleccione Configuración>avanzada Valores preestablecidos de indexación y, a continuación, seleccione los modelos de IA que se excluirán de los resultados de la indexación. Puede habilitar una indexación más eficiente y solo los resultados de Inteligencia Visual (VI) que contengan las percepciones que le interesan.

Personalización de modelos de contenido

Video Indexer de Azure AI permite personalizar algunos de sus modelos para adaptarlos a su caso de uso específico. Estos modelos incluyen marcas, idioma, persona y voz.

Información y almacenamiento multimedia

En las secciones siguientes se explica cómo se almacenan las conclusiones y los medios en Video Indexer de Azure AI.

Almacenamiento de información

Toda la información de indexación y los metadatos se mantienen en las cuentas de almacenamiento administradas por VI y no se le cobra por este almacenamiento.

Almacenamiento multimedia

La cuenta VI está conectada a una cuenta de Azure Storage. Puede controlar y pagar por el uso de esta cuenta de almacenamiento. Los archivos siguientes se almacenan en esta cuenta cuando se indexa un vídeo:

El archivo de origen. Se guarda en caso de que quiera volver a indexar el video en el futuro.
Nuevo archivo codificado cuando la calidad de streaming se establece en una velocidad de bits única.

Eliminar medios

Los medios indexados y todos sus archivos y conclusiones asociados se pueden eliminar de tres maneras:

Elimine los archivos con el portal de Video Indexer.
Use una solicitud Delete Video o Delete Video Source File API.
Si no necesita mantener el archivo multimedia original en el almacenamiento, al usar la API, establezca el retentionPeriod parámetro en entre 1 y 7. El vídeo indizado y todo lo relacionado con él, el archivo de origen, la información, etc. se eliminan de 1 a 7 días después de la indexación.

Documentación del indexador de videos de Azure AI