Поделиться через


Параметры конфигурации индексирования

Вы можете использовать параметры индексирования по умолчанию или настроить их. Вы можете выбрать язык, индексирование, пользовательские модели и параметры потоковой передачи, которые влияют на аналитические сведения, созданные, затраты и производительность.

В этой статье описаны все варианты. Те же параметры применяются при использовании веб-сайта Azure AI Video Indexer, как и для использования API (см. руководство по API). При индексировании больших томов следуйте руководству на масштабном уровне.

Параметры по умолчанию

По умолчанию индексатор видео Azure AI настроен следующим образом:

  • Исходный язык: английский
  • Конфиденциальность: частная
  • Настройка аудио и видео: стандартный
  • Качество потоковой передачи: однократная скорость

Исходный язык видео

Если вы знаете язык, который говорился в видео, выберите язык из списка исходного видео. Если вы не уверены в языке видео, выберите автоматическое обнаружение одного языка. Индексатор видео Azure AI использует идентификацию языка (LID) для обнаружения языка видео и создания транскрибирования и аналитических сведений с обнаруженным языком.

Если видео содержит несколько языков, и вы не уверены, какие из них, выберите автоматическое обнаружение нескольких языков. В этом случае при отправке и индексировании видео применяется определение нескольких языков (MLID).

Хотя автоматическое определение является отличным вариантом, когда язык в видео отличается, при использовании LID или MLID следует учитывать два пункта:

  • LID/MLID не поддерживает все языки, поддерживаемые Индексатором видео Azure AI.
  • Транскрибирование имеет более высокое качество при предварительном выборе соответствующего языка видео.

Дополнительные сведения о поддержке языка и поддерживаемых языках.

Конфиденциальность

Этот параметр позволяет определить, должна ли аналитика быть доступна только пользователям в учетной записи Индексатора видео Azure AI или любому пользователю со ссылкой.

Параметры индексирования

При использовании параметров индексирования по умолчанию каждый из вариантов индексирования аудио и видео может быть по-разному оценен. См. подробную информацию о ценах на индексатор видео Azure AI.

Ниже приведены параметры типа индексирования с подробными сведениями об их аналитических сведениях. Чтобы изменить тип индексирования, выберите дополнительные параметры.

Примечание.

Оптическое распознавание символов (OCR) используется с несколькими типами аналитических сведений.

Расширенные настройки

При выборе дополнительных параметров можно выбрать следующие параметры:

Только аудиоданные

  • Базовый: индексирует и извлекает аналитические сведения только с помощью звука (игнорируя видео) и предоставляет следующие аналитические сведения:
    • Расшифровка
    • Перевод текста
    • Форматирование заголовков выходных данных и субтитров (закрытые субтитры)
  • Стандартный: индексирует и извлекает аналитические сведения только с помощью звука (игнорируя видео) и предоставляет следующие аналитические сведения:
    • Расшифровка
    • Перевод текста
    • Форматирование заголовков выходных данных и субтитров (закрытые субтитры)
    • Автоматическое распознавание языка
    • Эмоции
    • Ключевые слова
    • Именованные сущности (бренды, места, личности)
    • Чувства
    • Докладчики
    • Извлечение темы
    • Модерация текстового содержимого
  • Дополнительно: индексирует и извлекает аналитические сведения только с помощью звука (игнорируя видео) и предоставляет следующие аналитические сведения:
    • Расшифровка
    • Перевод текста
    • Форматирование заголовков выходных данных и субтитров (закрытые субтитры)
    • Автоматическое распознавание языка
    • Обнаружение звуковых событий
    • Эмоции
    • Ключевые слова
    • Именованные сущности (бренды, места, личности)
    • Чувства
    • Докладчики
    • Извлечение темы
    • Модерация текстового содержимого

Только видео

  • Базовый: индексирует и извлекает аналитические сведения только с помощью видео (игнорирует звук) и предоставляет следующие аналитические сведения:
    • Наклейки
    • Обнаружение объектов
    • оптическое распознавание символов (OCR)
    • Сцены (ключевые кадры и снимки)
    • Обнаружение черных кадров
  • Стандартный: индексирует и извлекает аналитические сведения только с помощью видео (игнорируя звук) и предоставляет следующие аналитические сведения:
    • Метки (OCR)
    • Именованные объекты (OCR — бренды, локации, люди)
    • оптическое распознавание символов (OCR)
    • Люди
    • Сцены (ключевые кадры и снимки)
    • Черные рамки
    • Модерация визуального содержимого
    • Извлечение разделов (OCR)
  • Дополнительно: индексирует и извлекает аналитические сведения только с помощью видео (игнорируя звук) и предоставляет следующие аналитические сведения:
    • Метки (OCR)
    • Сопоставленный человек
    • Именованные объекты (OCR — бренды, локации, люди)
    • оптическое распознавание символов (OCR)
    • Наблюдаемые люди
    • Люди
    • Сцены (ключевые кадры и снимки)
    • Обнаружение хлопушки
    • Обнаружение цифровых шаблонов
    • Полезные сведения о одежде
    • Обнаружение безтекстового листа
    • Обнаружение текстового логотипа
    • Черные рамки
    • Модерация визуального содержимого
    • Извлечение разделов (OCR)

Звук и видео

  • Базовый: индексирует и извлекает аналитические сведения с помощью аудио и видео и предоставляет следующие аналитические сведения:
    • Расшифровка
    • Перевод текста
    • Форматирование заголовков выходных данных и субтитров (закрытые субтитры)
    • Обнаружение объектов
    • оптическое распознавание символов (OCR)
    • Сцены (ключевые кадры и снимки)
    • Черные рамки
  • Стандартный: индексирует и извлекает аналитические сведения с помощью аудио и видео и предоставляет следующие аналитические сведения:
    • Расшифровка
    • Перевод текста
    • Форматирование заголовков выходных данных и субтитров (закрытые субтитры)
    • Автоматическое распознавание языка
    • Эмоции
    • Ключевые слова
    • Именованные сущности (бренды, места, личности)
    • оптическое распознавание символов (OCR)
    • Сцены (ключевые кадры и снимки)
    • Черные рамки
    • Модерация визуального содержимого
    • Люди
    • Чувства
    • Докладчики
    • Извлечение темы
    • Модерация текстового содержимого
  • Дополнительно: индексирует и извлекает аналитические сведения с помощью аудио и видео и предоставляет следующие аналитические сведения:
    • Расшифровка
    • Перевод текста
    • Форматирование заголовков выходных данных и субтитров (закрытые субтитры)
    • Автоматическое распознавание языка
    • Модерация текстового содержимого
    • Обнаружение звуковых событий
    • Эмоции
    • Ключевые слова
    • Сопоставленный человек
    • Именованные сущности (бренды, места, личности)
    • оптическое распознавание символов (OCR)
    • Наблюдаемые люди
    • Люди
    • Обнаружение хлопушки
    • Обнаружение цифровых шаблонов
    • Полезные сведения о одежде
    • Обнаружение безтекстового листа
    • Чувства
    • Докладчики
    • Сцены (ключевые кадры и снимки)
    • Обнаружение текстового логотипа
    • Черные рамки
    • Модерация визуального содержимого
    • Извлечение темы

Параметры качества потоковой передачи

Существует два варианта потоковой передачи индексированных видео:

  • Единая скорость: если высота видео больше или равна 720p HD, индексатор видео Azure AI кодирует его с разрешением 1280 x 720. В противном случае оно будет кодироваться с разрешением 640 x 468.
  • Нет потоковой передачи: аналитические данные создаются, но потоковая передача не выполняется, и видео недоступно на веб-сайте сервиса Индексатор видео Azure. Если потоковая передача не выбрана, плата за кодировку не взимается.

Исключить модели

Можно исключить модели при индексировании с помощью веб-сайта VI и API. При отправке видео для индексирования с помощью веб-сайта выберите предустановки расширенных параметров>индексирования, а затем выберите модели ИИ, которые будут исключены из результатов индексирования. Он может включить более эффективное индексирование и результаты VI, содержащие только интересующие вас аналитические сведения.

Настройка моделей содержимого

Индексатор видео Azure позволяет настроить некоторые модели для адаптации к конкретному варианту использования. К этим моделям относятся бренды, язык, человек и речь.

Аналитика и хранилище мультимедиа

В следующих разделах объясняется, как аналитика и мультимедиа хранятся в системе Azure AI Video Indexer.

Хранилище аналитических сведений

Все аналитические сведения и метаданные индексирования хранятся в учетных записях хранения, управляемых VI, и плата за это хранилище не взимается.

Хранилище медиа

Ваша учетная запись VI подключена к учетной записи службы хранилища Azure. Вы контролируете и оплачиваете использование этой учетной записи хранения. Следующие файлы хранятся в этой учетной записи при индексировании видео:

  • Исходный файл. Он сохраняется в случае, если вы хотите переиндексировать видео в будущем.
  • Новый закодированный файл, если для качества потоковой передачи задано однократное значение битовой скорости.

Удаление носителя

Индексированный носитель и все связанные с ним файлы и аналитические сведения можно удалить тремя способами:

  • Удалите файлы через портал Индексатор видео.
  • Используйте запрос API " Удалить видео" или " Удалить исходный файл видео ".
  • Если исходный файл мультимедиа не требуется хранить в хранилище, при использовании API задайте retentionPeriod для параметра значение от 1 до 7. Индексированное видео и все, связанное с ним, исходный файл, аналитические сведения и т. д. удаляются через 1–7 дней после индексирования.