Извлечение ключевых слов

Внимание

Из-за объявления об Службы мультимедиа Azure выхода на пенсию Индексатор видео Azure объявляет корректировки функций Индексатора видео Azure. Ознакомьтесь с изменениями, связанными с выходом на пенсию службы мультимедиа Azure (AMS), чтобы понять, что это означает для учетной записи Индексатора видео Azure. Ознакомьтесь с руководством по обновлению и миграции AMS: VI.

Извлечение ключевых слов — это функция ИИ Индексатора видео Azure, которая автоматически обнаруживает аналитические сведения о различных ключевое слово, рассмотренных в файлах мультимедиа. Извлечение ключевых слов может извлекать аналитические сведения как в файлах мультимедиа с одним языком, так и с несколькими языками. Общее количество извлеченных ключевое слово и их категорий перечислены на вкладке Аналитика, где щелкните ключевое слово и нажмите кнопку "Воспроизвести предыдущий" или "Далее" переходы к ключевое слово в файле мультимедиа.

Необходимые компоненты

Обзор заметки о прозрачности

Общие принципы

В этой статье рассматриваются ключевые слова и ключевые рекомендации по использованию этой технологии ответственно. При принятии решения о том, как использовать и реализовать функцию СИ, необходимо учитывать многое:

  • Будет ли эта функция хорошо работать в моем сценарии? Прежде чем развертывать извлечение ключевых слов в своем сценарии, проверьте, как она выполняется с помощью данных реального времени и убедитесь, что она может обеспечить необходимую точность.
  • Есть ли возможности для обнаружения ошибок и реагирования на них? Продукты и функции, на основе искусственного интеллекта, не будут точными на 100%, поэтому рассмотрим способ выявления и реагирования на любые ошибки, которые могут возникнуть.

Просмотр аналитических сведений

При работе с веб-сайтом аналитические сведения отображаются на вкладке Аналитика. Они также могут быть созданы в списке с категоризированным списком в JSON-файле, который включает идентификатор ключевого слова, текст вместе с конкретным временем начала и окончания каждого ключевое слово и оценкой достоверности.

Чтобы отобразить экземпляры в JSON-файле, сделайте следующее:

  1. Нажмите кнопку "Скачать", а затем Аналитика (JSON).

  2. Скопируйте текст и вставьте его в средство просмотра JSON в Интернете.

    "keywords": [
      {
        "id": 1,
        "text": "office insider",
        "confidence": 1,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:00:00",
            "adjustedEnd": "0:00:05.75",
            "start": "0:00:00",
            "end": "0:00:05.75"
          },
          {
            "adjustedStart": "0:01:21.82",
            "adjustedEnd": "0:01:24.7",
            "start": "0:01:21.82",
            "end": "0:01:24.7"
          },
          {
            "adjustedStart": "0:01:31.32",
            "adjustedEnd": "0:01:32.76",
            "start": "0:01:31.32",
            "end": "0:01:32.76"
          },
          {
            "adjustedStart": "0:01:35.8",
            "adjustedEnd": "0:01:37.84",
            "start": "0:01:35.8",
            "end": "0:01:37.84"
          }
        ]
      },
      {
        "id": 2,
        "text": "insider tip",
        "confidence": 0.9975,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:01:14.91",
            "adjustedEnd": "0:01:19.51",
            "start": "0:01:14.91",
            "end": "0:01:19.51"
          }
        ]
      },
    
    

Чтобы скачать JSON-файл с помощью API, используйте портал разработчика Индексатора видео Azure AI.

Примечание.

Извлечение ключевых слов является независимым от языка.

Компоненты ключевых слов

Во время процедуры ключевых слов звук и изображения в файле мультимедиа обрабатываются следующим образом:

Компонент Определение
Исходный язык Пользователь отправляет исходный файл для индексирования.
API транскрибирования Звуковой файл отправляется в службы ИИ Azure, а преобразованные транскрибированные выходные данные возвращаются. Если язык был указан, он обрабатывается.
OCR видео Изображения в файле мультимедиа обрабатываются с помощью API чтения визуального распознавания Azure для извлечения текста, его расположения и других аналитических сведений.
Извлечение ключевых слов Алгоритм извлечения обрабатывает транскрибированные звуки. Затем результаты объединяются с аналитическими сведениями, обнаруженными в видео во время процесса OCR. Ключевое слово и где они отображаются в средствах массовой информации, а затем обнаружены и идентифицированы.
Уровень достоверности Предполагаемый уровень достоверности каждого ключевое слово вычисляется как диапазон от 0 до 1. Оценка достоверности представляет уверенность в точности результата. Например, 82% определенности будут представлены как оценка 0,82.

Примеры вариантов использования

  • Персонализация ключевое слово для соответствия интересам клиентов, например веб-сайты о Англии публикации рекламных акций о английских фильмах или фестивалях.
  • Подробный поиск архивов для получения аналитических сведений о конкретных ключевое слово, чтобы создавать истории о функциях о компаниях, лицах или технологиях, например информационном агентстве.

Рекомендации и ограничения при выборе варианта использования

Ниже приведены некоторые рекомендации, которые следует учитывать при использовании извлечения ключевое слово:

  • При отправке файла всегда используйте высококачественное видеосодержимое. Рекомендуемый максимальный размер кадра — HD и частота кадров — 30 FPS. Кадр должен содержать не более 10 человек. При выходе кадров из видео в модели ИИ отправляются только 2 или 3 кадра в секунду. Обработка 10 и более кадров может отложить результат ИИ.
  • При отправке файла всегда используется высококачественное звуковое и видеоконтентное содержимое. Для выполнения анализа требуется не менее 1 минуты спонтанной речи. Звуковые эффекты обнаруживаются только в сегментах, отличных от речи. Минимальная длительность нечевого раздела составляет 2 секунды. Голосовые команды и пение не поддерживаются. 

При использовании ответственно и тщательно ключевых слов является ценным инструментом для многих отраслей. Чтобы уважать конфиденциальность и безопасность других пользователей, а также соблюдать местные и глобальные правила, рекомендуется следующее:

  • Всегда уважайте право человека на конфиденциальность и только прием средств массовой информации для законных и оправданных целей.  
  • Не раскрывайте неуместные средства массовой информации, демонстрирующие маленьких детей или членов семьи знаменитостей или другого содержимого, которые могут быть вредными или представляют угрозу для личной свободы человека.  
  • Приверженность уважению и продвижению прав человека в разработке и развертывании проанализированных средств массовой информации.  
  • При использовании сторонних материалов следует учитывать все существующие авторские права или разрешения, необходимые перед распространением содержимого, полученного от них. 
  • Всегда искать юридическую консультацию при использовании средств массовой информации из неизвестных источников. 
  • Всегда получайте соответствующие юридические и профессиональные советы, чтобы убедиться, что загруженные носители защищены и имеют надлежащие средства контроля для сохранения целостности содержимого и предотвращения несанкционированного доступа.    
  • Предоставьте канал обратной связи, позволяющий пользователям и пользователям сообщать о проблемах со службой.  
  • Помните о любых применимых законах или правилах, которые существуют в вашей области, касающиеся обработки, анализа и совместного использования средств массовой информации, содержащих людей. 
  • Держите человека в цикле. Не используйте какое-либо решение в качестве замены человеческого надзора и принятия решений.  
  • Полностью изучите и просмотрите потенциал любой модели ИИ, которую вы используете для понимания возможностей и ограничений.