Извлечение ключевых слов
Внимание
Из-за объявления об Службы мультимедиа Azure выхода на пенсию Индексатор видео Azure объявляет корректировки функций Индексатора видео Azure. Ознакомьтесь с изменениями, связанными с выходом на пенсию службы мультимедиа Azure (AMS), чтобы понять, что это означает для учетной записи Индексатора видео Azure. Ознакомьтесь с руководством по обновлению и миграции AMS: VI.
Извлечение ключевых слов — это функция ИИ Индексатора видео Azure, которая автоматически обнаруживает аналитические сведения о различных ключевое слово, рассмотренных в файлах мультимедиа. Извлечение ключевых слов может извлекать аналитические сведения как в файлах мультимедиа с одним языком, так и с несколькими языками. Общее количество извлеченных ключевое слово и их категорий перечислены на вкладке Аналитика, где щелкните ключевое слово и нажмите кнопку "Воспроизвести предыдущий" или "Далее" переходы к ключевое слово в файле мультимедиа.
Необходимые компоненты
Обзор заметки о прозрачности
Общие принципы
В этой статье рассматриваются ключевые слова и ключевые рекомендации по использованию этой технологии ответственно. При принятии решения о том, как использовать и реализовать функцию СИ, необходимо учитывать многое:
- Будет ли эта функция хорошо работать в моем сценарии? Прежде чем развертывать извлечение ключевых слов в своем сценарии, проверьте, как она выполняется с помощью данных реального времени и убедитесь, что она может обеспечить необходимую точность.
- Есть ли возможности для обнаружения ошибок и реагирования на них? Продукты и функции, на основе искусственного интеллекта, не будут точными на 100%, поэтому рассмотрим способ выявления и реагирования на любые ошибки, которые могут возникнуть.
Просмотр аналитических сведений
При работе с веб-сайтом аналитические сведения отображаются на вкладке Аналитика. Они также могут быть созданы в списке с категоризированным списком в JSON-файле, который включает идентификатор ключевого слова, текст вместе с конкретным временем начала и окончания каждого ключевое слово и оценкой достоверности.
Чтобы отобразить экземпляры в JSON-файле, сделайте следующее:
Нажмите кнопку "Скачать", а затем Аналитика (JSON).
Скопируйте текст и вставьте его в средство просмотра JSON в Интернете.
"keywords": [ { "id": 1, "text": "office insider", "confidence": 1, "language": "en-US", "instances": [ { "adjustedStart": "0:00:00", "adjustedEnd": "0:00:05.75", "start": "0:00:00", "end": "0:00:05.75" }, { "adjustedStart": "0:01:21.82", "adjustedEnd": "0:01:24.7", "start": "0:01:21.82", "end": "0:01:24.7" }, { "adjustedStart": "0:01:31.32", "adjustedEnd": "0:01:32.76", "start": "0:01:31.32", "end": "0:01:32.76" }, { "adjustedStart": "0:01:35.8", "adjustedEnd": "0:01:37.84", "start": "0:01:35.8", "end": "0:01:37.84" } ] }, { "id": 2, "text": "insider tip", "confidence": 0.9975, "language": "en-US", "instances": [ { "adjustedStart": "0:01:14.91", "adjustedEnd": "0:01:19.51", "start": "0:01:14.91", "end": "0:01:19.51" } ] },
Чтобы скачать JSON-файл с помощью API, используйте портал разработчика Индексатора видео Azure AI.
Примечание.
Извлечение ключевых слов является независимым от языка.
Компоненты ключевых слов
Во время процедуры ключевых слов звук и изображения в файле мультимедиа обрабатываются следующим образом:
Компонент | Определение |
---|---|
Исходный язык | Пользователь отправляет исходный файл для индексирования. |
API транскрибирования | Звуковой файл отправляется в службы ИИ Azure, а преобразованные транскрибированные выходные данные возвращаются. Если язык был указан, он обрабатывается. |
OCR видео | Изображения в файле мультимедиа обрабатываются с помощью API чтения визуального распознавания Azure для извлечения текста, его расположения и других аналитических сведений. |
Извлечение ключевых слов | Алгоритм извлечения обрабатывает транскрибированные звуки. Затем результаты объединяются с аналитическими сведениями, обнаруженными в видео во время процесса OCR. Ключевое слово и где они отображаются в средствах массовой информации, а затем обнаружены и идентифицированы. |
Уровень достоверности | Предполагаемый уровень достоверности каждого ключевое слово вычисляется как диапазон от 0 до 1. Оценка достоверности представляет уверенность в точности результата. Например, 82% определенности будут представлены как оценка 0,82. |
Примеры вариантов использования
- Персонализация ключевое слово для соответствия интересам клиентов, например веб-сайты о Англии публикации рекламных акций о английских фильмах или фестивалях.
- Подробный поиск архивов для получения аналитических сведений о конкретных ключевое слово, чтобы создавать истории о функциях о компаниях, лицах или технологиях, например информационном агентстве.
Рекомендации и ограничения при выборе варианта использования
Ниже приведены некоторые рекомендации, которые следует учитывать при использовании извлечения ключевое слово:
- При отправке файла всегда используйте высококачественное видеосодержимое. Рекомендуемый максимальный размер кадра — HD и частота кадров — 30 FPS. Кадр должен содержать не более 10 человек. При выходе кадров из видео в модели ИИ отправляются только 2 или 3 кадра в секунду. Обработка 10 и более кадров может отложить результат ИИ.
- При отправке файла всегда используется высококачественное звуковое и видеоконтентное содержимое. Для выполнения анализа требуется не менее 1 минуты спонтанной речи. Звуковые эффекты обнаруживаются только в сегментах, отличных от речи. Минимальная длительность нечевого раздела составляет 2 секунды. Голосовые команды и пение не поддерживаются.
При использовании ответственно и тщательно ключевых слов является ценным инструментом для многих отраслей. Чтобы уважать конфиденциальность и безопасность других пользователей, а также соблюдать местные и глобальные правила, рекомендуется следующее:
- Всегда уважайте право человека на конфиденциальность и только прием средств массовой информации для законных и оправданных целей.
- Не раскрывайте неуместные средства массовой информации, демонстрирующие маленьких детей или членов семьи знаменитостей или другого содержимого, которые могут быть вредными или представляют угрозу для личной свободы человека.
- Приверженность уважению и продвижению прав человека в разработке и развертывании проанализированных средств массовой информации.
- При использовании сторонних материалов следует учитывать все существующие авторские права или разрешения, необходимые перед распространением содержимого, полученного от них.
- Всегда искать юридическую консультацию при использовании средств массовой информации из неизвестных источников.
- Всегда получайте соответствующие юридические и профессиональные советы, чтобы убедиться, что загруженные носители защищены и имеют надлежащие средства контроля для сохранения целостности содержимого и предотвращения несанкционированного доступа.
- Предоставьте канал обратной связи, позволяющий пользователям и пользователям сообщать о проблемах со службой.
- Помните о любых применимых законах или правилах, которые существуют в вашей области, касающиеся обработки, анализа и совместного использования средств массовой информации, содержащих людей.
- Держите человека в цикле. Не используйте какое-либо решение в качестве замены человеческого надзора и принятия решений.
- Полностью изучите и просмотрите потенциал любой модели ИИ, которую вы используете для понимания возможностей и ограничений.
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по