При индексировании видео Индексатор видео Azure создает содержимое JSON, содержащее сведения об указанной аналитике видео. Аналитические сведения включают расшифровки, элементы оптического распознавания символов (OCR), лица, темы и аналогичные сведения. Каждый тип аналитических сведений содержит экземпляры диапазонов времени с отображением времени, когда такие аналитические сведения появляются в видео.
Идентификатор учетной записи Индексатора видео, содержащей список воспроизведения.
id
Идентификатор списка воспроизведения.
name
Имя списка воспроизведения.
description
Описание списка воспроизведения.
userName
Имя пользователя, создавшего список воспроизведения.
created
Время создания списка воспроизведения.
privacyMode
Режим конфиденциальности списка воспроизведения (Private или Public).
state
Состояние списка воспроизведения (Uploaded, Processing, Processed, Failed или Quarantined).
isOwned
Указывает, был ли список воспроизведения создан текущим пользователем.
isEditable
Указывает, имеет ли текущий пользователь право изменять список воспроизведения.
isBase
Указывает, является ли список воспроизведения основным (одно видео) или составлен на основе других видео (производный).
durationInSeconds
Общая длительность списка воспроизведения.
summarizedInsights
Выходные данные JSON содержат Insights элементы и SummarizedInsights . Мы рекомендуем использовать Insights и не использовать SummarizedInsights (что имеется для обратной совместимости).
videos
Список видео, которые составляют список воспроизведения. Если этот список воспроизведения содержит диапазоны времени других видео (производный), видео в этом списке будут содержать только данные из добавленных диапазонов времени.
Выходные данные JSON содержат Insights элементы и SummarizedInsights . Мы настоятельно рекомендуем использовать Insights и не использовать SummarizedInsights (что имеется для обратной совместимости).
Сводка аналитических сведений
В этом разделе приводится сводка аналитических сведений.
attribute
Описание
name
Имя видео. Например, Azure Monitor.
id
Идентификатор видео. Например, 63c6d532ff.
privacyMode
Анализируемое видео может иметь один из следующих режимов: видео Public доступно для всех пользователей в вашей учетной записи и любому пользователю, у которого есть ссылка на видео. Видео Private доступно для всех пользователей в вашей учетной записи.
duration
Время, когда произошло создание аналитики, в секундах.
thumbnailVideoId
Идентификатор видео, из которого создан эскиз.
thumbnailId
Идентификатор эскиза видео. Чтобы получить фактический эскиз, вызовите Get-Thumbnail и передайте thumbnailVideoId и thumbnailId.
faces
Содержит ноль или более лиц. Дополнительные сведения см. в разделе Лица.
keywords
Содержит ноль или более ключевых слов. Дополнительные сведения см. в разделе keywords.
sentiments
Содержит ноль или более тональностей. Дополнительные сведения см. в разделе sentiments.
audioEffects
Содержит ноль или более звуковых эффектов. Дополнительные сведения см. в разделе audioEffects.
labels
Содержит ноль или более меток. Дополнительные сведения см. в разделе labels.
brands
Содержит ноль или более торговых марок. Дополнительные сведения см. в разделе brands.
Каждая аналитика (например, строки расшифровки, лица или торговые марки) содержит список уникальных элементов (например, face1, face2, face3). Каждый элемент имеет собственные метаданные и список своих экземпляров, которые являются диапазонами времени с дополнительными метаданными.
Лицо может иметь идентификатор, имя, эскиз, другие метаданные и список временных экземпляров (например, 00:00:05 – 00:00:10, 00:01:00 - 00:02:30 и 00:41:21 – 00:41:49). Каждый временной экземпляр может содержать дополнительные метаданные. Например, метаданные могут включать координаты прямоугольника вокруг лица (20,230,60,60).
Версия
Версия кода
sourceLanguage
Исходный язык видео (предполагается один основной язык) в виде строки BCP-47.
language
Язык аналитики (перевод с исходного языка) в виде строки BCP-47.
Язык расшифровки аудиозаписи. Предназначен для поддержки расшифровки, где каждая строка может быть написана на другом языке.
instances
Список диапазонов времени, в которых появилась эта строка. Если экземпляр является расшифровкой, он будет иметь только один экземпляр.
Пример
"transcript":[
{
"id":1,
"text":"Well, good morning everyone and welcome to",
"confidence":0.8839,
"speakerId":1,
"language":"en-US",
"instances":[
{
"adjustedStart":"0:00:10.21",
"adjustedEnd":"0:00:12.81",
"start":"0:00:10.21",
"end":"0:00:12.81"
}
]
},
{
"id":2,
"text":"ignite 2016. Your mission at Microsoft is to empower every",
"confidence":0.8944,
"speakerId":2,
"language":"en-US",
"instances":[
{
"adjustedStart":"0:00:12.81",
"adjustedEnd":"0:00:17.03",
"start":"0:00:12.81",
"end":"0:00:17.03"
}
]
}
ocr
Имя
Описание
id
Идентификатор строки OCR.
text
Текст OCR.
confidence
Достоверность распознавания.
language
Язык OCR.
instances
Список диапазонов времени, в которых появилось это OCR. (Одно и то же OCR может встречаться несколько раз.)
height
Высота прямоугольника OCR.
top
Верхнее расположение в пикселях.
left
Левое расположение в пикселях.
width
Ширина прямоугольника OCR.
angle
Угол прямоугольника OCR, от -180 до 180. Значение 0 означает горизонтальное письмо слева направо. Значение 90 означает вертикальное письмо сверху вниз. Значение 180 означает горизонтальное письмо справа налево. Значение -90 означает вертикальное письмо снизу вверх. Значение 30 означает письмо с левого верхнего угла в правый нижний.
Список ключевых кадров в съемке. Каждый из них имеет идентификатор и список диапазонов времени экземпляра. Каждый экземпляр ключевого кадра имеет поле thumbnailId, которое содержит идентификатор эскиза ключевого кадра.
instances
Список диапазонов времени этой съемки. (Съемка может иметь только один экземпляр.)
Индексатор видео Azure обнаруживает названия компаний и продуктов в расшифровке речи в тексте и (или) видео OCR. Сюда не входит распознавание торговых марок или логотипов на изображении.
Список предопределенных тегов, которые связаны с этой торговой маркой.
confidence
Значение достоверности детектора фирменной символики Индексатора видео Azure (0-1).
instances
Список диапазонов времени для этой торговой марки. Каждый экземпляр содержит значение brandType, которое указывает, появилась торговая марка при расшифровке, либо при распознавании текста.
Число фрагментов в видео на определенного говорящего.
SpeakerLongestMonolog
Самый длинный монолог говорящего. Учитываются также паузы в монологе говорящего. Паузы в начале и конце монолога удаляются.
SpeakerTalkToListenRatio
Результат вычисления основан на длительности монолога говорящего (без учета пауз между монологами), деленной на общее время видео. Значение времени округляется до трех знаков после запятой.
audioEffects (предварительная версия)
Имя
Описание
id
Идентификатор звукового эффекта.
type
Тип звукового эффекта.
name
Тип звукового эффекта на языке, на котором был индексирован этот файл JSON.
instances
Список диапазонов времени, в которых появились эти аудиоэффекты. У каждого экземпляра есть поле достоверности.
Расшифровка visualContentModeration содержит диапазоны времени, которые, по данным Индексатора видео Azure, могут содержать содержимое для взрослых. Если блок visualContentModeration пуст, значит содержимое для взрослых не выявлено.
Видео, в которых обнаружено содержимое для взрослых или содержимое непристойного характера, могут быть доступны только для закрытого просмотра. Пользователи могут отправить запрос на проверку содержимого оператором-человеком. В этом случае атрибут IsAdult будет содержать результат анализа человеком.
Имя
Описание
id
Идентификатор модерации визуального контента.
adultScore
Результат оценки содержимого для взрослых (после модерации содержимого).
racyScore
Результат оценки содержимого непристойного характера (от Content Moderator).
instances
Список диапазонов времени, где применяется модерация контента.