Image Analysis - Analyze Image
Проанализируйте входное изображение. Запрос содержит поток изображения с любым типом контента ['image/*', 'application/octet-stream'] или полезные данные JSON, которые включают свойство URL, которое будет использоваться для извлечения потока изображения.
POST /imageanalysis:analyze?api-version=2023-04-01-preview
POST /imageanalysis:analyze?features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview
Параметры URI
Имя | В | Обязательно | Тип | Описание |
---|---|---|---|---|
api-version
|
query | True |
string |
Запрошенная версия API. |
features
|
query |
Запрошенные визуальные функции: теги, объекты, субтитры, denseCaptions, read, smartCrops, people. Этот параметр необходимо указать, если параметр model-name не указан. |
||
gender-neutral-caption
|
query |
boolean |
Логический флаг для включения гендерно-нейтрального субтитров для функций caption и denseCaptions. Если этот параметр не указан, по умолчанию используется значение false. |
|
language
|
query |
string |
Требуемый язык для создания выходных данных. Если этот параметр не задан, используется значение по умолчанию "en". Список поддерживаемых языков см. в этой статье https://aka.ms/cv-languages . |
|
model-name
|
query |
string |
Имя настраиваемой обученной модели. Этот параметр необходимо указать, если параметр "features" не указан. |
|
smartcrops-aspect-ratios
|
query |
string |
Список пропорций, используемых для функции smartCrops. Пропорции вычисляются путем деления целевой ширины обрезки на высоту. Поддерживаемые значения находятся в диапазоне от 0,75 до 1,8 (включительно). Несколько значений должны быть разделены запятыми. Если этот параметр не указан, служба вернет одно предложение обрезки с пропорциями, которые она считает подходящими в диапазоне от 0,5 до 2,0 (включительно). |
Текст запроса
Имя | Обязательно | Тип | Описание |
---|---|---|---|
url | True |
string |
Общедоступный URL-адрес изображения. |
Ответы
Имя | Тип | Описание |
---|---|---|
200 OK |
Успех |
|
Other Status Codes |
Ошибка Заголовки x-ms-error-code: string |
Примеры
AnalyzeImage_CustomModel
Образец запроса
POST /imageanalysis:analyze?model-name=my_model_name&api-version=2023-04-01-preview
{
"url": "https://example.com/image.jpg"
}
Пример ответа
{
"customModelResult": {
"objectsResult": {
"values": [
{
"id": "1",
"boundingBox": {
"x": 197,
"y": 68,
"w": 356,
"h": 394
},
"tags": [
{
"name": "class1",
"confidence": 0.92431640625
}
]
},
{
"id": "2",
"boundingBox": {
"x": 0,
"y": 77,
"w": 241,
"h": 359
},
"tags": [
{
"name": "class1",
"confidence": 0.87890625
}
]
}
]
}
},
"modelVersion": "2023-04-01-preview",
"metadata": {
"width": 660,
"height": 495
}
}
Определения
Имя | Описание |
---|---|
Adult |
Объект , описывающий совпадение содержимого для взрослых. |
Adult |
Объект, описывающий, содержит ли изображение содержимое, ориентированное на взрослых, и (или) является ли непристойным. |
Bounding |
Ограничивающий прямоугольник для области внутри изображения. |
Caption |
Краткое описание того, что изображено на изображении. |
Crop |
Регион, определенный для интеллектуальной обрезки. Для каждого запрошенного пропорции будет возвращена одна область. |
Dense |
Краткое описание того, что изображено на изображении. |
Dense |
Список субтитров. |
Detected |
Описывает обнаруженный объект на изображении. |
Detected |
Человек, обнаруженный на изображении. |
Document |
Объект строки содержимого, состоящий из соседней последовательности элементов содержимого, таких как слова и метки выделения. |
Document |
Содержимое и элементы макета, извлеченные из страницы из входных данных. |
Document |
Смежная область объединенного свойства содержимого, указанная как смещение и длина. |
Document |
Объект , представляющий наблюдаемые стили текста. |
Document |
Объект слова, состоящий из непрерывной последовательности символов. Для языков, не разделенных пробелами, таких как китайский, японский и корейский, каждый символ представлен как собственное слово. |
Error |
Ответ возвращается при возникновении ошибки. |
Error |
Сведения об ошибке. |
Error |
Подробная ошибка. |
Image |
Описывать объединенные результаты различных типов анализа изображений. |
Image |
Сведения о метаданных изображения, такие как высота и ширина. |
Image |
Описывает результат прогнозирования изображения. |
Image |
Документ JSON с URL-адресом, указывающим на анализируемое изображение. |
Objects |
Описывает обнаруженные объекты на изображении. |
People |
Объект , описывающий, содержит ли изображение людей. |
Read |
Результаты операции чтения. |
Smart |
Результат интеллектуальной обрезки. |
Tag |
Наблюдение за сущностью на изображении, а также оценка достоверности. |
Tags |
Список тегов с уровнем достоверности. |
Visual |
Запрошенные визуальные функции: теги, объекты, субтитры, denseCaptions, read, smartCrops, people. Этот параметр необходимо указать, если параметр model-name не указан. |
AdultMatch
Объект , описывающий совпадение содержимого для взрослых.
Имя | Тип | Описание |
---|---|---|
confidence |
number |
Значение , указывающее уровень достоверности совпадающего содержимого для взрослых. |
isMatch |
boolean |
Значение , указывающее, соответствует ли изображение содержимому для взрослых. |
AdultResult
Объект, описывающий, содержит ли изображение содержимое, ориентированное на взрослых, и (или) является ли непристойным.
Имя | Тип | Описание |
---|---|---|
adult |
Объект , описывающий совпадение содержимого для взрослых. |
|
gore |
Объект , описывающий совпадение содержимого для взрослых. |
|
racy |
Объект , описывающий совпадение содержимого для взрослых. |
BoundingBox
Ограничивающий прямоугольник для области внутри изображения.
Имя | Тип | Описание |
---|---|---|
h |
integer |
Высота, измеряемая от верхней левой точки области, в пикселях. |
w |
integer |
Ширина, измеряемая от верхней левой точки области, в пикселях. |
x |
integer |
Левая координата верхней левой точки области в пикселях. |
y |
integer |
Верхняя координата верхней левой точки области в пикселях. |
CaptionResult
Краткое описание того, что изображено на изображении.
Имя | Тип | Описание |
---|---|---|
confidence |
number |
Уровень достоверности, который служба имеет в заголовке. |
text |
string |
Текст заголовка. |
CropRegion
Регион, определенный для интеллектуальной обрезки. Для каждого запрошенного пропорции будет возвращена одна область.
Имя | Тип | Описание |
---|---|---|
aspectRatio |
number |
Пропорции области обрезки. |
boundingBox |
Ограничивающий прямоугольник для области внутри изображения. |
DenseCaption
Краткое описание того, что изображено на изображении.
Имя | Тип | Описание |
---|---|---|
boundingBox |
Ограничивающий прямоугольник для области внутри изображения. |
|
confidence |
number |
Уровень достоверности, который служба имеет в заголовке. |
text |
string |
Текст заголовка. |
DenseCaptionsResult
Список субтитров.
Имя | Тип | Описание |
---|---|---|
values |
Список субтитров. |
DetectedObject
Описывает обнаруженный объект на изображении.
Имя | Тип | Описание |
---|---|---|
boundingBox |
Ограничивающий прямоугольник для области внутри изображения. |
|
id |
string |
Идентификатор обнаруженного объекта. |
tags |
Tag[] |
Достоверность классификации обнаруженного объекта. |
DetectedPerson
Человек, обнаруженный на изображении.
Имя | Тип | Описание |
---|---|---|
boundingBox |
Ограничивающий прямоугольник для области внутри изображения. |
|
confidence |
number |
Оценка достоверности наблюдения за человеком на изображении как значение в диапазоне от 0 до 1. |
DocumentLine
Объект строки содержимого, состоящий из соседней последовательности элементов содержимого, таких как слова и метки выделения.
Имя | Тип | Описание |
---|---|---|
boundingBox |
number[] |
Ограничивающий прямоугольник линии. |
content |
string |
Сцепленное содержимое содержащихся элементов в порядке чтения. |
spans |
Расположение строки в сцепленном содержимом в порядке чтения. |
DocumentPage
Содержимое и элементы макета, извлеченные из страницы из входных данных.
Имя | Тип | Описание |
---|---|---|
angle |
number |
Общая ориентация содержимого по часовой стрелке, измеряемая в градусах между (-180, 180]. |
height |
number |
Высота изображения/PDF в пикселях/дюймах соответственно. |
lines |
Извлеченные строки со страницы, потенциально содержащие как текстовые, так и визуальные элементы. |
|
pageNumber |
integer |
1-й номер страницы во входном документе. |
spans |
Расположение страницы в сцепленном содержимом в порядке чтения. |
|
width |
number |
Ширина изображения/PDF в пикселях/дюймах соответственно. |
words |
Извлеченные слова со страницы. |
DocumentSpan
Смежная область объединенного свойства содержимого, указанная как смещение и длина.
Имя | Тип | Описание |
---|---|---|
length |
integer |
Число символов в содержимом, представленном диапазоном. |
offset |
integer |
Отсчитываемый от нуля индекс содержимого, представленного диапазоном. |
DocumentStyle
Объект , представляющий наблюдаемые стили текста.
Имя | Тип | Описание |
---|---|---|
confidence |
number |
Уверенность в правильном определении стиля. |
isHandwritten |
boolean |
Является ли содержимое рукописным или нет. |
spans |
Расположение текстовых элементов в сцепленном содержимом, к которому применяется стиль. |
DocumentWord
Объект слова, состоящий из непрерывной последовательности символов. Для языков, не разделенных пробелами, таких как китайский, японский и корейский, каждый символ представлен как собственное слово.
Имя | Тип | Описание |
---|---|---|
boundingBox |
number[] |
Ограничивающий прямоугольник слова. |
confidence |
number |
Уверенность в правильном извлечении слова. |
content |
string |
Текстовое содержимое слова. |
span |
Смежная область объединенного свойства содержимого, указанная как смещение и длина. |
ErrorResponse
Ответ возвращается при возникновении ошибки.
Имя | Тип | Описание |
---|---|---|
error |
Сведения об ошибке. |
ErrorResponseDetails
Сведения об ошибке.
Имя | Тип | Описание |
---|---|---|
code |
string |
Код ошибки. |
details |
Список подробных ошибок. |
|
innererror |
Подробная ошибка. |
|
message |
string |
Сообщение об ошибке. |
target |
string |
Целевой объект ошибки. |
ErrorResponseInnerError
Подробная ошибка.
Имя | Тип | Описание |
---|---|---|
code |
string |
Код ошибки. |
innererror |
Подробная ошибка. |
|
message |
string |
Сообщение об ошибке. |
ImageAnalysisResult
Описывать объединенные результаты различных типов анализа изображений.
Имя | Тип | Описание |
---|---|---|
adultResult |
Объект, описывающий, содержит ли изображение содержимое, ориентированное на взрослых, и (или) является ли непристойным. |
|
captionResult |
Краткое описание того, что изображено на изображении. |
|
customModelResult |
Описывает результат прогнозирования изображения. |
|
denseCaptionsResult |
Список субтитров. |
|
metadata |
Сведения о метаданных изображения, такие как высота и ширина. |
|
modelVersion |
string |
Версия модели. |
objectsResult |
Описывает обнаруженные объекты на изображении. |
|
peopleResult |
Объект , описывающий, содержит ли изображение людей. |
|
readResult |
Результаты операции чтения. |
|
smartCropsResult |
Результат интеллектуальной обрезки. |
|
tagsResult |
Список тегов с уровнем достоверности. |
ImageMetadataApiModel
Сведения о метаданных изображения, такие как высота и ширина.
Имя | Тип | Описание |
---|---|---|
height |
integer |
Высота изображения в пикселях. |
width |
integer |
Ширина изображения в пикселях. |
ImagePredictionResult
Описывает результат прогнозирования изображения.
Имя | Тип | Описание |
---|---|---|
objectsResult |
Описывает обнаруженные объекты на изображении. |
|
tagsResult |
Список тегов с уровнем достоверности. |
ImageUrl
Документ JSON с URL-адресом, указывающим на анализируемое изображение.
Имя | Тип | Описание |
---|---|---|
url |
string |
Общедоступный URL-адрес изображения. |
ObjectsResult
Описывает обнаруженные объекты на изображении.
Имя | Тип | Описание |
---|---|---|
values |
Массив обнаруженных объектов. |
PeopleResult
Объект , описывающий, содержит ли изображение людей.
Имя | Тип | Описание |
---|---|---|
values |
Массив обнаруженных людей. |
ReadResult
Результаты операции чтения.
Имя | Тип | Описание |
---|---|---|
content |
string |
Сцепить строковое представление всех текстовых и визуальных элементов в порядке чтения. |
pages |
Список проанализированных страниц. |
|
stringIndexType |
string |
Метод, используемый для вычисления смещения и длины строки, возможные значения: "textElements", "unicodeCodePoint", "utf16CodeUnit" и т. д. |
styles |
Извлеченные стили шрифтов. |
SmartCropsResult
Результат интеллектуальной обрезки.
Имя | Тип | Описание |
---|---|---|
values |
Рекомендуемые регионы для обрезки изображения. |
Tag
Наблюдение за сущностью на изображении, а также оценка достоверности.
Имя | Тип | Описание |
---|---|---|
confidence |
number |
Уровень достоверности наблюдаемой сущности. |
name |
string |
Имя сущности. |
TagsResult
Список тегов с уровнем достоверности.
Имя | Тип | Описание |
---|---|---|
values |
Tag[] |
Список тегов с уровнем достоверности. |
VisualFeature
Запрошенные визуальные функции: теги, объекты, субтитры, denseCaptions, read, smartCrops, people. Этот параметр необходимо указать, если параметр model-name не указан.
Имя | Тип | Описание |
---|---|---|
caption |
string |
|
denseCaptions |
string |
|
objects |
string |
|
people |
string |
|
read |
string |
|
smartCrops |
string |
|
tags |
string |