Прочитать на английском

Поделиться через


Получение изображений

Чтобы обучить модель обнаружения определенных объектов, необходимо подобрать изображения, содержащие такие объекты. Придерживайтесь рекомендаций для количества и качества изображений, чтобы получить оптимальные результаты.

Формат и размер

Изображения, которые вы будете передавать модели обнаружения объектов, должны иметь следующие характеристики:

  • Формат:

    • JPG
    • PNG
    • BMP
  • Размер:

    • Максимум 6 МБ для обучения
    • минимальная ширина/высота 256 x 256 пикселей

Количество данных и баланс данных

Важно передать достаточное количество изображений для обучения модели ИИ. В качестве хорошей отправной точки в обучающем наборе должно быть не менее 15 изображений каждого объекта. При наличии меньшего количества изображений присутствует большой риск того, что ваша модель обучится распознавать объекты, которые являются шумом или неважны. Обучение модели по большему количеству изображений повысит точность прогнозирования.

Еще один аспект касается обеспечения сбалансированных данных. Если для одного объекта есть 500 изображений, а для другого — 50, набор данных для обучения будет несбалансированным. Это может привести к тому, что результаты распознавания одного из объектов будут точнее. Для более согласованных результатов сохраняйте соотношение 1:2 между объектами с наименьшим и наибольшим количеством изображений. Например, если объект с наибольшим количеством изображений имеет 500 изображений, то для обучения объект с наименьшим количеством изображений должен содержать не менее 250 изображений.

Использование более разнообразных изображений

Предоставьте изображения, максимально похожие на конкретное содержимое, которое будет передаваться в модель при его использовании. Предположим, что вы обучаете модель распознавать яблоки. Если вы обучаете ее только на изображениях с яблоками на блюде, она может оказаться неточной при распознавании яблок на деревьях. Использование различных типов изображений гарантирует, что модель не будет предвзятой и окажется более эффективной. Некоторые из способов, с помощью которых можно сделать набор для обучения более разнообразным, приведены далее.

Фоновый

Используйте изображения ваших объектов на разном фоне — например, фрукты на тарелках, в руках и на деревьях. Фотографии в контексте лучше, чем фотографии на нейтральном фоне, так как они предоставляют модели больше информации.

Фоны изображений.

Освещение

Используйте для обучения изображения с различным освещением, особенно если у изображений, используемых для обнаружения, разнообразное освещение. Например, учитывайте, использовалась ли для вспышка, высокая экспозиция и т. д. Полезно также включать изображения с разнообразной насыщенностью, оттенком и яркостью. Этими параметрами можно управлять с помощью камеры устройства.

Освещение на изображении.

Размер объекта

Предоставьте изображения, на которых объекты имеют разные размеры и на которых показаны разные части объекта — например, фотографии связок бананов и крупный план одного банана. Различные размеры изображений способствуют повышению эффективности обобщения модели.

Размеры объектов.

Ракурс камеры

Попробуйте предоставить изображения, снятые под разными углами. Если все фотографии сделаны с помощью набора неподвижных камер, например камер видеонаблюдения, назначьте каждой камере разные метки. Это позволит избежать моделирования несвязанных объектов, таких как фонарные столбы, как ключевого признака. Назначьте каждой камере отдельную метку, даже если они снимают одинаковые объекты.

Ракурсы камер.

Непредвиденные результаты

Модели ИИ могут неверно определять общие характеристики предоставленных изображений. Предположим, вы хотите создать модель, отличающую яблоки от цитрусовых. Если вы используете изображения яблок в руках и цитрусовых на белых блюдах, то модель может обучиться определять руки и белые блюда, а не яблоки и цитрусовые.

Непредвиденные результаты.

Чтобы устранить проблему такого рода, следуйте подробным рекомендациям по использованию более разнообразных изображений: с разными ракурсами, разным фоном, разными размерами объектов, в группах и другие варианты.

Приступая к работе с обнаружением объектов