Навчання детектору об'єктів

Завершено

Виявлення об'єктів – це форма комп'ютерного зору, у якій модель навчена виявляти присутність і розташування одного або кількох класів об'єкта на зображенні.

Фотографія з розташуванням і типом фруктів виявлено.

Існує два компоненти для прогнозування виявлення об'єктів:

  • Підпис класу кожного об'єкта, виявленого на зображенні. Наприклад, можна з'ясувати, що зображення містить яблуко, апельсин і банан.
  • Розташування кожного об'єкта в зображенні, позначеного як координати рамки, яка охоплює об'єкт.

Щоб навчити модель виявлення об'єктів, можна скористатися порталом настроюваного бачення AI Azure, щоб передавати та підписувати зображення перед навчанням, оцінюванням, тестуванням і публікацією моделі; або за допомогою API REST або SDK для певної мови можна записати код, який виконує навчальні завдання.

Підписи зображень

Настроюване бачення AI в Azure можна використовувати для створення проектів для класифікації зображень або виявлення об'єктів. Найзначнішим відмінністю між навчанням моделі класифікації зображень і навчанням моделі виявлення об'єктів є позначення зображень тегами. Хоча для класифікації зображень потрібна одна або кілька позначок, які застосовуються до всього зображення, виявлення об'єктів вимагає, щоб кожна мітка складалася з тега та області , яка визначає межу для кожного об'єкта на зображенні.

Підписування зображень на порталі настроюваного бачення AI в Azure

Портал настроюваного бачення azure AI надає графічний інтерфейс, який можна використовувати для позначення навчальних зображень.

Знімок екрана: зображення з тегами на порталі настроюваного бачення AI в Azure.

Найпростіший варіант позначення зображень для виявлення об'єктів – використовувати інтерактивний інтерфейс на порталі настроюваного бачення AI Azure. Цей інтерфейс автоматично пропонує області, які містять об'єкти, для яких можна призначити позначки або налаштувати, перетягнувши рамку, щоб взяти об'єкт, який потрібно позначити.

Крім того, після додавання тегів до початкового пакета зображень ви можете навчити модель. Подальше позначення нових зображень може скористатися інструментом смарт-підписувача на порталі, який може запропонувати не тільки регіони, але й класи об'єктів, які вони містять.

Альтернативні підходи до маркування

Крім того, можна використовувати спеціальний або сторонній засіб для підписування або додавати підписи до зображень вручну, щоб скористатися іншими функціями, наприклад призначенням завдань із підписування зображень кільком учасникам команди.

Якщо ви вирішите використовувати інструмент для підписування, відмінний від порталу настроюваного бачення AI Azure, можливо, знадобиться налаштувати результати відповідно до одиниць вимірювання, очікуваних інтерфейсом API спеціального бачення AI Azure. Межі визначаються чотирма значеннями, які представляють координати лівого (X) і верхнього (Y) верхнього лівого кута рамки, а також шириною та висотою рамки. Ці значення виражаються пропорційними значеннями відносно розміру вихідного зображення. Наприклад, розгляньте це поле зв'язування:

  • Ліворуч: 0.1
  • На початок: 0,5
  • Ширина: 0,5
  • Висота: 0.25

Це визначає поле, у якому ліворуч розташовано 0,1 (одна десята) від лівого краю зображення, а зверху – 0,5 (половина висоти зображення) зверху. Поле становить половину ширини та чверть висоти загального зображення.

На наведеному нижче зображенні показано відомості про підписи у форматі JSON для об'єктів на зображенні.

Фотографія з підписами JSON для об'єктів, які вона містить.