Маркировка изображений и текстовых документов

После того как администратор проекта создаст проект маркировки данных изображений Машинного обучения Azure или проект маркировки текстовых данных Машинного обучения Azure, вы можете использовать средство маркировки для быстрой подготовки данных для проекта машинного обучения. В этой статье рассматриваются следующие вопросы:

  • Доступ к проектам маркировки
  • Средства добавления меток
  • Сведения об использовании средств для конкретных задач маркировки

Предварительные требования

Вход в Студию

  1. Войдите в Студию машинного обучения Azure.

  2. Выберите подписку и рабочую область, содержащую проект маркировки. Эти сведения есть у администратора проекта.

  3. В зависимости от уровня доступа слева может отображаться несколько разделов. В этом случае выберите Метки данных в левой части, чтобы найти проект.

Понимание задачи маркировки

В таблице проекта маркировки данных выберите ссылку Метка данных для проекта.

Вы увидите инструкции, относящиеся к вашему проекту. Они объясняют тип используемых данных, способ принятия решений и другую важную информацию. Прочтите сведения и выберите Задачи в верхней части страницы. В нижней части страницы также можно нажать кнопку Начать добавление меток .

Выбор метки

Во всех задачах маркировки данных вы выбираете соответствующий тег или теги из набора, указанного администратором проекта. С помощью клавиш с номерами клавиатуры можно выбрать первые девять тегов.

Полуавтоматическое машинное обучение

Алгоритмы машинного обучения могут быть активированы во время маркировки данных. Если в проекте включены эти алгоритмы, вы можете увидеть следующее:

  • Изображения

    • После добавления метки к определенному объему данных в верхней части экрана рядом с именем проекта может появиться кластеризация задач . Изображения группируются для представления похожих изображений на одной странице. и переключившись на одно из таких представлений, можно воспользоваться преимуществами группирования.

    • Позже рядом с именем проекта может появиться предварительная метка Задачи . Элементы отображаются с предлагаемой меткой, созданной моделью классификации машинного обучения. Ни одна из моделей машинного обучения не обеспечивает 100%-ю точность. Хотя мы используем только данные, для которых модель уверена, эти значения данных могут по-прежнему иметь неправильные предварительные метки. Когда вы видите метки, исправьте все неправильные метки перед отправкой страницы.

    • Для моделей идентификации объектов вы можете увидеть, что ограничивающие прямоугольники и метки уже существуют. Исправьте все ошибки перед отправкой страницы.

    • Для моделей сегментации объектов вы можете увидеть, что многоугольники и метки уже существуют. Исправьте все ошибки перед отправкой страницы.

  • Текст

    • В конечном итоге рядом с именем проекта может отображаться предварительная метка Задач . Элементы отображаются с предлагаемой меткой, которую создает модель классификации машинного обучения. Ни одна из моделей машинного обучения не обеспечивает 100%-ю точность. Хотя мы используем только данные, для которых модель уверена, эти значения данных по-прежнему могут быть неправильно помечены. При появлении этих меток перед отправкой страницы исправьте те из них, которые назначены неправильно.

В начале проекта маркировки модель машинного обучения может иметь достаточную точность только для предварительной маркировки небольшого подмножества изображений. Когда эти изображения будут помечены, проект маркировки вернется к ручной маркировке, чтобы собрать дополнительные данные для следующего цикла обучения модели. Со временем модель станет более уверенной в отношении большей доли изображений. Позже в проекте его достоверность приводит к большему набору задач предварительной маркировки.

Если задач с предварительной меткой больше нет, вы перестаете подтверждать или исправлять метки и вернитесь к ручному добавлению тегов элементов.

Задачи образов

В задачах классификации образов вы можете отображать несколько образов одновременно. Используйте значки над областью изображения, чтобы выбрать макет.

Чтобы выбрать сразу все отображаемые изображения, нажмите Select all (Выбрать все). Круглая кнопка выбора в правом верхнем углу изображения позволяет выбрать конкретное изображение. Чтобы присвоить тег, нужно выбрать по меньшей мере одно изображение. При выборе нескольких изображений любой выбранный тег применяется ко всем выбранным изображениям.

Здесь мы выбрали макет "два на два" и применили тег "Млекопитающие" к изображениям медведя и косаток. Изображение акулы уже было помечено как "Картилагенные рыбы", и игуана еще не имеет тега.

Макеты с несколькими изображениями и выбор

Важно!

Переключение макетов только при наличии новой страницы с данными без меток. При переключении макетов выполняется очистка тегов страницы.

После добавления тегов ко всем изображениям на странице Azure активирует кнопку Отправить . Нажмите Отправить, чтобы сохранить работу.

После отправки тегов для отображаемых данных Azure обновит страницу, предоставив новый набор изображений из рабочей очереди.

Задачи медицинской визуализации

Важно!

Возможность помечать изображения в формате DICOM или изображения похожих типов не предназначена для использования в контексте медицинских устройств, клинической поддержки, диагностических средств или других технологий, предназначенных для диагностики, лечения, облегчения симптомов или предотвращения заболеваний или других состояний, и ни одна из лицензий или прав не предоставляется корпорацией Майкрософт для использования этой возможности в таких целях. Эта возможность не предназначена для реализации или развертывания в качестве замены профессиональных медицинских консультаций или врачебного мнения, диагностики, лечения или клинической оценки, проводимых специалистами в сфере здравоохранения, и не должна использоваться таким образом. Клиент несет полную ответственность за использование меток для изображений в формате DICOM или изображений похожих типов.

Проекты изображений поддерживают формат DICOM для файлов рентгеновских снимков.

Рентгеновский снимок в формате DICOM, для которого нужно установить метки.

Хотя вы помечаете медицинские изображения теми же средствами, что и любые другие изображения, вы можете использовать другое средство для изображений DICOM. Выберите средство Окно и уровень, чтобы изменить насыщенность изображения. Это средство доступно только для изображений в формате DICOM.

Инструмент

Присвоение изображениям тегов для многоклассовой классификации

Назначьте один тег всему образу для типа проекта "Классификация изображений с несколькими классами". Чтобы просмотреть инструкции в любое время, перейдите на страницу Инструкции и выберите Просмотреть подробные инструкции.

Если вы заметите ошибку после присвоения тега изображению, ее можно исправить. Выберите "X" на метку, отображаемую под изображением, чтобы очистить тег. Вы также можете выбрать изображение и выбрать другой класс. Только что выбранное значение заменяет ранее примененный тег.

Присвоение изображениям тегов для классификации с несколькими метками

Если проект относится к типу "Классификация изображений с несколькими метками", примените к изображению один или несколько тегов. Чтобы просмотреть указания для конкретного проекта, выберите Инструкции и перейдите к разделу Просмотр подробных инструкций.

Выберите изображение, которое нужно пометить, а затем выберите тег . Этот тег применяется ко всем выбранным изображениям, после чего выбор изображений отменяется. Чтобы применить новые теги, необходимо повторно выбрать изображения. В следующей анимации демонстрируется процесс присвоения тегов с несколькими метками.

  1. Функция Выбрать все используется для применения тега Ocean (Океан)
  2. Выбрано одно изображение с тегом Closeup (Крупный план).
  3. Выбраны три изображения с тегом Wide angle (Широкий угол).

Анимация, демонстрирующая рабочий поток присвоения нескольких меток

Чтобы исправить ошибку, нажмите кнопку "X", чтобы очистить отдельный тег, или выберите изображения, а затем выберите тег , чтобы удалить тег из всех выбранных изображений. Вот как выглядит этот сценарий. При выборе "Земля" этот тег удаляется из двух выбранных изображений.

Снимок экрана с отменой множественного выбора

Azure будет включать кнопку Отправить только после применения по крайней мере одного тега к каждому изображению. Нажмите Отправить, чтобы сохранить работу.

Расстановка тегов и ограничивающих прямоугольников для обнаружения объектов

Если проект имеет тип "Идентификация объектов (ограничивающие прямоугольники)", укажите один или несколько ограничивающих прямоугольник на изображении и примените тег к каждому прямоугольнику. Изображения могут иметь несколько ограничивающих прямоугольников, каждый из которых имеет один тег. Используйте команду Просмотреть подробные инструкции , чтобы определить, используется ли в проекте несколько ограничивающих прямоугольник.

  1. Выберите тег для ограничивающего прямоугольника, который вы планируете создать.
  2. Выберите инструмент Прямоугольная рамкаПрямоугольная рамка или выберите "R".
  3. Выберите и проведите по диагонали по целевому объекту, чтобы создать грубый ограничивающий прямоугольник. Перетащите края или углы, чтобы настроить ограничивающий прямоугольник.

Создание ограничивающего прямоугольника

Чтобы удалить ограничивающий прямоугольник, выберите значок с изображением креста (X), который отображается рядом с ограничивающим прямоугольником после его создания.

Вы не можете изменить тег для уже существующего ограничивающего прямоугольника. Чтобы исправить ошибку назначения тегов, необходимо удалить ограничивающий прямоугольник и создать новый с правильным тегом.

По умолчанию вы можете изменять существующие ограничивающие прямоугольники. Инструмент "Блокировка и разблокировка регионов или "L" переключает это поведение. Если регионы заблокированы, вы можете изменить форму и/или расположение только для нового ограничивающего прямоугольника.

Используйте инструмент "Манипуляция с областями " Значок инструмента для манипуляции с областями — четыре стрелки, указывающие наружу от центра, вверх, вправо, вниз и влево. Или "M", чтобы настроить существующий ограничивающий прямоугольник. Перетаскивайте края или углы, чтобы скорректировать форму. Выберите в интерьере, если вы хотите перетащить весь ограничивающий прямоугольник. Если вы не можете изменить регион, вероятно, вы переключили инструмент Блокировки и разблокировки регионов .

Чтобы создать несколько ограничивающих прямоугольник одного размера, используйте средство "Поле шаблона" на основе шаблона или "T". Если на изображении нет ограничивающих прямоугольник и вы активируете поля на основе шаблонов, средство создает прямоугольники размерами 50 на 50 пикселей. Если вы создаете ограничивающий прямоугольник, а затем активируете поля на основе шаблона, размер всех новых ограничивающих прямоугольник соответствует размеру последнего созданного поля. Размер прямоугольников, созданных по шаблону, можно изменить после размещения. Изменение размера прямоугольника, созданного по шаблону, влияет только на этот конкретный прямоугольник.

Чтобы удалить все ограничивающие прямоугольники в текущем изображении, выберите инструмент Удалить все регионы.

После создания ограничивающих прямоугольников для изображения выберите Отправить, чтобы сохранить работу.

Присвоение изображениям тегов и указание прямоугольников для сегментации изображений

Если проект имеет тип "Сегментация экземпляра (многоугольник)", укажите один или несколько многоугольников на изображении и примените тег к каждому многоугольнику. Изображения могут иметь несколько ограничивающих прямоугольников, каждый из которых имеет один тег. Используйте просмотр подробных инструкций , чтобы определить, используется ли в проекте несколько ограничивающих многоугольников.

  1. Выберите тег для прямоугольника, который вы хотите создать.

  2. Выберите инструмент Рисование области многоугольниковРисование области многоугольника или выберите "P".

  3. Щелкните каждую точку многоугольника. Завершив фигуру, дважды щелкните ее, чтобы завершить.

    Создание многоугольников для кошки и собаки

Чтобы удалить многоугольник, щелкните значок с изображением креста (X), который отображается рядом с многоугольником после его создания.

Чтобы изменить тег для многоугольника, выберите инструмент Переместить область , выберите многоугольник и выберите правильный тег.

Вы можете изменить существующие многоугольники. Инструмент "Блокировка и разблокировка регионов" или "L" переключает это поведение. Если регионы заблокированы, вы можете изменить форму и/или расположение только для нового многоугольника.

Чтобы настроить существующий многоугольник, используйте инструмент Добавление и удаление точек многоугольниковЗначок инструмента Добавление и удаление точек многоугольников. Или "U". Щелкните многоугольник, чтобы добавить или удалить точку. Если вы не можете изменить регион, вероятно, вы переключили инструмент Блокировки и разблокировки регионов .

Чтобы удалить все многоугольник в текущем изображении, выберите инструмент Удалить все регионы.

После создания многоугольников для изображения выберите Отправить, чтобы сохранить работу.

Текст метки

При расстановке тегов в тексте используйте панель инструментов для выполнения следующих действий:

  • увеличение или уменьшение размера текста;
  • Изменение шрифта
  • пропуск создания заметок для определенного элемента и переход к следующему элементу.

Если вы заметите ошибку после присвоения тега, ее можно исправить. Выберите значок X на метке, которая отображается под текстом, чтобы очистить тег.

Существует три типа текстовых проектов.

Тип проекта Описание
Многоклассовая классификация Присвойте один тег всей текстовой записи. Для каждого текстового элемента можно выбрать только один тег. Выберите тег и нажмите кнопку Отправить , чтобы перейти к следующей записи.
Классификация с несколькими метками Присвойте один или несколько тегов каждой текстовой записи. Можно выбрать несколько тегов для каждого текстового элемента. Выберите все применимые теги, а затем нажмите кнопку Отправить , чтобы перейти к следующей записи.
Распознавание именованных сущностей Помечайте тегами различные слова или фразы в каждой текстовой записи. См. инструкции в следующем разделе.

Чтобы просмотреть инструкции для конкретного проекта, выберите Инструкции и перейдите к разделу Просмотр подробных инструкций.

Добавление тегов к словам и фразам

Если проект настроен для распознавания именованных сущностей, вы помечаете тегами различные слова или фразы в каждом текстовом элементе. Для маркировки текста сделайте следующее.

  1. Выберите метку или введите номер, соответствующий соответствующей метки.
  2. Дважды щелкните слово или выберите несколько слов с помощью мыши.

Снимок экрана: распознавание именованных сущностей.

Чтобы изменить метку, можно выполнить следующие действия.

  • Удалите метку и начните заново.
  • Измените значение для некоторых или всех определенных меток в текущем элементе:
    • Выберите саму метку, которая выбирает все экземпляры этой метки.
    • Снова выберите экземпляры этой метки, чтобы отменить выбор экземпляров, которые вы хотите сохранить.
    • Наконец, выберите новую метку, чтобы изменить все выбранные метки.

После добавления тегов ко всем элементам в записи нажмите кнопку Отправить , чтобы перейти к следующей записи.

Завершение работы

После отправки страницы данных с тегами Azure назначит вам новый набор данных без меток из рабочей очереди. Если нет данных без меток, появится новое сообщение, а также ссылка на домашнюю страницу портала.

Завершив добавление меток, выделите изображение внутри круга в правом верхнем углу студии, а затем выберите выход. Если вы не выйдете из службы, в конечном итоге Azure выполнит "истекло время ожидания" и назначит данные другому маркировщику.

Дальнейшие действия