Поделиться через


Подключение к Labelbox

Labelbox — это платформа обучающих данных, предназначенная для создания обучающих данных на основе изображений, видео, аудио, текста и мозаичной графики. С помощью Labelbox группа по работе с ИИ может создать рабочий процесс для применения, настройки и улучшения маркировки данных, каталогизации данных и отладки моделей на единой унифицированной платформе. Labelbox помогает отделам ИИ создавать и эксплуатировать системы машинного обучения в реальных рабочих условиях.

Вы можете подключать к Labelbox кластеры Azure Databricks, на которых установлена версия Databricks Runtime для Машинного обучения.

Подключение к Labelbox с помощью Partner Connect

В этом разделе описывается подключение кластера в рабочей области Azure Databricks к Labelbox с помощью Partner Connect.

Различия между стандартными подключениями и Labelbox

Чтобы подключиться к Labelbox с помощью Partner Connect, выполните действия, описанные в разделе "Подключение к партнерам машинного обучения" с помощью Partner Connect. Подключение Labelbox отличается от стандартных подключений машинного обучения следующим образом:

  • В дополнение к кластеру, субъекту-службе и личному маркеру доступа Partner Connect создает записную книжку с именем labelbox_databricks_example.ipynb в папке Workspace/Shared/labelbox_demo в учетной записи Labelbox, если она еще не существует.

Действия по подключению

Чтобы подключиться к Labelbox с помощью Partner Connect, сделайте следующее:

  1. Подключитесь к партнерам машинного обучения с помощью Partner Connect.
  2. Создайте ключ API Labelbox для своей учетной записи Labelbox, если у вас его нет. Скопируйте ключ API и сохраните его в безопасном месте, так как в итоге этот ключ окажется скрыт, а он потребуется вам позже.
  3. Настройка кластера ML и начальной записной книжки Labelbox.

Подключение к Labelbox вручную

Инструкции в этой главе описывают порядок подключения Labelbox к кластеру Azure Databricks.

Примечание.

Чтобы ускорить подключение, используйте Partner Connect.

Требования

У вас должен быть доступный кластер с Databricks Runtime для машинного обучения. Чтобы проверить наличие кластера, найдите ML в столбце Среда выполнения при просмотре кластера в рабочей области. Если у вас нет доступного кластера Databricks Runtime для машинного обучения, создайте его, а в качестве версии Databricks Runtime выберите версию из списка ML.

Действия по подключению

Чтобы подключиться к Labelbox вручную, выполните следующие действия:

  1. Перейдите на страницу Labelbox, чтобы зарегистрировать новую учетную запись Labelbox или войти в существующую.
  2. Создайте ключ API Labelbox для своей учетной записи Labelbox, если у вас его нет. Скопируйте ключ API и сохраните его в безопасном месте, так как в итоге этот ключ окажется скрыт, а он потребуется вам позже.
  3. Проверьте записную книжку Labelbox starter в рабочей области:
    1. На боковой панели выберите Рабочая область > Общая.
    2. Если папки с именем labelbox_demo еще не существует, создайте ее: i. Щелкните стрелку вниз рядом с пунктом Общие. ii. Выберите Создать > Папка. iii. Введите labelbox_demo. iv. Нажмите кнопку Создать папку.
    3. Щелкните папку labelbox_demo. Если начальной записной книжки с именем labelbox_databricks_example.ipynb не существует, импортируйте ее. i. Щелкните стрелку вниз рядом с полем labelbox_demo. ii. Нажмите кнопку Импорт. iii. Щелкните URL-адрес. iv. Введите https://github.com/Labelbox/labelbox-python/blob/develop/examples/integrations/databricks/labelbox_databricks_example.ipynb и нажмите кнопку Импорт.
  4. Перейдите к настройке кластера машинного обучения и начальной записной книжки Labelbox.

Настройка кластера ML и начальной записной книжки Labelbox

  1. Убедитесь, что необходимые библиотеки Labelbox установлены в кластере машинного обучения:
    1. На боковой панели щелкните Вычислительная среда.

    2. Выберите свой кластер ML. При необходимости найдите его с помощью поля фильтра.

      Примечание.

      Если для подключения к Labelbox вы использовали Partner Connect, имя кластера ML должно быть LABELBOX_CLUSTER.

    3. Перейдите на вкладку "Библиотеки ".

    4. Если пакет labelbox отсутствует в списке, установите его. i. Щелкните Установить новую. ii. Щелкните PyPI. iii. В поле Пакетвведите labelbox. iv. Щелкните Установить.

    5. Если пакет labelspark отсутствует в списке, установите его. i. Щелкните Установить новую. ii. Щелкните PyPI. iii. В поле Пакетвведите labelspark. iv. Щелкните Установить.

  2. Подключите кластер машинного обучения к начальной записной книжке:
    1. На боковой панели щелкните Рабочая область > Общие > labelbox_demo > labelbox_databricks_example.ipynb.
    2. Подключите свой кластер ML к записной книжке.
  3. Просмотрите записную книжку, чтобы узнать, как автоматизировать Labelbox.

Дополнительные ресурсы