Подключение к Labelbox
Labelbox — это платформа обучающих данных, предназначенная для создания обучающих данных на основе изображений, видео, аудио, текста и мозаичной графики. С помощью Labelbox группа по работе с ИИ может создать рабочий процесс для применения, настройки и улучшения маркировки данных, каталогизации данных и отладки моделей на единой унифицированной платформе. Labelbox помогает отделам ИИ создавать и эксплуатировать системы машинного обучения в реальных рабочих условиях.
Вы можете подключать к Labelbox кластеры Azure Databricks, на которых установлена версия Databricks Runtime для Машинного обучения.
Подключение к Labelbox с помощью Partner Connect
В этом разделе описывается подключение кластера в рабочей области Azure Databricks к Labelbox с помощью Partner Connect.
Различия между стандартными подключениями и Labelbox
Чтобы подключиться к Labelbox с помощью Partner Connect, выполните действия, описанные в разделе "Подключение к партнерам машинного обучения" с помощью Partner Connect. Подключение Labelbox отличается от стандартных подключений машинного обучения следующим образом:
- В дополнение к кластеру, субъекту-службе и личному маркеру доступа Partner Connect создает записную книжку с именем
labelbox_databricks_example.ipynb
в папке Workspace/Shared/labelbox_demo в учетной записи Labelbox, если она еще не существует.
Действия по подключению
Чтобы подключиться к Labelbox с помощью Partner Connect, сделайте следующее:
- Подключитесь к партнерам машинного обучения с помощью Partner Connect.
- Создайте ключ API Labelbox для своей учетной записи Labelbox, если у вас его нет. Скопируйте ключ API и сохраните его в безопасном месте, так как в итоге этот ключ окажется скрыт, а он потребуется вам позже.
- Настройка кластера ML и начальной записной книжки Labelbox.
Подключение к Labelbox вручную
Инструкции в этой главе описывают порядок подключения Labelbox к кластеру Azure Databricks.
Примечание.
Чтобы ускорить подключение, используйте Partner Connect.
Требования
У вас должен быть доступный кластер с Databricks Runtime для машинного обучения. Чтобы проверить наличие кластера, найдите ML в столбце Среда выполнения при просмотре кластера в рабочей области. Если у вас нет доступного кластера Databricks Runtime для машинного обучения, создайте его, а в качестве версии Databricks Runtime выберите версию из списка ML.
Действия по подключению
Чтобы подключиться к Labelbox вручную, выполните следующие действия:
- Перейдите на страницу Labelbox, чтобы зарегистрировать новую учетную запись Labelbox или войти в существующую.
- Создайте ключ API Labelbox для своей учетной записи Labelbox, если у вас его нет. Скопируйте ключ API и сохраните его в безопасном месте, так как в итоге этот ключ окажется скрыт, а он потребуется вам позже.
- Проверьте записную книжку Labelbox starter в рабочей области:
- На боковой панели выберите Рабочая область > Общая.
- Если папки с именем labelbox_demo еще не существует, создайте ее:
i. Щелкните стрелку вниз рядом с пунктом Общие.
ii. Выберите Создать > Папка.
iii. Введите
labelbox_demo
. iv. Нажмите кнопку Создать папку. - Щелкните папку labelbox_demo. Если начальной записной книжки с именем labelbox_databricks_example.ipynb не существует, импортируйте ее.
i. Щелкните стрелку вниз рядом с полем labelbox_demo.
ii. Нажмите кнопку Импорт.
iii. Щелкните URL-адрес.
iv. Введите
https://github.com/Labelbox/labelbox-python/blob/develop/examples/integrations/databricks/labelbox_databricks_example.ipynb
и нажмите кнопку Импорт.
- Перейдите к настройке кластера машинного обучения и начальной записной книжки Labelbox.
Настройка кластера ML и начальной записной книжки Labelbox
- Убедитесь, что необходимые библиотеки Labelbox установлены в кластере машинного обучения:
На боковой панели щелкните Вычислительная среда.
Выберите свой кластер ML. При необходимости найдите его с помощью поля фильтра.
Примечание.
Если для подключения к Labelbox вы использовали Partner Connect, имя кластера ML должно быть LABELBOX_CLUSTER.
Перейдите на вкладку "Библиотеки ".
Если пакет labelbox отсутствует в списке, установите его. i. Щелкните Установить новую. ii. Щелкните PyPI. iii. В поле Пакетвведите labelbox. iv. Щелкните Установить.
Если пакет labelspark отсутствует в списке, установите его. i. Щелкните Установить новую. ii. Щелкните PyPI. iii. В поле Пакетвведите labelspark. iv. Щелкните Установить.
- Подключите кластер машинного обучения к начальной записной книжке:
- На боковой панели щелкните Рабочая область > Общие > labelbox_demo > labelbox_databricks_example.ipynb.
- Подключите свой кластер ML к записной книжке.
- Просмотрите записную книжку, чтобы узнать, как автоматизировать Labelbox.
Дополнительные ресурсы
- Файл сведений в GitHub для начальной записной книжки
- Документы Labelbox
- Поддержка