Labelbox — это платформа обучающих данных, предназначенная для создания обучающих данных на основе изображений, видео, аудио, текста и мозаичной графики. С помощью Labelbox группа по работе с ИИ может создать рабочий процесс для применения, настройки и улучшения маркировки данных, каталогизации данных и отладки моделей на единой унифицированной платформе. Labelbox помогает отделам ИИ создавать и эксплуатировать системы машинного обучения в реальных рабочих условиях.
Вы можете подключать к Labelbox кластеры Azure Databricks, на которых установлена версия Databricks Runtime для Машинного обучения.
Подключение к Labelbox с помощью Partner Connect
В этом разделе описывается подключение кластера в рабочей области Azure Databricks к Labelbox с помощью Partner Connect.
Различия между стандартными подключениями и Labelbox
В дополнение к кластеру, субъекту-службе и личному маркеру доступа Partner Connect создает записную книжку с именем labelbox_databricks_example.ipynb в папке Workspace/Shared/labelbox_demo в учетной записи Labelbox, если она еще не существует.
Действия по подключению
Чтобы подключиться к Labelbox с помощью Partner Connect, сделайте следующее:
Создайте ключ API Labelbox для своей учетной записи Labelbox, если у вас его нет. Скопируйте ключ API и сохраните его в безопасном месте, так как в итоге этот ключ окажется скрыт, а он потребуется вам позже.
Инструкции в этой главе описывают порядок подключения Labelbox к кластеру Azure Databricks.
Примечание
Чтобы ускорить подключение, используйте Partner Connect.
Требования
У вас должен быть доступный кластер с Databricks Runtime для машинного обучения. Чтобы проверить это для существующего кластера, найдите ML в столбце среды выполнения, когда вы отображаете кластер в своей рабочей области. Если у вас нет доступного кластера Databricks Runtime ML, создайте кластер и для версии Databricks Runtimeвыберите версию из списка ML.
Действия по подключению
Чтобы подключиться к Labelbox вручную, выполните следующие действия:
Перейдите на страницу Labelbox, чтобы зарегистрировать новую учетную запись Labelbox или войти в существующую.
Создайте ключ API Labelbox для своей учетной записи Labelbox, если у вас его нет. Скопируйте ключ API и сохраните его в безопасном месте, так как в итоге этот ключ окажется скрыт, а он потребуется вам позже.
Проверьте записную книжку Labelbox starter в рабочей области:
На боковой панели выберите Рабочая область > Общая.
Если папки с именем labelbox_demo еще не существует, создайте ее:
i. Щелкните стрелку вниз рядом с пунктом Общие.
ii. Выберите Создать > Папка.
iii. Введите labelbox_demo.
iv. Нажмите кнопку Создать папку.
Щелкните папку labelbox_demo. Если начальной записной книжки с именем labelbox_databricks_example.ipynb не существует, импортируйте ее.
i. Щелкните стрелку вниз рядом с полем labelbox_demo.
ii. Нажмите кнопку Импорт.
iii. Щелкните URL-адрес.
iv. Введите https://github.com/Labelbox/labelbox-python/blob/develop/examples/integrations/databricks/labelbox_databricks_example.ipynb и нажмите кнопку Импорт.
Перейдите к настройке кластера машинного обучения и начальной записной книжки Labelbox.
настройка кластера машинного обучения и стартового ноутбука Labelbox
Убедитесь, что необходимые библиотеки Labelbox установлены в кластере машинного обучения:
На боковой панели щелкните Вычислительная среда.
Выберите свой кластер ML. При необходимости найдите его с помощью поля фильтра.
Примечание
Если для подключения к Labelbox вы использовали Partner Connect, имя кластера ML должно быть LABELBOX_CLUSTER.
Перейдите на вкладку "Библиотеки ".
Если пакет labelbox отсутствует в списке, установите его.
i. Щелкните Установить новую.
ii. Щелкните PyPI.
iii. В поле Пакетвведите labelbox.
iv. Щелкните Установить.
Если пакет labelspark отсутствует в списке, установите его.
i. Щелкните Установить новую.
ii. Щелкните PyPI.
iii. В поле Пакетвведите labelspark.
iv. Щелкните Установить.
Подключите кластер машинного обучения к начальной записной книжке:
На боковой панели щелкните Рабочая область > Общие > labelbox_demo > labelbox_databricks_example.ipynb.
Управление приемом и подготовкой данных, обучением моделей и развертыванием, а также мониторингом решений машинного обучения с помощью Python, Машинное обучение Azure и MLflow.