Herstellen einer Verbindung mit Labelbox

Labelbox ist eine Trainingsdatenplattform, die zum Erstellen von Trainingsdaten aus Bildern, Videos, Audioinhalten, Texten und gekachelten Bildern verwendet wird. Mithilfe von Labelbox können KI-Teams einen Workflow anpassen, um die Datenbeschriftung, die Datenkatalogisierung und das Modelldebuggen auf einer einzigen, einheitlichen Plattform durchzuführen, zu verwalten und zu verbessern. Labelbox ist so konzipiert, dass KI-Teams Machine Learning-Systeme für die Produktion erstellen und ausführen können.

Sie können Ihre Azure Databricks-Cluster, die über die Machine Learning-Version von Databricks Runtime verfügen, mit Labelbox verbinden.

Herstellen einer Verbindung zu Labelbox mittels Partner Connect

In diesem Abschnitt wird beschrieben, wie Sie einen Cluster in Ihrem Azure Databricks-Arbeitsbereich mithilfe von Partner Connect mit Labelbox verbinden.

Unterschiede zwischen Standardverbindungen und Labelbox

Um eine Verbindung mit Labelbox über Partner Connect herzustellen, führen Sie die Schritte aus unter Herstellen einer Verbindung mit einem ML-Partner mittels Partner Connect. Die Labelbox-Verbindung unterscheidet sich in folgenden Punkten von den üblichen Machine Learning-Verbindungen:

  • Zusätzlich zu einem Cluster, einem Dienstprinzipal und einem persönlichen Zugriffstoken erstellt Partner Connect ein Notebook namens labelbox_databricks_example.ipynb im Ordner Workspace/Shared/labelbox_demo in Ihrem Labelbox-Konto, sofern es noch nicht vorhanden ist.

Schritte zum Herstellen einer Verbindung

Gehen Sie wie folgt vor, um mithilfe von Partner Connect eine Verbindung mit Labelbox herzustellen:

  1. Herstellen einer Verbindung mit ML-Partnern mittels Partner Connect.
  2. Erstellen Sie einen Labelbox-API-Schlüssel für Ihr Labelbox-Konto, falls Sie noch nicht über einen solchen verfügen. Kopieren Sie den API-Schlüssel, und speichern Sie ihn an einem sicheren Ort, da der Schlüssel schließlich ausgeblendet wird und Sie ihn später benötigen.
  3. Einrichten des ML-Clusters und des Labelbox-Starternotebooks.

Manuelles Herstellen einer Verbindung mit Labelbox

Die Schritte in diesem Abschnitt beschreiben, wie Sie Labelbox mit einem Azure Databricks-Cluster verbinden.

Hinweis

Verwenden Sie Partner Connect, um die Verbindung schneller herzustellen.

Anforderungen

Sie müssen einen verfügbaren Cluster besitzen, auf dem Databricks Runtime für Machine Learning ausgeführt wird. Um dies für einen vorhandenen Cluster zu überprüfen, suchen Sie in der Spalte Runtime nach ML, wenn Sie den Cluster in Ihrem Arbeitsbereich anzeigen. Wenn Sie über keinen Databricks Runtime ML-Cluster verfügen, erstellen Sie einen Cluster, und wählen Sie aus der ML-Liste eine Version für die Databricks Runtime-Version aus.

Schritte zum Herstellen einer Verbindung

Gehen Sie wie folgt vor, um eine manuelle Verbindung mit Labelbox herzustellen:

  1. Navigieren Sie zur Labelbox-Seite, um sich für ein neues Labelbox-Konto zu registrieren, oder melden Sie sich bei Ihrem vorhandenen Labelbox-Konto an.
  2. Erstellen Sie einen Labelbox-API-Schlüssel für Ihr Labelbox-Konto, falls Sie noch nicht über einen solchen verfügen. Kopieren Sie den API-Schlüssel, und speichern Sie ihn an einem sicheren Ort, da der Schlüssel schließlich ausgeblendet wird und Sie ihn später benötigen.
  3. Überprüfen Sie, ob in Ihrem Arbeitsbereich ein Labelbox-Starternotebook vorhanden ist:
    1. Navigieren Sie auf der Seitenleiste zu Arbeitsbereich > Freigegeben.
    2. Erstellen Sie den Ordner labelbox_demo, falls dieser noch nicht verfügbar ist. i: Klicken Sie neben Freigegeben auf die NACH-UNTEN-TASTE. ii. Klicken Sie auf Erstellen > Ordner. iii. Geben Sie labelbox_demo ein. iv: Klicken Sie auf Ordner erstellen.
    3. Wählen Sie den Ordner labelbox_demo aus. Importieren Sie das Starternotebook namens labelbox_databricks_example.ipynb, falls es noch nicht im Ordner vorhanden ist. i: Klicken Sie neben labelbox_demo auf die NACH-UNTEN-TASTE. ii. Klicken Sie auf Importieren. iii. Klicken Sie auf URL. iv. Geben Sie https://github.com/Labelbox/labelbox-python/blob/develop/examples/integrations/databricks/labelbox_databricks_example.ipynb ein, und klicken Sie auf Importieren.
  4. Fahren Sie mit dem Einrichten des ML-Clusters und des Labelbox-Starternotebooks fort.

Einrichten des ML-Clusters und des Labelbox-Starternotebooks

  1. Überprüfen Sie, ob die erforderlichen Labelbox-Bibliotheken in Ihrem ML-Cluster installiert sind:
    1. Klicken Sie auf der Seitenleiste auf Compute.

    2. Wählen Sie Ihren ML-Cluster aus. Verwenden Sie für die Suche nach dem Cluster bei Bedarf das Feld Filtern.

      Hinweis

      Wenn Sie Partner Connect zum Herstellen einer Verbindung mit Labelbox verwendet haben, sollte der Name des ML-Clusters LABELBOX_CLUSTER lauten.

    3. Klicken Sie auf die Registerkarte Bibliothek.

    4. Installieren Sie das Paket labelbox, falls es nicht aufgeführt ist. i: Klicken Sie auf Neu installieren. ii. Klicken Sie auf PyPI. iii. Geben Sie unter Paket anschließend labelbox ein. iv. Klicken Sie auf Installieren.

    5. Installieren Sie das Paket labelspark, falls es nicht aufgeführt ist. i: Klicken Sie auf Neu installieren. ii. Klicken Sie auf PyPI. iii. Geben Sie unter Paket anschließend labelspark ein. iv. Klicken Sie auf Installieren.

  2. Fügen Sie Ihren ML-Cluster an das Starternotebook an:
    1. Klicken Sie auf der Seitenleiste auf Arbeitsbereich > Freigegeben > labelbox_demo > labelbox_databricks_example.ipynb.
    2. Fügen Sie Ihren ML-Cluster an das Notebook an.
  3. Durchsuchen Sie das Notebook, um zu erfahren, wie Sie Labelbox automatisieren.

Zusätzliche Ressourcen