Verbinden mit John Snow Labs

John Snow Labs bietet produktionsfähige, skalierbare und trainierbare Versionen der neuesten Forschung in der natürlichen Sprachverarbeitung (NLP) über die folgenden Produkte:

  • Spark NLP: state-of-the-art NLP für Python, Java oder Scala.
  • Spark NLP für das Gesundheitswesen: state-of-the-art klinische und biomedizinische NLP.
  • Spark OCR: eine skalierbare, private und hochgenaue OCR- und Deidentifizierungsbibliothek.

Sie können Ihre Azure Databricks-Cluster mit John Snow Labs integrieren.

Hinweis

John Snow Labs lässt sich nicht mit Databricks SQL-Warehouses (ehemals Databricks SQL-Endpunkte) integrieren.

Verbinden Sie sich über Partner Connect mit John Snow Labs

Die Schritte von Partner Connect decken die gängigsten NLP- und OCR-Aufgaben ab:

  • Erstellen Sie einen neuen Cluster in Ihrem Azure Databricks-Arbeitsbereich.
  • Installieren Sie automatisch die NLP- und OCR-Bibliotheken von John Snow Labs im neuen Cluster.
  • Erstellen Sie eine 30-Tage-Testlizenz für die NLP- und OCR-Bibliotheken von John Snow Labs und stellen Sie sie bereit.
  • Kopieren Sie mehr als 20 einsatzbereite Python-Notebooks in den neuen Cluster.

Unterschiede zwischen Standardverbindungen und John Snow Labs

Um eine Verbindung mit John Snow Labs über Partner Connect herzustellen, führen Sie die Schritte unter Herstellen einer Verbindung mit einem ML-Partner mittels Partner Connect aus. Die John Snow Labs-Verbindung unterscheidet sich in folgenden Punkten von den üblichen Machine Learning-Verbindungen:

  • Sie benötigen eine gültige Kreditkarte, um die Schritte für Partner Connect abzuschließen. Ihre Kreditkarte wird nach Ablauf der Testversion mit nutzungsbasierten Gebühren belastet.
  • Nachdem Sie den Anweisungen auf dem Bildschirm gefolgt sind, um Ihre John Snow Labs NLP-Testversion zu starten, überprüfen Sie Ihren E-Mail-Posteingang auf eine Nachricht von John Snow Labs, die Anweisungen zu den ersten Schritten enthält, und folgen Sie dann den Anweisungen in der Nachricht. Es kann bis zu einer halben Stunde dauern, bis diese Nachricht eingeht.

Schritte zum Herstellen einer Verbindung

Informationen zum Herstellen einer Verbindung Ihres Azure Databricks-Arbeitsbereichs mit John Snow Labs über Partner Connect finden Sie unter Herstellen einer Verbindung mit ML-Partnern mithilfe von Partner Connect.

Manuelles Verbinden mit John Snow Labs

Folgen Sie diesen Anweisungen, um die John Snow Labs NLP- und OCR-Bibliotheken und -Notebooks automatisch auf Ihrem Cluster zu installieren und Ihre Testversion von John Snow Labs zu aktivieren, falls Sie noch kein John Snow Labs-Konto besitzen.

Anforderungen

Bevor Sie John Snow Labs integrieren, müssen Sie folgendes haben:

  • Erstellen Sie einen Cluster in Ihrem Azure Databricks-Arbeitsbereich.

  • Ein persönliches Zugriffstoken für Azure Databricks.

    Hinweis

    Als bewährte Methode für die Sicherheit empfiehlt Databricks, dass Sie bei der Authentifizierung mit automatisierten Tools, Systemen, Skripten und Anwendungen persönliche Zugriffstoken verwenden, die zu Dienstprinzipalen und nicht zu Benutzern des Arbeitsbereichs gehören. Informationen zum Erstellen von Token für Dienstprinzipale finden Sie unter Verwalten von Token für einen Dienstprinzipal.

Prozedur

Führen Sie die folgenden Schritte aus, um die Integration mit John Snow Labs vorzunehmen:

Hinweis

Wie Sie die Integration von John Snow Labs schneller abschließen können, erfahren Sie unter Herstellen einer Verbindung mit John Snow Labs mithilfe von Partner Connect.

  1. Vergewissern Sie sich, dass Sie die Anforderungen für John Snow Labs erfüllen.

  2. Wechseln Sie zur NLP von John Snow Labs auf der Databricks-Webseite.

  3. Klicken Sie auf Installieren in meinem Databricks-Konto.

  4. Geben Sie im Dialogfeld Bitte informieren Sie uns über sich selbst Ihren Vornamen, Ihren Nachnamen und die E-Mail-Adresse des Unternehmens ein.

  5. Geben Sie für Databricks Instanz-URL Ihre Azure Databricks Arbeitsbereich-URL ein, zum Beispiel https://adb-1234567890123456.7.azuredatabricks.net/?o=1234567890123456.

  6. Geben Sie für Databricks-Zugriffstoken den Token-Wert aus den Anforderungen in diesem Artikel ein.

  7. Klicken Sie auf Verbindung testen.

  8. Nachdem die Verbindung erfolgreich hergestellt wurde, wählen Sie zum Auswählen eines Clusters für die Installation den Cluster aus den Anforderungen in diesem Artikel aus.

  9. Klicken Sie auf Testlizenz abrufen.

  10. Überprüfen Sie Ihren E-Mail-Posteingang für eine Nachricht von John Snow Labs, die eine Anforderung enthält, Ihre E-Mail-Adresse zu überprüfen.

  11. Klicken Sie in der Nachricht auf Meine E-Mail überprüfen.

  12. Nach einigen Minuten überprüfen Sie Ihren E-Mail-Posteingang erneut für eine andere Nachricht von John Snow Labs, die Anweisungen für den ersten Start enthält. Beachten Sie, dass es in einigen Fällen bis zu einer halben Stunde dauern könnte, bis diese Nachricht ankommt.

  13. Folgen Sie den Anweisungen in der Meldung.

    Hinweis

    Informationen zum manuellen Installieren der John Snow Labs-Bibliotheken und -Notebooks auf Ihrem Cluster finden Sie auf der Website von John Snow Labs:

  14. Um ein Upgrade für Ihre kostenlose Testversion von John Snow Labs vorzunehmen, melden Sie sich bei Ihrem John Snow Labs-Konto unter https://my.johnsnowlabs.com/login an.

  15. Fahren Sie mit Nächste Schritte fort.

Nächste Schritte

Erkunden Sie eine oder mehrere der folgenden Ressourcen auf der John Snow Labs-Website: