Databricks CLI-Tutorial

Hinweis

Diese Informationen gelten für die Databricks-CLI-Version 0.205 und höher, die als Public Preview verfügbar sind. Führen Sie databricks -v aus, um die Version Ihrer Databricks CLI zu ermitteln.

Die Databricks-Befehlszeilenschnittstelle (auch als Databricks CLI bezeichnet) ist ein Hilfsprogramm und bietet eine benutzerfreundliche Schnittstelle zum Automatisieren der Azure Databricks-Plattform über Ihr Terminal, Ihre Eingabeaufforderung oder über Automatisierungsskripts.

In diesem Artikel wird veranschaulicht, wie Sie Ihren lokalen Entwicklungscomputer verwenden, um schnell mit dem Arbeiten mit der Databricks-CLI beginnen zu können. Weitere Informationen finden Sie unter Was ist die Databricks-CLI?.

In diesem praktischen Tutorial wird Folgendes vorausgesetzt:

Führen Sie die folgenden Schritte aus:

  1. Installieren Sie die Databricks CLI wie folgt, falls sie noch nicht installiert ist:

    Linux, macOS

    Verwenden Sie Homebrew, um die Databricks CLI zu installieren, indem Sie die folgenden beiden Befehle ausführen:

    brew tap databricks/tap
    brew install databricks
    

    Windows

    Sie können Winget, Chocolatey oder das Windows Subsystem für Linux (WSL) verwenden, um die Databricks CLI zu installieren. Wenn Sie winget, Chocolatey oder das WSL nicht verwenden können, sollten Sie dieses Verfahren überspringen und stattdessen die Eingabeaufforderung oder PowerShell verwenden, um die Databricks CLI aus der Quelle zu installieren.

    Hinweis

    Die Installation der Databricks CLI mit Chocolatey befindet sich in der experimentellen Phase.

    Um winget zum Installieren der Databricks CLI zu verwenden, führen Sie die folgenden beiden Befehle aus, und starten Sie dann die Eingabeaufforderung neu:

    winget search databricks
    winget install Databricks.DatabricksCLI
    

    Um Chocolatey zum Installieren der Databricks CLI zu verwenden, führen Sie den folgenden Befehl aus:

    choco install databricks-cli
    

    So installieren Sie die Databricks CLI mit dem WSL

    1. Installieren Sie curl und zip über das WSL. Weitere Informationen finden Sie in der Dokumentation zu Ihrem Betriebssystem.

    2. Verwenden Sie WSL, um die Databricks CLI zu installieren, indem Sie den folgenden Befehl ausführen:

      curl -fsSL https://raw.githubusercontent.com/databricks/setup-cli/main/install.sh | sh
      
  2. Vergewissern Sie sich, dass die Databricks CLI installiert ist, indem Sie den folgenden Befehl ausführen, der die aktuelle Version der installierten Databricks CLI anzeigt. Diese Version sollte 0.205.0 oder höher sein:

    databricks -v
    

    Hinweis

    Wenn Sie databricks ausführen, aber einen Fehler wie command not found: databricks erhalten, oder wenn Sie databricks -v ausführen und eine Versionsnummer von 0.18 oder niedriger aufgeführt ist, bedeutet dies, dass Ihr Computer nicht die richtige Version der ausführbaren Databricks-CLI-Datei finden kann. Weitere Informationen zum Beheben dieses Problems finden Sie unter Überprüfen Ihrer CLI-Installation.

Führen Sie nach der Installation der Databricks CLI die folgenden Schritte aus:

Hinweis

In diesem Tutorial wird davon ausgegangen, dass Sie die OAuth-Benutzer-zu-Computer-(U2M)-Authentifizierung verwenden möchten, um die Befehlszeilenschnittstelle (CLI) mit Ihrem Azure Databricks-Benutzerkonto zu authentifizieren. Informationen zum Konfigurieren der CLI für das Verwenden anderer Databricks-Authentifizierungstypen finden Sie unter Authentifizierung für die Databricks-CLI.

  1. Verwenden Sie die Databricks CLI, um die OAuth-Tokenverwaltung lokal zu initiieren, indem Sie den folgenden Befehl für jedes Zielkonto oder jeden Arbeitsbereich ausführen.

    Ersetzen Sie bei Vorgängen auf Kontoebene im folgenden Befehl die folgenden Platzhalter:

    databricks auth login --host <account-console-url> --account-id <account-id>
    

    Für Vorgänge auf Arbeitsbereichsebene ersetzen Sie im folgenden Befehl <workspace-url> durch die URL Ihres Azure Databricks pro Arbeitsbereich, zum Beispiel https://adb-1234567890123456.7.azuredatabricks.net.

    databricks auth login --host <workspace-url>
    
  2. Die Databricks CLI fordert Sie auf, die Informationen zu speichern, die Sie als Azure Databricks-Konfigurationsprofil eingegeben haben. Drücken Sie die EINGABETASTE (Enter), um den vorgeschlagenen Profilnamen zu übernehmen, oder geben Sie den Namen eines neuen oder bereits vorhandenen Profils ein. Jedes vorhandene Profil mit demselben Namen wird mit den von Ihnen eingegebenen Informationen überschrieben. Sie können Profile verwenden, um Ihren Authentifizierungskontext schnell zwischen mehreren Konten oder Arbeitsbereichen zu wechseln.

    Verwenden Sie zum Abrufen einer Liste vorhandener Profile in einem separaten Terminal oder einer separaten Eingabeaufforderung die Databricks CLI, um den Befehl databricks auth profiles auszuführen. Um die vorhandenen Einstellungen eines bestimmten Profils anzuzeigen, führen Sie den Befehl databricks auth env --profile <profile-name> aus.

  3. Füllen Sie in Ihrem Webbrowser die Anweisungen auf dem Bildschirm aus, um sich bei Ihrem Azure Databricks-Konto oder -Arbeitsbereich anzumelden.

  4. Um den aktuellen OAuth-Tokenwert eines Profils und den bevorstehenden Ablaufzeitstempel eines Profils anzuzeigen, führen Sie einen der folgenden Befehle aus:

    Führen Sie für Vorgänge auf Kontoebene die folgenden Befehle aus:

    • databricks auth token -p <profile-name>
    • databricks auth token --host <workspace-url> --account-id <account-id>
    • databricks auth token --host <workspace-url> --account-id <account-id> -p <profile-name>

    Wenn Sie mehrere Profile mit denselben --host und --account-id-Werten haben, müssen Sie möglicherweise die Optionen --host, --account-id und -p zusammen angeben, damit die Databricks-CLI die richtigen passenden OAuth-Token-Informationen findet.

    Führen Sie für Vorgänge auf Arbeitsbereichsebene die folgenden Befehle aus:

    • databricks auth token -p <profile-name>
    • databricks auth token --host <workspace-url>
    • databricks auth token --host <workspace-url> -p <profile-name>

    Wenn Sie über mehrere Profile mit denselben --host-Werten verfügen, müssen Sie möglicherweise die --host und -p-Optionen zusammen angeben, damit die Databricks CLI die richtigen übereinstimmenden OAuth-Token-Informationen finden kann.

Nächste Schritte

Nach dem Einrichten der Databricks CLI: