Was ist die Databricks-CLI?
Hinweis
Diese Informationen gelten für Databricks CLI-Versionen 0.205 und höher. Die Databricks CLI befindet sich in der öffentlichen Vorschau.
Die Verwendung von Databricks CLI unterliegt der Datenbricks-Lizenz - und Databricks-Datenschutzerklärung, einschließlich der Bestimmungen zu Nutzungsdaten.
Die Databricks-Befehlszeilenschnittstelle – auch als Databricks-CLI bezeichnet – ist ein Tool zum Automatisieren der Azure Databricks-Plattform über Ihr Terminal, Ihre Eingabeaufforderung oder über Automatisierungsskripts. Sie können Databricks CLI-Befehle auch in einem Databricks-Arbeitsbereich mithilfe des Webterminals ausführen. Siehe Ausführen von Shellbefehlen im Azure Databricks-Webterminal.
Informationen zum Installieren und Konfigurieren der Authentifizierung für die Databricks CLI finden Sie unter Installieren oder Aktualisieren der Databricks CLI und Authentifizierung für die Databricks CLI.
Informationen für Benutzer*innen der Legacy-Databricks-CLI
- Aufseiten von Databricks ist derzeit kein neues Feature für die Legacy-Databricks-CLI geplant.
- Weitere Informationen zur Legacy-Databricks-CLI finden Sie unter Databricks-CLI (Legacy).
- Informationen zum Migrieren der Databricks CLI-Version 0.18 oder niedriger zur Databricks CLI-Version 0.205 oder höher finden Sie unter Databricks CLI-Migration.
Wie funktioniert die Databricks-CLI?
Die CLI umschließt die Databricks-REST-API, die Endpunkte zum Ändern oder Anfordern von Informationen zu Azure Databricks-Konto- und Arbeitsbereichsobjekten bereitstellt. Weitere Informationen finden Sie unter Referenz zur Azure Databricks-REST-API.
Wenn Sie beispielsweise Informationen zu einem einzelnen Cluster in einem Arbeitsbereich drucken möchten, führen Sie die CLI wie folgt aus:
databricks clusters get 1234-567890-a12bcde3
Bei curl
lautet der entsprechende Vorgang wie folgt:
curl --request GET "https://${DATABRICKS_HOST}/api/2.0/clusters/get" \
--header "Authorization: Bearer ${DATABRICKS_TOKEN}" \
--data '{ "cluster_id": "1234-567890-a12bcde3" }'
Beispiel: Erstellen eines Azure Databricks-Auftrags
Im folgenden Beispiel wird die CLI verwendet, um einen Azure Databricks-Auftrag zu erstellen. Dieser Auftrag enthält eine einzelne Aufgabe. Mit dieser Aufgabe wird das angegebene Azure Databricks-Notebook ausgeführt. Dieses Notebook verfügt über eine Abhängigkeit von einer bestimmten Version des PyPI-Pakets namens wheel
. Zum Ausführen dieser Aufgabe erstellt der Auftrag vorübergehend einen Auftragscluster, der eine Umgebungsvariable namens PYSPARK_PYTHON
exportiert. Nachdem der Auftrag ausgeführt wurde, wird der Cluster beendet.
databricks jobs create --json '{
"name": "My hello notebook job",
"tasks": [
{
"task_key": "my_hello_notebook_task",
"notebook_task": {
"notebook_path": "/Workspace/Users/someone@example.com/hello",
"source": "WORKSPACE"
},
"libraries": [
{
"pypi": {
"package": "wheel==0.41.2"
}
}
],
"new_cluster": {
"spark_version": "13.3.x-scala2.12",
"node_type_id": "Standard_DS3_v2",
"num_workers": 1,
"spark_env_vars": {
"PYSPARK_PYTHON": "/databricks/python3/bin/python3"
}
}
}
]
}'
Nächste Schritte
- Informationen zum Installieren und Verwenden der CLI finden Sie im Databricks CLI-Tutorial.
- Informationen zum Überspringen des Tutorials zum sofortigen Installieren der CLI finden Sie unter Installieren oder Aktualisieren der Databricks-CLI.
- Informationen zum Einrichten der Authentifizierung zwischen der CLI und Ihren Azure Databricks-Konten und -Arbeitsbereichen finden Sie unter Authentifizierung für die Databricks-CLI.
- Informationen zum schnellen Wechseln zwischen verknüpften CLI-Einstellungen mithilfe von Konfigurationsprofilen finden Sie unter Konfigurationsprofile für die Databricks-CLI.
- Informationen zum grundlegenden Verwenden der CLI finden Sie unter Grundlegendes Verwenden der Databricks-CLI.
- Hilfe zu CLI-Befehlen finden Sie unter Databricks-CLI-Befehle.