分享方式:


什麼是 Databricks CLI?

注意

此資訊適用於 Databricks CLI 0.205 版和更新版本。 Databricks CLI 處於 公開預覽狀態

Databricks CLI 使用受限於 Databricks 授權Databricks 隱私權注意事項,包括任何使用量數據布建。

Databricks 命令行介面(也稱為 Databricks CLI)提供工具,可從終端機、命令提示字元或自動化腳本自動化 Azure Databricks 平臺。 您也可以使用 Web 終端機,從 Databricks 工作區內執行 Databricks CLI 命令。 請參閱在 Azure Databricks 網路終端機中執行殼層命令

若要安裝及設定 Databricks CLI 的驗證,請參閱安裝或更新 Databricks CLI 的 Databricks CLI 和驗證。

舊版 Databricks CLI 用戶的資訊

  • Databricks 計劃不支援或新功能適用於舊版 Databricks CLI。
  • 如需舊版 Databricks CLI 的詳細資訊,請參閱 Databricks CLI(舊版)。
  • 若要從 Databricks CLI 0.18 版或更低版本移轉至 Databricks CLI 0.205 版或更新版本,請參閱 Databricks CLI 移轉

Databricks CLI 如何運作?

CLI 會包裝 Databricks REST API,其提供端點來修改或要求 Azure Databricks 帳戶和工作區對象的相關信息。 請參閱 Azure Databricks REST API 參考

例如,若要列印工作區中個別叢集的相關信息,請執行 CLI,如下所示:

databricks clusters get 1234-567890-a12bcde3

使用 curl時,對等作業如下所示:

curl --request GET "https://${DATABRICKS_HOST}/api/2.0/clusters/get" \
     --header "Authorization: Bearer ${DATABRICKS_TOKEN}" \
     --data '{ "cluster_id": "1234-567890-a12bcde3" }'

範例:建立 Azure Databricks 作業

下列範例會使用 CLI 來建立 Azure Databricks 作業。 此作業包含單一作業工作。 此工作會執行指定的 Azure Databricks 筆記本。 此筆記本相依於名為 wheel的特定 PyPI 套件版本。 若要執行這項工作,作業會暫時建立作業叢集,以匯出名為的 PYSPARK_PYTHON環境變數。 作業執行之後,叢集就會終止。

databricks jobs create --json '{
  "name": "My hello notebook job",
  "tasks": [
    {
      "task_key": "my_hello_notebook_task",
      "notebook_task": {
        "notebook_path": "/Workspace/Users/someone@example.com/hello",
        "source": "WORKSPACE"
      },
      "libraries": [
        {
          "pypi": {
            "package": "wheel==0.41.2"
          }
        }
      ],
      "new_cluster": {
        "spark_version": "13.3.x-scala2.12",
        "node_type_id": "Standard_DS3_v2",
        "num_workers": 1,
        "spark_env_vars": {
          "PYSPARK_PYTHON": "/databricks/python3/bin/python3"
        }
      }
    }
  ]
}'

下一步