Condividi tramite


Cos'è il CLI di Databricks?

Nota

Queste informazioni si applicano all'interfaccia della riga di comando di Databricks versione 0.205 e successive. L'interfaccia della riga di comando di Databricks è disponibile in anteprima pubblica.

L'uso della CLI di Databricks è soggetto alla Licenza di Databricks e all'Informativa sulla privacy di Databricks, incluse eventuali disposizioni sui dati di utilizzo.

L'interfaccia a riga di comando Databricks CLI consente di interagire con la piattaforma Azure Databricks dal proprio terminale locale o attraverso script di automazione. È anche possibile eseguire i comandi dell'interfaccia della riga di comando di Databricks dall'interno di un'area di lavoro di Databricks usando il terminale Web. Vedere Eseguire i comandi della shell nel terminale Web di Azure Databricks.

Per installare e configurare l'autenticazione per il Databricks CLI, vedere Installare o aggiornare il Databricks CLI e Autenticazione per il Databricks CLI.

Consiglio

L'origine dell'interfaccia della riga di comando di Databricks è disponibile pubblicamente nel repository GitHub databricks/cli.

Informazioni per gli utenti del Databricks CLI legacy

  • Databricks non ha piani per il supporto o lo sviluppo di nuove funzionalità per la versione obsoleta dell'interfaccia della riga di comando di Databricks.
  • Per ulteriori informazioni sulla versione legacy dell'interfaccia della riga di comando di Databricks, vedere Legacy Databricks CLI.
  • Per eseguire la migrazione dalla CLI di Databricks versione 0.18 o precedente alla CLI di Databricks versione 0.205 o successiva, vedere Migrazione della CLI di Databricks.

Come funziona l'interfaccia della riga di comando di Databricks?

La CLI integra l'API REST di Databricks, che fornisce endpoint per la modifica o la richiesta di informazioni sugli oggetti dell'area di lavoro e dell'account di Azure Databricks. Consulta il riferimento API REST di Azure Databricks.

Ad esempio, per stampare informazioni su un singolo cluster in un'area di lavoro, eseguire l'interfaccia della riga di comando come indicato di seguito:

databricks clusters get 1234-567890-a12bcde3

Con curl, l'operazione equivalente è la seguente:

curl --request GET "https://${DATABRICKS_HOST}/api/2.0/clusters/get" \
     --header "Authorization: Bearer ${DATABRICKS_TOKEN}" \
     --data '{ "cluster_id": "1234-567890-a12bcde3" }'

Esempio: creare un'attività di Azure Databricks

L'esempio seguente usa l'interfaccia della riga di comando per creare un processo di Azure Databricks. Questo lavoro contiene una singola attività lavorativa. Questa operazione esegue il notebook specificato di Azure Databricks. Questo notebook ha una dipendenza da una versione specifica del pacchetto PyPI denominato wheel. Per eseguire questa attività, il processo crea temporaneamente un cluster di processi che esporta una variabile di ambiente denominata PYSPARK_PYTHON. Dopo l'esecuzione del processo, il cluster viene terminato.

databricks jobs create --json '{
  "name": "My hello notebook job",
  "tasks": [
    {
      "task_key": "my_hello_notebook_task",
      "notebook_task": {
        "notebook_path": "/Workspace/Users/someone@example.com/hello",
        "source": "WORKSPACE"
      },
      "libraries": [
        {
          "pypi": {
            "package": "wheel==0.41.2"
          }
        }
      ],
      "new_cluster": {
        "spark_version": "13.3.x-scala2.12",
        "node_type_id": "Standard_DS3_v2",
        "num_workers": 1,
        "spark_env_vars": {
          "PYSPARK_PYTHON": "/databricks/python3/bin/python3"
        }
      }
    }
  ]
}'

Passaggi successivi