Condividi tramite


Che cos'è l'interfaccia della riga di comando di Databricks?

Nota

Queste informazioni si applicano all'interfaccia della riga di comando di Databricks versione 0.205 e successive. L'interfaccia della riga di comando di Databricks è disponibile in anteprima pubblica.

L'uso dell'interfaccia della riga di comando di Databricks è soggetto all'Informativa sulla privacy di Databricks e databricks, incluse eventuali disposizioni sui dati di utilizzo.

L'interfaccia della riga di comando di Databricks (nota anche come interfaccia della riga di comando di Databricks) offre uno strumento per automatizzare la piattaforma Azure Databricks dal terminale, dal prompt dei comandi o dagli script di automazione. È anche possibile eseguire i comandi dell'interfaccia della riga di comando di Databricks dall'interno di un'area di lavoro di Databricks usando il terminale Web. Vedere Eseguire i comandi della shell nel terminale Web di Azure Databricks.

Per installare e configurare l'autenticazione per l'interfaccia della riga di comando di Databricks, vedere Installare o aggiornare l'interfaccia della riga di comando di Databricks e l'autenticazione per l'interfaccia della riga di comando di Databricks.

Informazioni per gli utenti dell'interfaccia della riga di comando di Databricks legacy

  • Databricks non prevede alcun supporto o nuova funzionalità per l'interfaccia della riga di comando di Databricks legacy.
  • Per altre informazioni sull'interfaccia della riga di comando di Databricks legacy, vedere l'interfaccia della riga di comando di Databricks (legacy).
  • Per eseguire la migrazione dalla CLI di Databricks versione 0.18 o precedente alla CLI di Databricks versione 0.205 o successiva, vedere Migrazione della CLI di Databricks.

Come funziona l'interfaccia della riga di comando di Databricks?

L'interfaccia della riga di comando esegue il wrapping dell'API REST di Databricks, che fornisce endpoint per la modifica o la richiesta di informazioni sugli oggetti dell'account e dell'area di lavoro di Azure Databricks. Vedere le informazioni di riferimento sull'API REST di Azure Databricks.

Ad esempio, per stampare informazioni su un singolo cluster in un'area di lavoro, eseguire l'interfaccia della riga di comando come indicato di seguito:

databricks clusters get 1234-567890-a12bcde3

Con curl, l'operazione equivalente è la seguente:

curl --request GET "https://${DATABRICKS_HOST}/api/2.0/clusters/get" \
     --header "Authorization: Bearer ${DATABRICKS_TOKEN}" \
     --data '{ "cluster_id": "1234-567890-a12bcde3" }'

Esempio: creare un processo di Azure Databricks

L'esempio seguente usa l'interfaccia della riga di comando per creare un processo di Azure Databricks. Questo processo contiene una singola attività di processo. Questa attività esegue il notebook di Azure Databricks specificato. Questo notebook ha una dipendenza da una versione specifica del pacchetto PyPI denominato wheel. Per eseguire questa attività, il processo crea temporaneamente un cluster di processi che esporta una variabile di ambiente denominata PYSPARK_PYTHON. Dopo l'esecuzione del processo, il cluster viene terminato.

databricks jobs create --json '{
  "name": "My hello notebook job",
  "tasks": [
    {
      "task_key": "my_hello_notebook_task",
      "notebook_task": {
        "notebook_path": "/Workspace/Users/someone@example.com/hello",
        "source": "WORKSPACE"
      },
      "libraries": [
        {
          "pypi": {
            "package": "wheel==0.41.2"
          }
        }
      ],
      "new_cluster": {
        "spark_version": "13.3.x-scala2.12",
        "node_type_id": "Standard_DS3_v2",
        "num_workers": 1,
        "spark_env_vars": {
          "PYSPARK_PYTHON": "/databricks/python3/bin/python3"
        }
      }
    }
  ]
}'

Passaggi successivi