DatabricksCluster Classe
Define informações de cluster do Databricks para uso em um DatabricksSection.
Inicializar.
Construtor
DatabricksCluster(existing_cluster_id=None, spark_version=None, node_type=None, instance_pool_id=None, num_workers=None, min_workers=None, max_workers=None, spark_env_variables=None, spark_conf=None, init_scripts=None, cluster_log_dbfs_path=None, permit_cluster_restart=None)
Parâmetros
| Nome | Description |
|---|---|
|
existing_cluster_id
|
Uma ID de cluster de um cluster interativo existente no workspace do Databricks. Se esse parâmetro for especificado, nenhum dos outros parâmetros deverá ser especificado. Valor padrão: None
|
|
spark_version
|
A versão do Spark para o cluster de execução do Databricks. Exemplo: "10.4.x-scala2.12". Valor padrão: None
|
|
node_type
|
Os tipos de nó de VM do Azure para o cluster de execução do Databricks. Exemplo: "Standard_D3_v2". Valor padrão: None
|
|
instance_pool_id
|
A ID do pool de instância à qual o cluster precisa ser anexado. Valor padrão: None
|
|
num_workers
|
O número de trabalhos para um cluster de execução do Databricks. Se esse parâmetro for especificado, o parâmetro e Valor padrão: None
|
|
min_workers
|
O número mínimo de trabalhadores para um cluster do Databricks dimensionado automaticamente. Valor padrão: None
|
|
max_workers
|
O número de trabalhos para um cluster de execução do Databricks dimensionado automaticamente. Valor padrão: None
|
|
spark_env_variables
|
dict(<xref:{str:str}>)
As variáveis de ambiente do Spark para o cluster de execução do Databricks. Valor padrão: None
|
|
spark_conf
|
dict(<xref:{str:str}>)
A configuração do Spark para o cluster de execução do Databricks. Valor padrão: None
|
|
init_scripts
|
Preterido. O Databricks anunciou que o script de inicialização armazenado no DBFS interromperá o trabalho após 1º de dezembro de 2023. Para atenuar o problema, use scripts de inicialização globais no databricks após https://learn.microsoft.com/azure/databricks/init-scripts/global 2) comente a linha de init_scripts na etapa do databricks do AzureML. Valor padrão: None
|
|
cluster_log_dbfs_path
|
O caminho DBFS para onde os logs de clusters precisam ser entregues. Valor padrão: None
|
|
permit_cluster_restart
|
se existing_cluster_id for especificado, esse parâmetro informará se o cluster pode ser reiniciado em nome do usuário. Valor padrão: None
|
Métodos
| validate |
Valide os detalhes especificados do cluster do Databricks. Valide verifica os tipos de parâmetros fornecidos, bem como se a combinação correta de parâmetros é fornecida. Por exemplo, você precisa especificar ou |
validate
Valide os detalhes especificados do cluster do Databricks.
Valide verifica os tipos de parâmetros fornecidos, bem como se a combinação correta de parâmetros é fornecida. Por exemplo, você precisa especificar ou existing_cluster_id especificar o restante dos parâmetros de cluster. Para obter mais informações, consulte as definições de parâmetro do construtor.
validate()
Exceções
| Tipo | Description |
|---|---|
|
class:azureml.exceptions.UserErrorException
|