DatabricksCluster Klas
Definieert databricks-clustergegevens voor gebruik in een DatabricksSection.
Initialiseren.
Constructor
DatabricksCluster(existing_cluster_id=None, spark_version=None, node_type=None, instance_pool_id=None, num_workers=None, min_workers=None, max_workers=None, spark_env_variables=None, spark_conf=None, init_scripts=None, cluster_log_dbfs_path=None, permit_cluster_restart=None)
Parameters
| Name | Description |
|---|---|
|
existing_cluster_id
|
Een cluster-id van een bestaand interactief cluster in de Databricks-werkruimte. Als deze parameter is opgegeven, moet geen van de andere parameters worden opgegeven. Default value: None
|
|
spark_version
|
De versie van Spark voor het Databricks-cluster wordt uitgevoerd. Voorbeeld: "10.4.x-scala2.12". Default value: None
|
|
node_type
|
De Azure VM-knooppunttypen voor het Databricks-runcluster. Voorbeeld: 'Standard_D3_v2'. Default value: None
|
|
instance_pool_id
|
De exemplaargroep-id waaraan het cluster moet worden gekoppeld. Default value: None
|
|
num_workers
|
Het aantal werkrollen voor een Databricks-runcluster. Als deze parameter is opgegeven, moeten de Default value: None
|
|
min_workers
|
Het minimale aantal werkrollen voor een automatisch geschaald Databricks-cluster. Default value: None
|
|
max_workers
|
Het aantal werkrollen voor een automatisch geschaald Databricks-cluster. Default value: None
|
|
spark_env_variables
|
dict(<xref:{str:str}>)
De Spark-omgevingsvariabelen voor het Databricks-runcluster. Default value: None
|
|
spark_conf
|
dict(<xref:{str:str}>)
De Spark-configuratie voor het Databricks-cluster wordt uitgevoerd. Default value: None
|
|
init_scripts
|
Afgeschreven Databricks heeft aangekondigd dat het init-script dat is opgeslagen in DBFS, na 1 december 2023 niet meer werkt. Als u het probleem wilt verhelpen, gebruikt u globale init-scripts in Databricks na https://learn.microsoft.com/azure/databricks/init-scripts/global 2) commentaar op de regel van init_scripts in uw AzureML Databricks-stap. Default value: None
|
|
cluster_log_dbfs_path
|
Het DBFS-pad naar de locatie waar logboeken van clusters moeten worden geleverd. Default value: None
|
|
permit_cluster_restart
|
als existing_cluster_id is opgegeven, geeft deze parameter aan of het cluster namens de gebruiker opnieuw kan worden opgestart. Default value: None
|
Methoden
| validate |
Valideer de opgegeven Databricks-clusterdetails. Valideer de typen opgegeven parameters en controleert of de juiste combinatie van parameters is opgegeven. U moet bijvoorbeeld de |
validate
Valideer de opgegeven Databricks-clusterdetails.
Valideer de typen opgegeven parameters en controleert of de juiste combinatie van parameters is opgegeven. U moet bijvoorbeeld de existing_cluster_id rest van de clusterparameters opgeven of opgeven. Zie de parameterdefinities van de constructor voor meer informatie.
validate()
Uitzonderingen
| Type | Description |
|---|---|
|
class:azureml.exceptions.UserErrorException
|