Delen via


DatabricksCluster Klas

Definieert databricks-clustergegevens voor gebruik in een DatabricksSection.

Initialiseren.

Constructor

DatabricksCluster(existing_cluster_id=None, spark_version=None, node_type=None, instance_pool_id=None, num_workers=None, min_workers=None, max_workers=None, spark_env_variables=None, spark_conf=None, init_scripts=None, cluster_log_dbfs_path=None, permit_cluster_restart=None)

Parameters

Name Description
existing_cluster_id
str

Een cluster-id van een bestaand interactief cluster in de Databricks-werkruimte. Als deze parameter is opgegeven, moet geen van de andere parameters worden opgegeven.

Default value: None
spark_version
str

De versie van Spark voor het Databricks-cluster wordt uitgevoerd. Voorbeeld: "10.4.x-scala2.12".

Default value: None
node_type
str

De Azure VM-knooppunttypen voor het Databricks-runcluster. Voorbeeld: 'Standard_D3_v2'.

Default value: None
instance_pool_id
str

De exemplaargroep-id waaraan het cluster moet worden gekoppeld.

Default value: None
num_workers
int

Het aantal werkrollen voor een Databricks-runcluster. Als deze parameter is opgegeven, moeten de min_workers en max_workers parameters niet worden opgegeven.

Default value: None
min_workers
int

Het minimale aantal werkrollen voor een automatisch geschaald Databricks-cluster.

Default value: None
max_workers
int

Het aantal werkrollen voor een automatisch geschaald Databricks-cluster.

Default value: None
spark_env_variables
dict(<xref:{str:str}>)

De Spark-omgevingsvariabelen voor het Databricks-runcluster.

Default value: None
spark_conf
dict(<xref:{str:str}>)

De Spark-configuratie voor het Databricks-cluster wordt uitgevoerd.

Default value: None
init_scripts

Afgeschreven Databricks heeft aangekondigd dat het init-script dat is opgeslagen in DBFS, na 1 december 2023 niet meer werkt. Als u het probleem wilt verhelpen, gebruikt u globale init-scripts in Databricks na https://learn.microsoft.com/azure/databricks/init-scripts/global 2) commentaar op de regel van init_scripts in uw AzureML Databricks-stap.

Default value: None
cluster_log_dbfs_path
str

Het DBFS-pad naar de locatie waar logboeken van clusters moeten worden geleverd.

Default value: None
permit_cluster_restart

als existing_cluster_id is opgegeven, geeft deze parameter aan of het cluster namens de gebruiker opnieuw kan worden opgestart.

Default value: None

Methoden

validate

Valideer de opgegeven Databricks-clusterdetails.

Valideer de typen opgegeven parameters en controleert of de juiste combinatie van parameters is opgegeven. U moet bijvoorbeeld de existing_cluster_id rest van de clusterparameters opgeven of opgeven. Zie de parameterdefinities van de constructor voor meer informatie.

validate

Valideer de opgegeven Databricks-clusterdetails.

Valideer de typen opgegeven parameters en controleert of de juiste combinatie van parameters is opgegeven. U moet bijvoorbeeld de existing_cluster_id rest van de clusterparameters opgeven of opgeven. Zie de parameterdefinities van de constructor voor meer informatie.

validate()

Uitzonderingen

Type Description
class:azureml.exceptions.UserErrorException