SparkComponent Sınıf
Spark Bileşeni veya İşi tanımlamak için kullanılan Spark bileşeni sürümü.
- Devralma
-
azure.ai.ml.entities._component.component.ComponentSparkComponentazure.ai.ml.entities._job.parameterized_spark.ParameterizedSparkSparkComponentazure.ai.ml.entities._job.spark_job_entry_mixin.SparkJobEntryMixinSparkComponentazure.ai.ml.entities._component.code.ComponentCodeMixinSparkComponent
Oluşturucu
SparkComponent(*, code: PathLike | str | None = '.', entry: Dict[str, str] | SparkJobEntry | None = None, py_files: List[str] | None = None, jars: List[str] | None = None, files: List[str] | None = None, archives: List[str] | None = None, driver_cores: int | str | None = None, driver_memory: str | None = None, executor_cores: int | str | None = None, executor_memory: str | None = None, executor_instances: int | str | None = None, dynamic_allocation_enabled: bool | str | None = None, dynamic_allocation_min_executors: int | str | None = None, dynamic_allocation_max_executors: int | str | None = None, conf: Dict[str, str] | None = None, environment: Environment | str | None = None, inputs: Dict | None = None, outputs: Dict | None = None, args: str | None = None, **kwargs: Any)
Yalnızca Anahtar Sözcük Parametreleri
Name | Description |
---|---|
code
|
İşi çalıştırmak için kaynak kod. Uzak bir konuma işaret eden yerel bir yol veya "http:", "https:" veya "azureml:" url'si olabilir. Varsayılan olarak ".", geçerli dizini belirtir. varsayılan değer: .
|
entry
|
Dosya veya sınıf giriş noktası. |
py_files
|
Python uygulamaları için PYTHONPATH'e yerleştirecek .zip, .egg veya .py dosyalarının listesi. Varsayılan değer Yok'tur. |
jars
|
listesi. Sürücü ve yürütücü sınıf yollarına eklenecek JAR dosyaları. Varsayılan değer Yok'tur. |
files
|
Her yürütücüsünün çalışma dizinine yerleştirilecek dosyaların listesi. Varsayılan değer Yok'tur. |
archives
|
Her yürütücüsünün çalışma dizinine ayıklanacak arşivlerin listesi. Varsayılan değer Yok'tur. |
driver_cores
|
Yalnızca küme modunda, sürücü işlemi için kullanılacak çekirdek sayısı. |
driver_memory
|
Boyut birimi soneki ("k", "m", "g" veya "t") (örneğin, "512m", "2g") olan dizeler olarak biçimlendirilmiş sürücü işlemi için kullanılacak bellek miktarı. |
executor_cores
|
Her yürütücüde kullanılacak çekirdek sayısı. |
executor_memory
|
Yürütücü işlemi başına kullanılacak bellek miktarı; boyut birimi soneki ("k", "m", "g" veya "t") (örneğin, "512m", "2g") olan dizeler olarak biçimlendirilir. |
executor_instances
|
Yürütücülerin ilk sayısı. |
dynamic_allocation_enabled
|
Bu uygulamaya kayıtlı yürütücü sayısını iş yüküne göre artırıp azaltan dinamik kaynak ayırmanın kullanılıp kullanılmaydığı. Varsayılan değer False'tur. |
dynamic_allocation_min_executors
|
Dinamik ayırma etkinleştirildiyse yürütücü sayısı için alt sınır. |
dynamic_allocation_max_executors
|
Dinamik ayırma etkinleştirildiyse yürütücü sayısı için üst sınır. |
conf
|
Önceden tanımlanmış Spark yapılandırma anahtarı ve değerlerine sahip bir sözlük. Varsayılan değer Yok'tur. |
environment
|
İşin çalıştırılacak Azure ML ortamı. |
inputs
|
Optional[dict[str, Union[ <xref:azure.ai.ml.entities._job.pipeline._io.NodeOutput>, Input, str, bool, int, float, <xref:Enum>, ]]]
Giriş adlarının işte kullanılan giriş veri kaynaklarına eşlemesi. Varsayılan değer Yok'tur. |
outputs
|
Çıktı adlarının işte kullanılan çıkış veri kaynaklarıyla eşlenim. Varsayılan değer Yok'tur. |
args
|
İşin bağımsız değişkenleri. Varsayılan değer Yok'tur. |
Örnekler
SparkComponent oluşturuluyor.
from azure.ai.ml.entities import SparkComponent
component = SparkComponent(
name="add_greeting_column_spark_component",
display_name="Aml Spark add greeting column test module",
description="Aml Spark add greeting column test module",
version="1",
inputs={
"file_input": {"type": "uri_file", "mode": "direct"},
},
driver_cores=2,
driver_memory="1g",
executor_cores=1,
executor_memory="1g",
executor_instances=1,
code="./src",
entry={"file": "add_greeting_column.py"},
py_files=["utils.zip"],
files=["my_files.txt"],
args="--file_input ${{inputs.file_input}}",
base_path="./sdk/ml/azure-ai-ml/tests/test_configs/dsl_pipeline/spark_job_in_pipeline",
)
Yöntemler
dump |
Bileşen içeriğini yaml biçiminde bir dosyaya dökümünü alın. |
dump
Bileşen içeriğini yaml biçiminde bir dosyaya dökümünü alın.
dump(dest: str | PathLike | IO, **kwargs: Any) -> None
Parametreler
Name | Description |
---|---|
dest
Gerekli
|
Bu bileşenin içeriğini alacak hedef. Yerel dosyanın yolu veya zaten açık olan bir dosya akışı olmalıdır. Dest bir dosya yoluysa, yeni bir dosya oluşturulur ve dosya varsa bir özel durum oluşturulur. Dest açık bir dosyaysa, dosya doğrudan öğesine yazılır ve dosya yazılabilir değilse bir özel durum oluşturulur. |
Öznitelikler
base_path
creation_context
Kaynağın oluşturma bağlamı.
Döndürülenler
Tür | Description |
---|---|
Kaynağın oluşturma meta verileri. |
display_name
entry
environment
Spark bileşeninin veya işinin çalıştırılacak Azure ML ortamı.
Döndürülenler
Tür | Description |
---|---|
Spark bileşeninin veya işinin çalıştırılacak Azure ML ortamı. |
id
Kaynak kimliği.
Döndürülenler
Tür | Description |
---|---|
Kaynağın genel kimliği, azure Resource Manager (ARM) kimliği. |
inputs
is_deterministic
Bileşenin belirleyici olup olmadığı.
Döndürülenler
Tür | Description |
---|---|
Bileşenin belirleyici olup olmadığı |
outputs
type
version
CODE_ID_RE_PATTERN
CODE_ID_RE_PATTERN = re.compile('\\/subscriptions\\/(?P<subscription>[\\w,-]+)\\/resourceGroups\\/(?P<resource_group>[\\w,-]+)\\/providers\\/Microsoft\\.MachineLearningServices\\/workspaces\\/(?P<workspace>[\\w,-]+)\\/codes\\/(?P<co)
Azure SDK for Python
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin