ParallelComponent 類別

平行元件版本,用來定義平行元件。

繼承
azure.ai.ml.entities._component.component.Component
ParallelComponent
azure.ai.ml.entities._job.parallel.parameterized_parallel.ParameterizedParallel
ParallelComponent
azure.ai.ml.entities._component.code.ComponentCodeMixin
ParallelComponent

建構函式

ParallelComponent(*, name: str | None = None, version: str | None = None, description: str | None = None, tags: Dict[str, Any] | None = None, display_name: str | None = None, retry_settings: RetrySettings | None = None, logging_level: str | None = None, max_concurrency_per_instance: int | None = None, error_threshold: int | None = None, mini_batch_error_threshold: int | None = None, task: ParallelTask | None = None, mini_batch_size: str | None = None, partition_keys: List | None = None, input_data: str | None = None, resources: JobResourceConfiguration | None = None, inputs: Dict | None = None, outputs: Dict | None = None, code: str | None = None, instance_count: int | None = None, is_deterministic: bool = True, **kwargs: Any)

參數

名稱 Description
name
必要
str

元件的名稱。 預設值為 None

version
必要
str

元件的版本。 預設值為 None

description
必要
str

元件的描述。 預設值為 None

tags
必要

標記字典。 標記可以新增、移除和更新。 預設值為 None

display_name
必要
str

元件的顯示名稱。 預設值為 None

retry_settings
必要

平行元件執行失敗重試。 預設值為 None

logging_level
必要
str

記錄層級名稱的字串。 預設值為 None

max_concurrency_per_instance
必要
int

每個計算實例都有的最大平行處理原則。 預設值為 None

error_threshold
必要
int

應該忽略專案處理失敗的數目。 預設值為 None

mini_batch_error_threshold
必要
int

應忽略迷你批次處理失敗的數目。 預設值為 None

task
必要

平行工作。 預設值為 None

mini_batch_size
必要
str

針對 FileDataset 輸入,此欄位是使用者腳本可在一次執行 () 呼叫中處理的檔案數目。 對於 TabularDataset 輸入,此欄位是使用者腳本可在一次執行 () 呼叫中處理的資料大約大小。 範例值為 1024、1024KB、10MB 和 1GB。 (選擇性的,FileDataset 的預設值為 10 個檔案,而 TabularDataset 為 1MB。) 此值可透過 PipelineParameter 設定。

partition_keys
必要

用來將資料資料集分割成迷你批次的索引鍵。 預設值為 None 如果指定,則具有相同索引鍵的資料會分割成相同的迷你批次。 如果同時指定partition_keys和mini_batch_size,partition_keys將會生效。 輸入 () 必須是分割資料集 (s) ,而partition_keys必須是每個輸入資料集的索引鍵子集,才能運作。

input_data
必要
str

輸入資料。 預設值為 None

resources
必要

元件的計算資源組態。 預設值為 None

inputs
必要

元件的輸入。 預設值為 None

outputs
必要

元件的輸出。 預設值為 None

code
必要
str

task.code 的 promoted 屬性

instance_count
必要
int

已從 resources.instance_count 升級屬性。 預設值為 None

is_deterministic
必要

平行元件是否具決定性。 預設為 True

僅限關鍵字參數

名稱 Description
name
必要
version
必要
description
必要
tags
必要
display_name
必要
retry_settings
必要
logging_level
必要
max_concurrency_per_instance
必要
error_threshold
必要
mini_batch_error_threshold
必要
task
必要
mini_batch_size
必要
partition_keys
必要
input_data
必要
resources
必要
inputs
必要
outputs
必要
code
必要
instance_count
必要
is_deterministic
預設值: True

方法

dump

以 yaml 格式將元件內容傾印到檔案中。

dump

以 yaml 格式將元件內容傾印到檔案中。

dump(dest: str | PathLike | IO, **kwargs: Any) -> None

參數

名稱 Description
dest
必要
Union[<xref:PathLike>, str, IO[AnyStr]]

接收此元件內容的目的地。 必須是本機檔案的路徑,或已開啟的檔案資料流程。 如果 dest 是檔案路徑,將會建立新的檔案,如果檔案存在,則會引發例外狀況。 如果 dest 是開啟的檔案,則會將檔案直接寫入,如果檔案無法寫入,則會引發例外狀況。

屬性

base_path

資源的基底路徑。

傳回

類型 Description
str

資源的基底路徑。

code

升級屬性 task.code 的傳回值,這是指向原始程式碼的本機或遠端路徑。

傳回

類型 Description

task.code 的值。

creation_context

資源的建立內容。

傳回

類型 Description

資源的建立中繼資料。

display_name

元件的顯示名稱。

傳回

類型 Description
str

元件的顯示名稱。

environment

傳回升級屬性 task.environment 的值,指出定型工作將在其中執行的環境。

傳回

類型 Description

task.environment 的值。

id

資源識別碼。

傳回

類型 Description

資源的全域識別碼,Azure Resource Manager (ARM) 識別碼。

inputs

元件的輸入。

傳回

類型 Description

元件的輸入。

instance_count

升級屬性resources.instance_count的傳回值。

傳回

類型 Description

resources.instance_count的值。

is_deterministic

元件是否具決定性。

傳回

類型 Description

元件是否具決定性

outputs

元件的輸出。

傳回

類型 Description

元件的輸出。

resources

retry_settings

task

type

元件的類型,預設值為 'command'。

傳回

類型 Description
str

元件的類型。

version

元件的版本。

傳回

類型 Description
str

元件的版本。