Spark Clase

Referencia

Clase base para el nodo de Spark, que se usa para el consumo de versiones de componentes de Spark.

No debe crear una instancia de esta clase directamente. En su lugar, debe crearlo a partir de la función del generador: spark.

] :p aram salidas: asignación de nombres de salida a orígenes de datos de salida usados en el trabajo. :type outputs: Dict[str, Union[str, ~azure.ai.ml.Output]] :p aram args: los argumentos del trabajo. :type args: str :p aram compute: el recurso de proceso en el que se ejecuta el trabajo. :type compute: recursos de str :p aram: la configuración del recurso de proceso para el trabajo. :type resources: Union[Dict, ~azure.ai.ml.entities.SparkResourceConfiguration] :p aram entry: The file or class entry point. :type entry: Dict[str, str] :p aram py_files: la lista de archivos .zip, .egg o .py que se van a colocar en pythonPATH para aplicaciones de Python. :type py_files: List[str] :p aram jars: La lista de . Archivos JAR que se van a incluir en las rutas de clase del controlador y del ejecutor. :type jars: List[str] :p aram files: la lista de archivos que se van a colocar en el directorio de trabajo de cada ejecutor. :type files: List[str] :p aram archives: la lista de archivos que se van a extraer en el directorio de trabajo de cada ejecutor. :type archives: List[str]

Herencia: azure.ai.ml.entities._builders.base_node.BaseNode

Spark

azure.ai.ml.entities._job.spark_job_entry_mixin.SparkJobEntryMixin

Spark

Constructor

Spark(*, component: str | SparkComponent, identity: Dict[str, str] | ManagedIdentityConfiguration | AmlTokenConfiguration | UserIdentityConfiguration | None = None, driver_cores: int | None = None, driver_memory: str | None = None, executor_cores: int | None = None, executor_memory: str | None = None, executor_instances: int | None = None, dynamic_allocation_enabled: bool | None = None, dynamic_allocation_min_executors: int | None = None, dynamic_allocation_max_executors: int | None = None, conf: Dict[str, str] | None = None, inputs: Dict[str, NodeOutput | Input | str | bool | int | float | Enum] | None = None, outputs: Dict[str, str | Output] | None = None, compute: str | None = None, resources: Dict | SparkResourceConfiguration | None = None, entry: Dict[str, str] | SparkJobEntry | None = None, py_files: List[str] | None = None, jars: List[str] | None = None, files: List[str] | None = None, archives: List[str] | None = None, args: str | None = None, **kwargs)

Parámetros

component: Union[str, SparkComponent]

Requerido

Identificador o instancia del componente o trabajo de Spark que se va a ejecutar durante el paso.

identity: Union[ Dict[str, str], ManagedIdentityConfiguration, AmlTokenConfiguration, UserIdentityConfiguration]

Requerido

La identidad que usará el trabajo de Spark mientras se ejecuta en proceso.

driver_cores: int

Requerido

Número de núcleos que se van a usar para el proceso de controlador, solo en modo de clúster.

driver_memory: str

Requerido

Cantidad de memoria que se va a usar para el proceso del controlador, con formato de cadenas con un sufijo de unidad de tamaño ("k", "m", "g" o "t") (por ejemplo, "512m", "2g").

executor_cores: int

Requerido

Número de núcleos que se usarán para cada ejecutor.

executor_memory: str

Requerido

Cantidad de memoria que se va a usar por proceso de ejecutor, con formato de cadenas con un sufijo de unidad de tamaño ("k", "m", "g" o "t") (por ejemplo, "512m", "2g").

executor_instances: int

Requerido

Número inicial de ejecutores.

dynamic_allocation_enabled: bool

Requerido

Si se va a usar la asignación dinámica de recursos, que escala el número de ejecutores registrados en esta aplicación en función de la carga de trabajo.

dynamic_allocation_min_executors: int

Requerido

Límite inferior para el número de ejecutores si está habilitada la asignación dinámica.

dynamic_allocation_max_executors: int

Requerido

Límite superior del número de ejecutores si está habilitada la asignación dinámica.

conf: Dict[str, str]

Requerido

Diccionario con valores y clave de configuraciones de Spark predefinidos.

inputs: Dict[str, Union[ <xref:azure.ai.ml.entities._job.pipeline._io.NodeOutput>, Input, str, bool, int, float, <xref:Enum>, ]

Requerido

Asignación de nombres de entrada a orígenes de datos de entrada usados en el trabajo.

Métodos

clear
copy
dump	Volca el contenido del trabajo en un archivo en formato YAML.
fromkeys	Cree un nuevo diccionario con claves de valores iterables y establecidos en value.
get	Devuelve el valor de la clave si la clave está en el diccionario; de lo contrario, devuelve el valor predeterminado.
items
keys
pop	Si no se encuentra la clave, devuelva el valor predeterminado si se indica; de lo contrario, genere un valor KeyError.
popitem	Quite y devuelva un par (clave, valor) como una tupla de 2. Los pares se devuelven en el orden LIFO (último en entrar, primero en salir). Genera KeyError si el dict está vacío.
setdefault	Inserte la clave con un valor predeterminado si la clave no está en el diccionario. Devuelve el valor de la clave si la clave está en el diccionario; de lo contrario, devuelve el valor predeterminado.
update	Si E está presente y tiene un método .keys(), entonces lo hace: para k en E: D[k] = E[k] Si E está presente y carece de un método .keys(), entonces lo hace: para k, v en E: D[k] = v En cualquier caso, esto va seguido de: para k en F: D[k] = F[k] = F[k]
values

clear

clear() -> None.  Remove all items from D.

copy

copy() -> a shallow copy of D

dump

Volca el contenido del trabajo en un archivo en formato YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parámetros

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Requerido

Ruta de acceso local o secuencia de archivos en la que se va a escribir el contenido de YAML. Si dest es una ruta de acceso de archivo, se creará un nuevo archivo. Si dest es un archivo abierto, el archivo se escribirá directamente.

kwargs: dict

Argumentos adicionales para pasar al serializador YAML.

Excepciones

FileExistsError

Se genera si dest es una ruta de acceso de archivo y el archivo ya existe.

IOError

Se genera si dest es un archivo abierto y el archivo no se puede escribir.

fromkeys

Cree un nuevo diccionario con claves de valores iterables y establecidos en value.

fromkeys(value=None, /)

Parámetros

type

Requerido

iterable

Requerido

value

valor predeterminado: None

get

Devuelve el valor de la clave si la clave está en el diccionario; de lo contrario, devuelve el valor predeterminado.

get(key, default=None, /)

Parámetros

key

Requerido

default

valor predeterminado: None

items

items() -> a set-like object providing a view on D's items

keys

keys() -> a set-like object providing a view on D's keys

pop

Si no se encuentra la clave, devuelva el valor predeterminado si se indica; de lo contrario, genere un valor KeyError.

pop(k, [d]) -> v, remove specified key and return the corresponding value.

popitem

Quite y devuelva un par (clave, valor) como una tupla de 2.

Los pares se devuelven en el orden LIFO (último en entrar, primero en salir). Genera KeyError si el dict está vacío.

popitem()

setdefault

Inserte la clave con un valor predeterminado si la clave no está en el diccionario.

Devuelve el valor de la clave si la clave está en el diccionario; de lo contrario, devuelve el valor predeterminado.

setdefault(key, default=None, /)

Parámetros

key

Requerido

default

valor predeterminado: None

update

Si E está presente y tiene un método .keys(), entonces lo hace: para k en E: D[k] = E[k] Si E está presente y carece de un método .keys(), entonces lo hace: para k, v en E: D[k] = v En cualquier caso, esto va seguido de: para k en F: D[k] = F[k] = F[k]

update([E], **F) -> None.  Update D from dict/iterable E and F.

values

values() -> an object providing a view on D's values

Metadatos de creación del recurso.

Tipo de valor devuelto

Optional[SystemData]

Spark Clase

Constructor

Parámetros

Métodos

clear

copy

dump

Parámetros

Excepciones

fromkeys

Parámetros

get

Parámetros

items

keys

pop

popitem

setdefault

Parámetros

update

values

Atributos

base_path

Devoluciones

Tipo de valor devuelto

code

Tipo de valor devuelto

component

Tipo de valor devuelto

creation_context

Devoluciones

Tipo de valor devuelto

entry

id

Devoluciones

Tipo de valor devuelto

identity

Tipo de valor devuelto

inputs

Devoluciones

Tipo de valor devuelto

log_files

Devoluciones

Tipo de valor devuelto

name

Devoluciones

Tipo de valor devuelto

outputs

Devoluciones

Tipo de valor devuelto

resources

Tipo de valor devuelto

status

Devoluciones

Tipo de valor devuelto

studio_url

Devoluciones

Tipo de valor devuelto

type

Devoluciones

Tipo de valor devuelto

CODE_ID_RE_PATTERN

Comentarios

Recursos adicionales