dataset_utilities Modulo

Metodi di utilità per interagire con azureml.core.Dataset.

Funzioni

collect_usage_telemetry

collect_usage_telemetry(compute: Any, spark_context: Any, **kwargs: Any) -> None

Parametri

Nome Descrizione
compute
Necessario
spark_context
Necessario

convert_inputs

Convertire i set di dati specificati in definizioni rilevabili.

convert_inputs(X: Any, y: Any, sample_weight: Any, X_valid: Any, y_valid: Any, sample_weight_valid: Any) -> Tuple[Any, Any, Any, Any, Any, Any]

Parametri

Nome Descrizione
X
Necessario

set di dati che rappresenta X

y
Necessario

set di dati che rappresenta y

sample_weight
Necessario

set di dati che rappresenta il peso di esempio

X_valid
Necessario

set di dati che rappresenta X_valid

y_valid
Necessario

set di dati che rappresenta y_valid

sample_weight_valid
Necessario

set di dati che rappresenta il peso dell'esempio di convalida

convert_inputs_dataset

Convertire i set di dati specificati in definizioni rilevabili.

convert_inputs_dataset(*datasets: Any) -> Tuple[Any, ...]

Parametri

Nome Descrizione
datasets
Necessario

set di dati da convertire in definizioni rilevabili

ensure_saved

ensure_saved(workspace: Workspace, **kwargs: Any) -> None

Parametri

Nome Descrizione
workspace
Necessario

get_dataset_from_mltable_data_json

Ottenere il set di dati da MLTable data json

get_dataset_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_label: MLTableDataLabel) -> AbstractDataset | None

Parametri

Nome Descrizione
ws
Necessario

area di lavoro da cui ottenere il set di dati

mltable_data_json_obj
Necessario

oggetto json dei dati mltable

data_label
Necessario

etichetta che indica il carico del set di dati da mltable data json

get_datasets_from_data_json

Ottenere set di dati da json di dati che possono essere JSON dati MLTable (con URI) o Json Dataprep (con ID set di dati)

get_datasets_from_data_json(ws: Workspace, data_preparation_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parametri

Nome Descrizione
ws
Necessario

area di lavoro da cui ottenere il set di dati

data_preparation_json
Necessario

oggetto json dei dati

data_labels
Necessario

elenco di etichette che indicano il carico del set di dati da caricare da json dei dati

get_datasets_from_dataprep_json

Ottenere il set di dati da Dataprep json (con ID set di dati)

get_datasets_from_dataprep_json(ws: Workspace, dataprep_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parametri

Nome Descrizione
ws
Necessario

area di lavoro da cui ottenere il set di dati

data_preparation_json
Necessario

oggetto json dei dati

data_labels
Necessario

elenco di etichette che indicano il carico del set di dati da caricare da json dei dati

dataprep_json
Necessario

get_datasets_from_mltable_data_json

Ottenere set di dati da MLTable data json (con uri)

get_datasets_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Parametri

Nome Descrizione
ws
Necessario

area di lavoro da cui ottenere il set di dati

data_preparation_json
Necessario

oggetto json dei dati

data_labels
Necessario

elenco di etichette che indicano il carico del set di dati da caricare da json dei dati

mltable_data_json_obj
Necessario

get_datasets_json

Ottenere il codice json dataprep.

get_datasets_json(training_data: Any | None = None, validation_data: Any | None = None, test_data: Any | None = None) -> str | None

Parametri

Nome Descrizione
training_data

Dati di training.

Valore predefinito: None
validation_data

Dati di convalida

Valore predefinito: None
test_data

Dati di test

Valore predefinito: None

Restituisce

Tipo Descrizione

Rappresentazione di stringa JSON di un set di dati

is_dataset

Verificare se l'oggetto specificato è una definizione del set di dati o del set di dati.

is_dataset(dataset: Any) -> bool

Parametri

Nome Descrizione
dataset
Necessario

oggetto da controllare