dataset_utilities Module

Méthodes utilitaires pour l’interaction avec azureml.core.DataSet.

Fonctions

collect_usage_telemetry

collect_usage_telemetry(compute: Any, spark_context: Any, **kwargs: Any) -> None

Paramètres

Nom Description
compute
Obligatoire
spark_context
Obligatoire

convert_inputs

Convertir les jeux de données donnés en définitions pouvant être suivies.

convert_inputs(X: Any, y: Any, sample_weight: Any, X_valid: Any, y_valid: Any, sample_weight_valid: Any) -> Tuple[Any, Any, Any, Any, Any, Any]

Paramètres

Nom Description
X
Obligatoire

jeu de données représentant X

y
Obligatoire

jeu de données représentant y

sample_weight
Obligatoire

jeu de données représentant la pondération de l’échantillon

X_valid
Obligatoire

jeu de données représentant X_valid

y_valid
Obligatoire

jeu de données représentant y_valid

sample_weight_valid
Obligatoire

jeu de données représentant la pondération de l’échantillon de validation

convert_inputs_dataset

Convertir les jeux de données donnés en définitions pouvant être suivies.

convert_inputs_dataset(*datasets: Any) -> Tuple[Any, ...]

Paramètres

Nom Description
datasets
Obligatoire

jeux de données à convertir en définitions pouvant être suivies

ensure_saved

ensure_saved(workspace: Workspace, **kwargs: Any) -> None

Paramètres

Nom Description
workspace
Obligatoire

get_dataset_from_mltable_data_json

Obtenir le jeu de données du JSON de données MLTable

get_dataset_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_label: MLTableDataLabel) -> AbstractDataset | None

Paramètres

Nom Description
ws
Obligatoire

espace de travail auprès duquel obtenir le jeu de données

mltable_data_json_obj
Obligatoire

objet JSON de données mltable

data_label
Obligatoire

étiquette indiquant le jeu de données à charger depuis le JSON de données mltable

get_datasets_from_data_json

Obtenir des jeux de données depuis le JSON de données qui peut être un JSON de données MLTable (avec un URI) ou un JSON Dataprep (avec un ID de jeu de données)

get_datasets_from_data_json(ws: Workspace, data_preparation_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Paramètres

Nom Description
ws
Obligatoire

espace de travail auprès duquel obtenir le jeu de données

data_preparation_json
Obligatoire

objet JSON de données

data_labels
Obligatoire

liste d’étiquettes indiquant le jeu de données à charger depuis le JSON de données

get_datasets_from_dataprep_json

Obtenir un jeu de données depuis le JSON Dataprep (avec un ID de jeu de données)

get_datasets_from_dataprep_json(ws: Workspace, dataprep_json: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Paramètres

Nom Description
ws
Obligatoire

espace de travail auprès duquel obtenir le jeu de données

data_preparation_json
Obligatoire

objet JSON de données

data_labels
Obligatoire

liste d’étiquettes indiquant le jeu de données à charger depuis le JSON de données

dataprep_json
Obligatoire

get_datasets_from_mltable_data_json

Obtenir des jeux de données à partir du JSON de données MLTable (avec un URI)

get_datasets_from_mltable_data_json(ws: Workspace, mltable_data_json_obj: Dict[str, Any], data_labels: List[MLTableDataLabel]) -> Tuple[AbstractDataset | None, AbstractDataset | None, AbstractDataset | None]

Paramètres

Nom Description
ws
Obligatoire

espace de travail auprès duquel obtenir le jeu de données

data_preparation_json
Obligatoire

objet JSON de données

data_labels
Obligatoire

liste d’étiquettes indiquant le jeu de données à charger depuis le JSON de données

mltable_data_json_obj
Obligatoire

get_datasets_json

Obtenir dataprep JSON.

get_datasets_json(training_data: Any | None = None, validation_data: Any | None = None, test_data: Any | None = None) -> str | None

Paramètres

Nom Description
training_data

Données de formation.

valeur par défaut: None
validation_data

Données de validation

valeur par défaut: None
test_data

Données de test

valeur par défaut: None

Retours

Type Description

Représentation sous forme de chaîne JSON d’un dictionnaire de jeux de données

is_dataset

Vérifier si l’objet donné est un jeu de données ou une définition de jeu de données.

is_dataset(dataset: Any) -> bool

Paramètres

Nom Description
dataset
Obligatoire

objet à vérifier