Partager via


Table de données

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Classe de table de données

Un jeu de données représente des données téléchargées dans Machine Learning Studio (classique) de façon à les utiliser dans la procédure de modélisation. Même si vous téléchargez les données sous un autre format, ou spécifiez un format de stockage comme CSV, ARFF ou TSV, les données sont implicitement converties en un objet DataTable quand elles sont utilisées par un module dans une expérience.

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Le DataSet est basé sur la table de données .net.

Types de colonnes

Un objet DataTable se compose d'une collection de colonnes avec des métadonnées associées. Ces colonnes implémentent l'interface IArray. les colonnes de données dans Machine Learning Studio (classic) sont comprises comme des tableaux unidimensionnels, c’est-à-dire des vecteurs.

La classe .NET Array implémente ces interfaces génériques : System.Collections.Generic.IList<T> , System.Collections.Generic.ICollection<T> et System.Collections.Generic.IEnumerable<T> .

Les colonnes de types int , double et Boolean sont généralement représentées sous forme de tableaux denses numériques. Si une colonne dense contient des valeurs manquantes, elle est gérée comme un tableau de valeurs manquant ou comme un tableau dense d’objets Nullable.

Les colonnes contenant des chaînes sont traitées comme des tableaux denses d'objets. S'il existe des valeurs manquantes, elles sont représentées comme valeurs Null ou comme type MissingValuesObjectArray<string>.

Pour plus d’informations, consultez Array, classe (MSDN Library).

Obtention de colonnes dans un DataTable

Vous pouvez obtenir une colonne en appelant la GetColumn méthode sur le DataTable. La GetColumn méthode a deux surcharges :

  • GetColumn(<Int64>) obtient une colonne par son index.

  • GetColumn(<string>) obtient une colonne par son nom.

Autres interfaces dans Studio (Classic)

cette section décrit également les interfaces suivantes pour Machine Learning Studio (classic) :

Type Description
Interface ICluster L’interface ICluster définit la structure des modèles de clustering.
Interface IFilter L’interface IFilter définit la structure des filtres de traitement de signal numérique appliqués à une série entière de valeurs numériques. Les filtres peuvent être créés, puis enregistrés et appliqués à une nouvelle série.
Interface ILearner L’interface ILearner fournit une structure générique permettant de définir et d’enregistrer des modèles d’analyse, à l’exclusion de certains types spéciaux tels que les modèles de clustering.
Interface ITransform L’interface ITransform fournit une structure générique pour la définition et l’enregistrement des transformations. vous pouvez créer un iTransform à l’aide de Machine Learning Studio (classic), puis appliquer la transformation aux nouveaux jeux de données.

Voir aussi

Types de données du module