Partager via


Transformation des données

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

cet article répertorie les modules fournis dans Machine Learning Studio (classic) pour la transformation des données. Par Machine Learning, la transformation des données implique certaines tâches très générales, telles que la jointure de DataSets ou la modification des noms de colonnes. Toutefois, il comprend également de nombreuses tâches spécifiques à Machine Learning, telles que la normalisation, le compartimentage et le regroupement, et l’inférence de valeurs manquantes.

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Important

les données que vous utilisez dans Machine Learning studio (classic) sont généralement supposées être « tidy » avant de les importer dans Machine Learning Studio (classic). La préparation des données peut inclure, par exemple, la garantie que les données utilisent l’encodage correct et la vérification que les données ont un schéma cohérent.

Les modules de transformation des données sont regroupés dans les catégories suivantes, basées sur les tâches :

  • Création de filtres pour le traitement des signaux numériques: il est possible d’appliquer des filtres de signal numérique à des données numériques pour prendre en charge des tâches de machine learning telles que la reconnaissance d’images, la reconnaissance vocale et l’analyse de forme d’onde.
  • Génération et utilisation des fonctionnalités basées sur le nombre: les modules caractérisation basés sur le nombre vous aident à développer des fonctionnalités compactes à utiliser dans machine learning.
  • Manipulation et préparation des données générales: fusion de datasets, nettoyage des valeurs manquantes, regroupement et synthèse des données, modification des noms de colonnes et des types de données, ou indication de la colonne qui est une étiquette ou une fonctionnalité.
  • Échantillonnage et fractionnementdes jeux de données : Divisez vos données en jeux d’apprentissage et jeux de test, fractionnez les jeux de données par pourcentage ou selon une condition de filtre, ou effectuez un échantillonnage.
  • Mise à l’échelle et réduction des données: Préparez des données numériques pour l’analyse en appliquant la normalisation ou en mettant à l’échelle. Placez les données dans des groupes, supprimez ou remplacez les valeurs hors norme, ou effectuez l’analyse des composants principaux (PCA).

Liste des modules

Les catégories de modules suivantes sont incluses dans la catégorie transformation de données :

Voir aussi