Trasformazione dei dati - Ridimensionamento e riduzione
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Questo articolo descrive i moduli di Machine Learning Studio (versione classica) che consentono di usare dati numerici. Per l'apprendimento automatico, le attività comuni sui dati includono il ritaglio, il binning e la normalizzazione dei valori numerici. Altri moduli supportano la riduzione della dimensionalità.
Nota
Si applica a: Machine Learning Studio (versione classica)
Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.
Modellazione di dati numerici
Attività come la normalizzazione, la creazione di contenitori o la ridistribuzione di variabili numeriche sono una parte importante della preparazione dei dati per Machine Learning. I moduli in questo gruppo supportano le attività di preparazione dei dati seguenti:
- Raggruppamento dei dati in contenitori di dimensioni o distribuzioni diverse.
- Rimozione di outlier o modifica dei relativi valori.
- Normalizzazione di un set di valori numerici in un intervallo specifico.
- Creazione di un set compatto di colonne di caratteristiche da un set di dati con dimensioni elevate.
Attività correlate
- Selezionare le funzionalità rilevanti e utili da usare nella compilazione del modello: usare i moduli Feature Selection (Selezione caratteristiche) o Linear Discriminante Analysis (Analisi lineare discriminante) di Linear Discriminante.
- Selezionare le funzionalità in base ai conteggi dei valori: usare il modulo Learning con conteggi.
- Rimuovere o sostituire i valori mancanti: usare il modulo Clean Missing Data (Pulisci dati mancanti).
- Sostituire i valori categorici con valori numerici derivati dai calcoli: usare il modulo Replace Discrete Values (Sostituisci valori discreti ).
- Calcolare una distribuzione di probabilità per colonne discrete o numeriche: usare il modulo Evaluate Probability Function (Valuta funzione di probabilità).
- Filtrare e trasformare segnali digitali e forme d'onda: usare il modulo Filtro .
Elenco dei moduli
Questa categoria Trasformazione dati - Scalabilità e riduzione include i moduli seguenti:
- Clip Values (Valori clip): rileva gli outlier e quindi ritaglia o sostituisce i relativi valori.
- Raggruppa i dati in contenitori: inserisce i dati numerici in contenitori.
- Normalizza dati: ridimensiona i dati numerici per vincolare i valori del set di dati a un intervallo standard.
- Analisi dei componenti principali: calcola un set di funzionalità con dimensionalità ridotta per un apprendimento più efficiente.