Trasformazione dei dati - Ridimensionamento e riduzione
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Questo articolo descrive i moduli di Machine Learning Studio (versione classica) che consentono di usare dati numerici. Per l'apprendimento automatico, le attività comuni sui dati includono il ritaglio, il binning e la normalizzazione dei valori numerici. Altri moduli supportano la riduzione della dimensionalità.
Nota
Si applica a: Machine Learning Studio (versione classica)
Nella finestra di progettazione sono disponibili moduli simili Azure Machine Learning trascinamento della selezione.
Attività come la normalizzazione, la creazione di contenitori o la ridistribuzione di variabili numeriche sono una parte importante della preparazione dei dati per Machine Learning. I moduli in questo gruppo supportano le attività di preparazione dei dati seguenti:
- Raggruppamento dei dati in contenitori di dimensioni o distribuzioni diverse.
- Rimozione di outlier o modifica dei relativi valori.
- Normalizzazione di un set di valori numerici in un intervallo specifico.
- Creazione di un set compatto di colonne di caratteristiche da un set di dati con dimensioni elevate.
- Selezionare le funzionalità rilevanti e utili da usare nella compilazione del modello: usare i moduli Feature Selection (Selezione caratteristiche) o Linear Discriminante Analysis (Analisi lineare discriminante) di Linear Discriminante.
- Selezionare le funzionalità in base ai conteggi dei valori: usare il modulo Learning con conteggi.
- Rimuovere o sostituire i valori mancanti: usare il modulo Clean Missing Data (Pulisci dati mancanti).
- Sostituire i valori categorici con valori numerici derivati dai calcoli: usare il modulo Replace Discrete Values (Sostituisci valori discreti ).
- Calcolare una distribuzione di probabilità per colonne discrete o numeriche: usare il modulo Evaluate Probability Function (Valuta funzione di probabilità).
- Filtrare e trasformare segnali digitali e forme d'onda: usare il modulo Filtro .
Questa categoria Trasformazione dati - Scalabilità e riduzione include i moduli seguenti:
- Clip Values (Valori clip): rileva gli outlier e quindi ritaglia o sostituisce i relativi valori.
- Raggruppa i dati in contenitori: inserisce i dati numerici in contenitori.
- Normalizza dati: ridimensiona i dati numerici per vincolare i valori del set di dati a un intervallo standard.
- Analisi dei componenti principali: calcola un set di funzionalità con dimensionalità ridotta per un apprendimento più efficiente.