Modificare i parametri della tabella Count
Importante
Il supporto dello studio di Azure Machine Learning (versione classica) terminerà il 31 agosto 2024. È consigliabile passare ad Azure Machine Learning entro tale data.
A partire dal 1° dicembre 2021 non sarà possibile creare nuove risorse dello studio di Azure Machine Learning (versione classica). Fino al 31 agosto 2024 sarà possibile continuare a usare le risorse dello studio di Azure Machine Learning (versione classica).
- Vedere leinformazioni sullo spostamento di progetti di Machine Learning da ML Studio (versione classica) ad Azure Machine Learning.
- Altre informazioni sulle Azure Machine Learning.
La documentazione relativa allo studio di Machine Learning (versione classica) è in fase di ritiro e potrebbe non essere aggiornata in futuro.
Modifica i parametri usati per creare funzionalità dai conteggi
Categoria: Learning con conteggi
Nota
Si applica a: Machine Learning Studio (versione classica)
Moduli di trascinamento della selezione simili sono disponibili nella finestra Azure Machine Learning progettazione.
Panoramica del modulo
Questo articolo descrive come usare il modulo Modifica parametri tabella conteggio in Machine Learning Studio (versione classica) per modificare il modo in cui le funzionalità vengono generate da una tabella di conteggio.
In generale, per creare funzionalità basate sul conteggio, usare build counting transform per elaborare un set di dati e creare una tabella di conteggio e da tale tabella di conteggio generare un nuovo set di funzionalità.
Tuttavia, se è già stata creata una tabella di conteggio, è possibile usare il modulo Modifica parametri tabella conteggio per modificare la definizione della modalità di elaborazione dei dati di conteggio. In questo modo è possibile creare un set diverso di statistiche basate sul conteggio in base ai dati esistenti, senza dover analizzare nuovamente il set di dati.
Come configurare i parametri di modifica del conteggio
Individuare la trasformazione da modificare nel gruppo Trasformazioni e aggiungerla all'esperimento.
In precedenza è stato eseguito un esperimento che ha creato una trasformazione conteggio.
Per modificare una trasformazione salvata: individuare la trasformazione nel gruppo Trasformazioni e aggiungerla all'esperimento.
Per modificare una trasformazione conteggio creata all'interno dello stesso esperimento: se la trasformazione non è stata salvata, ma è disponibile come output nell'esperimento corrente (ad esempio, controllare l'output del modulo Build Counting Transform), è possibile usarla direttamente connettendo i moduli.
Aggiungere il modulo Modify Count Table Parameters (Modifica parametri tabella conteggio) e connettere la trasformazione come input.
Nel riquadro Proprietà del modulo Modifica parametri tabella conteggio digitare un valore da usare come soglia del binGarbage.
Questo valore specifica il numero minimo di occorrenze che devono essere trovate per ogni valore di funzionalità, in modo da poter usare i conteggi. Se la frequenza del valore è minore della soglia del Garbage Bin, la coppia valore-etichetta non viene conteggiata come elemento discreto. al contrario, tutti gli elementi con conteggi inferiori al valore soglia vengono inseriti in un singolo "Garbage Bin".
Se si usa un set di dati di piccole dimensioni e si conta ed è in corso il training sugli stessi dati, un valore iniziale valido è 1.
Per Altri pseudo esempi precedenti, digitare un numero che indica il numero di pseudo esempi aggiuntivi da includere. Non è necessario fornire questi esempi. Gli pseudo esempi vengono generati in base alla distribuzione precedente.
Per Laplacian noise scale (Scala del disturbo laplaciano) digitare un valore a virgola mobile positivo che rappresenta la scala usata per introdurre il disturbo campionato da una distribuzione laplaciana. Quando si imposta un valore di scala, nel modello viene incorporato un livello accettabile di disturbo, quindi è meno probabile che il modello sia interessato da valori non visualizzati nei dati.
In Funzionalità di output includono scegliere il metodo da usare per la creazione di funzionalità basate sul conteggio da includere nella trasformazione.
CountsOnly: creare funzionalità usando i conteggi.
LogOddsOnly: creare funzionalità usando il log del rapporto di probabilità.
BothCountsAndLogOdds: creare funzionalità usando sia conteggi che quote di log.
Selezionare l'opzione Ignora colonna back-off se si vuole eseguire l'override del
IsBackOff
flag nell'output durante la creazione delle funzionalità. Quando si seleziona questa opzione, le funzionalità basate sul conteggio vengono create anche se la colonna non ha valori di conteggio significativi.Eseguire l'esperimento. È quindi possibile salvare l'output di Modify Count Table Parameters (Modifica parametri tabella conteggio ) come nuova trasformazione, se necessario.
Esempio
Per esempi di come questo modulo, vedere l'Azure AI Gallery:
Learning con Conteggi: classificazione binaria: illustra come usare l'apprendimento con i moduli counts per generare funzionalità da colonne di valori categorici per un modello di classificazione binaria.
Learning con Counts: Multiclass classification with NYC taxi data:sample Illustra come usare i moduli learning with counts per eseguire la classificazione multiclasse nel set di dati dei taxi di NyC disponibile pubblicamente. L'esempio usa uno strumento di apprendimento della regressione logistica multiclasse per modellare questo problema.
Learning con Conteggi: classificazione binaria con i dati dei taxi di New York: illustra come usare l'apprendimento con i moduli counts per eseguire la classificazione binaria nel set di dati dei taxi di NYC disponibile pubblicamente. L'esempio usa uno strumento di apprendimento della regressione logistica a due classi per modellare questo problema.
Note tecniche
Questa sezione contiene informazioni dettagliate sull'implementazione, suggerimenti e risposte alle domande frequenti.
Se si imposta il parametro della scala laplaciana del rumore, è statisticamente sicuro eseguire il conteggio e il training sullo stesso set di dati.
Input previsti
Nome | Tipo | Descrizione |
---|---|---|
Trasformazione conteggio | Interfaccia ITransform | Trasformazione di conteggio da applicare |
Parametri del modulo
Nome | Tipo | Intervallo | Facoltativo | Predefinito | Descrizione |
---|---|---|---|---|---|
Soglia cestino | Float | >=0,0f | Necessario | 10.0f | Soglia al di sotto della quale verrà eseguito l'esecuzione di un valore di colonna rispetto al Garbage Bin |
Pseudo esempi aggiuntivi precedenti | Float | >=0,0f | Necessario | 42.0f | Gli pseudo esempi aggiuntivi che seguono le distribuzioni precedenti da includere |
Scala laplaciana del rumore | Float | >=0,0f | Necessario | 0.0f | Scala della distribuzione laplaciana da cui viene campionato il disturbo |
Le funzionalità di output includono | OutputFeatureType | Necessario | BothCountsAndLogOdds | Funzionalità da output | |
Ignora colonna backoff | Boolean | Necessario | false | Se ignorare la colonna IsBackOff nell'output |
Output
Nome | Tipo | Descrizione |
---|---|---|
Trasformazione modificata | Interfaccia ITransform | Trasformazione modificata |
Eccezioni
Eccezione | Descrizione |
---|---|
Errore 0003 | L'eccezione si verifica se uno o più input sono null o vuoti. |
Errore 0086 | Si verifica un'eccezione quando la trasformazione di un conteggio non è valida. |
Per un elenco degli errori specifici dei moduli di Studio (versione classica), vedere Machine Learning codici di errore.
Per un elenco delle eccezioni API, vedere Machine Learning di errore dell'API REST.