Apply Math Operation (Applica operazione matematica)
Questo articolo descrive un componente della finestra di progettazione di Azure Machine Learning.
Usare l'operazione Applica matematica per creare calcoli applicati alle colonne numeriche nel set di dati di input.
Le operazioni matematiche includono funzioni aritmetiche, funzioni trigonometriche, funzioni di arrotondamento e funzioni speciali usate in data science, ad esempio funzioni gamma ed errori.
Dopo aver definito un'operazione ed eseguito la pipeline, i valori vengono aggiunti al set di dati. A seconda di come si configura il componente, è possibile:
- Aggiungere i risultati al set di dati (utile quando si verifica il risultato dell'operazione).
- Sostituire i valori delle colonne con i nuovi valori calcolati.
- Generare una nuova colonna per i risultati e non visualizzare i dati originali.
Cercare l'operazione necessaria in queste categorie:
-
Le funzioni nella categoria Basic possono essere usate per modificare un singolo valore o colonna di valori. Ad esempio, è possibile ottenere il valore assoluto di tutti i numeri in una colonna o calcolare la radice quadrata di ogni valore in una colonna.
-
Le funzioni nella categoria Confronta sono tutte usate per il confronto: è possibile eseguire un confronto a coppie dei valori in due colonne oppure confrontare ogni valore in una colonna con una costante specificata. Ad esempio, è possibile confrontare le colonne per determinare se i valori sono uguali in due set di dati. In alternativa, è possibile usare una costante, ad esempio un valore massimo consentito, per individuare gli outlier in una colonna numerica.
-
La categoria Operazioni include funzioni matematiche di base: addizione, sottrazione, moltiplicazione e divisione. È possibile usare colonne o costanti. Ad esempio, è possibile aggiungere il valore nella colonna A al valore nella colonna B. In alternativa, è possibile sottrarre una costante, ad esempio una media calcolata in precedenza, da ogni valore nella colonna A.
-
La categoria Arrotondamento include un'ampia gamma di funzioni per l'esecuzione di operazioni quali arrotondamento, soffitto, pavimento e troncamento a vari livelli di precisione. È possibile specificare il livello di precisione per i numeri decimali e interi.
-
La categoria Speciale include funzioni matematiche particolarmente usate nella data science, ad esempio integrali ellittici e la funzione di errore gaussiana.
-
La categoria Trigonometrica include tutte le funzioni trigonometriche standard. Ad esempio, è possibile convertire radianti in gradi o funzioni di calcolo come tangente in radianti o gradi. Queste funzioni sono unarie, ovvero accettano una singola colonna di valori come input, applicano la funzione trigonometrica e restituiscono una colonna di valori come risultato. Assicurarsi che la colonna di input sia il tipo appropriato e contenga il tipo corretto di valori per l'operazione specificata.
Come configurare Applica operazione matematica
Il componente Apply Math Operation richiede un set di dati contenente almeno una colonna contenente solo numeri. I numeri possono essere discreti o continui, ma devono essere di un tipo di dati numerico, non di una stringa.
È possibile applicare la stessa operazione a più colonne numeriche, ma tutte le colonne devono trovarsi nello stesso set di dati.
Ogni istanza di questo componente può eseguire un solo tipo di operazione alla volta. Per eseguire operazioni matematiche complesse, potrebbe essere necessario concatenare diverse istanze del componente Applica operazione matematica.
Aggiungere il componente Apply Math Operation (Applica operazione matematica) alla pipeline.
Connettere un set di dati contenente almeno una colonna numerica.
Selezionare una o più colonne di origine in cui eseguire il calcolo.
- Qualsiasi colonna scelta deve essere un tipo di dati numerico.
- L'intervallo di dati deve essere valido per l'operazione matematica selezionata. In caso contrario, potrebbe verificarsi un errore o un risultato NaN (non un numero). Ad esempio, Ln(-1.0) è un'operazione non valida e restituisce un valore pari
NaN
a .
Selezionare Categoria per selezionare il tipo di operazione matematica da eseguire.
Scegliere un'operazione specifica dall'elenco in tale categoria.
Impostare parametri aggiuntivi richiesti da ogni tipo di operazione.
Usare l'opzione Modalità output per indicare come si vuole generare l'operazione matematica:
- Append. Tutte le colonne usate come input sono incluse nel set di dati di output, oltre a una colonna aggiuntiva che contiene i risultati dell'operazione matematica.
- Inplace. I valori nelle colonne usate come input vengono sostituiti con i nuovi valori calcolati.
- ResultOnly. Viene restituita una singola colonna contenente i risultati dell'operazione matematica.
Inviare la pipeline.
Risultati
Se si generano i risultati usando le opzioni Append o ResultOnly , le intestazioni di colonna del set di dati restituito indicano l'operazione e le colonne usate. Ad esempio, se si confrontano due colonne usando l'operatore Equals , i risultati sono simili al seguente:
- Equals(Col2_Col1), che indica che è stato testato Col2 rispetto a Col1.
- Equals(Col2_$10), che indica che la colonna 2 è stata confrontata con la costante 10.
Anche se si usa l'opzione Sul posto , i dati di origine non vengono eliminati o modificati. La colonna nel set di dati originale è ancora disponibile nella finestra di progettazione. Per visualizzare i dati originali, è possibile connettere il componente Add Columns (Aggiungi colonne ) e aggiungerlo all'output di Apply Math Operation (Applica operazione matematica).
Operazioni matematiche di base
Le funzioni nella categoria Basic accettano in genere un singolo valore da una colonna, eseguono l'operazione predefinita e restituiscono un singolo valore. Per alcune funzioni, è possibile specificare una costante o un set di colonne come secondo argomento.
Azure Machine Learning supporta le funzioni seguenti nella categoria Basic :
Abs
Restituisce il valore assoluto delle colonne selezionate.
Atan2
Restituisce una tangente inversa a quattro quadranti.
Selezionare le colonne che contengono le coordinate del punto. Per il secondo argomento, che corrisponde alla coordinata x, è anche possibile specificare una costante.
Corrisponde alla funzione ATAN2 in MATLAB.
Conj
Restituisce il coniugato per i valori nella colonna selezionata.
CubeRoot
Calcola la radice del cubo per i valori nella colonna selezionata.
DoubleFactorial
Calcola il fattore doppio per i valori nella colonna selezionata. Il fattore doppio è un'estensione della funzione fattoriale normale e viene indicato come x!!
.
Eps
Restituisce le dimensioni del divario tra il valore corrente e il numero a precisione doppia più alto successivo. Corrisponde alla funzione EPS in MATLAB.
Exp
Restituisce e generato alla potenza del valore nella colonna selezionata. Questa funzione corrisponde alla funzione EXP di Excel.
Exp2
Restituisce l'esponenziale base 2 degli argomenti, risolvendo y = x * 2t dove t è una colonna di valori contenenti esponenti.
In Set di colonne selezionare la colonna contenente i valori dell'esponente t.
Per Exp2 è possibile specificare un secondo argomento x, che può essere una costante o un'altra colonna di valori. In Secondo tipo di argomento indicare se si fornirà il moltiplicatore x come costante o un valore in una colonna.
Ad esempio, se si seleziona una colonna con i valori {0,1,2,3,4,5} per il moltiplicatore e l'esponente, la funzione restituisce {0, 2, 8, 24, 64 160).
ExpMinus1
Restituisce l'esponente negativo per i valori nella colonna selezionata.
Fattoriale
Restituisce il fattoriale per i valori nella colonna selezionata.
Ipotenusa
Calcola l'ipotenusa per un triangolo in cui la lunghezza di un lato viene specificata come colonna di valori e la lunghezza del secondo lato viene specificata come costante o come due colonne.
Ln
Restituisce il logaritmo naturale per i valori nella colonna selezionata.
LnPlus1
Restituisce il logaritmo naturale più uno per i valori nella colonna selezionata.
Log
Restituisce il log dei valori nella colonna selezionata, in base alla base specificata.
È possibile specificare la base (il secondo argomento) come costante o selezionando un'altra colonna di valori.
Log10
Restituisce i valori logaritmi di base 10 per la colonna selezionata.
Log2
Restituisce i valori logaritmi di base 2 per la colonna selezionata.
NthRoot
Restituisce l'na radice del valore, utilizzando un valore n specificato.
Selezionare le colonne per le quali calcolare la radice usando l'opzione ColumnSet .
In Secondo tipo di argomento selezionare un'altra colonna contenente la radice oppure specificare una costante da usare come radice.
Se il secondo argomento è una colonna, ogni valore nella colonna viene utilizzato come valore di n per la riga corrispondente. Se il secondo argomento è una costante, digitare il valore per n nella casella di testo Secondo argomento .
Pow
Calcola X elevato alla potenza di Y per ognuno dei valori nella colonna selezionata.
In primo luogo, selezionare le colonne che contengono la base, che deve essere float, usando l'opzione ColumnSet .
In Secondo tipo di argomento selezionare la colonna contenente l'esponente oppure specificare una costante da utilizzare come esponente.
Se il secondo argomento è una colonna, ogni valore nella colonna viene utilizzato come esponente per la riga corrispondente. Se il secondo argomento è una costante, digitare il valore per l'esponente nella casella di testo Secondo argomento .
Sqrt
Restituisce la radice quadrata dei valori nella colonna selezionata.
SqrtPi
Per ogni valore nella colonna selezionata, moltiplica il valore per pi e quindi restituisce la radice quadrata del risultato.
Square
Piazza i valori nella colonna selezionata.
Operazioni di confronto
Usare le funzioni di confronto nella finestra di progettazione di Azure Machine Learning ogni volta che è necessario testare due set di valori tra loro. Ad esempio, in una pipeline potrebbe essere necessario eseguire queste operazioni di confronto:
- Valutare una colonna di punteggi di probabilità modello rispetto a un valore soglia.
- Determinare se due set di risultati sono uguali. Per ogni riga diversa, aggiungere un flag FALSE che può essere usato per un'ulteriore elaborazione o filtro.
EqualTo
Restituisce True se i valori sono uguali.
GreaterThan
Restituisce True se i valori nel set di colonne sono maggiori della costante specificata o maggiori dei valori corrispondenti nella colonna di confronto.
GreaterThanOrEqualTo
Restituisce True se i valori nel set di colonne sono maggiori o uguali alla costante specificata oppure maggiore o uguale ai valori corrispondenti nella colonna di confronto.
LessThan
Restituisce True se i valori nel set di colonne sono minori della costante specificata o minori dei valori corrispondenti nella colonna di confronto.
LessThanOrEqualTo
Restituisce True se i valori nel set di colonne sono minori o uguali alla costante specificata oppure minori o uguali ai valori corrispondenti nella colonna di confronto.
NotEqualTo
Restituisce True se i valori del set di colonne non sono uguali alla colonna costante o di confronto e restituisce False se sono uguali.
PairMax
Restituisce il valore maggiore, ovvero il valore in Column set o il valore nella colonna costante o di confronto.
PairMin
Restituisce il valore minore, ovvero il valore in Column set o il valore nella colonna costante o di confronto
Operazioni aritmetiche
Include le operazioni aritmetiche di base: addizione e sottrazione, divisione e moltiplicazione. Poiché la maggior parte delle operazioni è binaria, richiedendo due numeri, è prima necessario scegliere l'operazione e quindi scegliere la colonna o i numeri da usare nei primi e nei secondi argomenti.
L'ordine per la divisione e la sottrazione sono i seguenti:
- Sottrazione(Arg1_Arg2) = Arg1 - Arg 2
- Divide(Arg1_Arg2) = Arg1 / Arg 2
La tabella seguente illustra alcuni esempi
Operazione | Num1 | Num2 | Colonna risultato | Valore restituito |
---|---|---|---|---|
Aggiunta | 1 | 5 | Add(Num2_Num1) | 6 |
Moltiplicazione | 1 | 5 | Multiple (Num2_Num1) | 5 |
Sottrazione | 5 | 1 | Sottrazione (Num2_Num1) | 4 |
Sottrazione | 0 | 1 | Sottrazione (Num2_Num1) | -1 |
Divisione | 5 | 1 | Divide (Num2_Num1) | 5 |
Divisione | 1 | 0 | Divide (Num2_Num1) | Infinito |
Aggiunta
Specificare le colonne di origine usando Il set di colonne e quindi aggiungere a tali valori un numero specificato in Secondo argomento.
Per aggiungere i valori in due colonne, scegliere una colonna o una colonna usando Il set di colonne e quindi scegliere una seconda colonna usando Secondo argomento.
Divide
Divide i valori in Column impostato da una costante o dai valori di colonna definiti in Secondo argomento. In altre parole, scegli prima il divisore e poi il dividendo. Il valore di output è il quoziente.
Per
Moltiplica i valori in Column impostati in base ai valori di colonna o costanti specificati.
Sottrai
Specificare la colonna di valori su cui operare (minuend), scegliendo una colonna diversa usando l'opzione Set di colonne. Specificare quindi il numero da sottrarre (sottrazione) usando l'elenco a discesa Secondo argomento. È possibile scegliere una costante o una colonna di valori.
Operazioni di arrotondamento
La finestra di progettazione di Azure Machine Learning supporta un'ampia gamma di operazioni di arrotondamento. Per molte operazioni, è necessario specificare la quantità di precisione da usare durante l'arrotondamento. È possibile utilizzare un livello di precisione statico, specificato come costante, oppure applicare un valore di precisione dinamica ottenuto da una colonna di valori.
Se si utilizza una costante, impostare Tipo di precisione su Costante e quindi digitare il numero di cifre come numero intero nella casella di testo Precisione costante. Se si digita un numero intero, il componente non genera un errore, ma i risultati possono essere imprevisti.
Per usare un valore di precisione diverso per ogni riga nel set di dati, impostare Tipo di precisione su ColumnSet e quindi scegliere la colonna contenente i valori di precisione appropriati.
Arrotonda eccesso
Restituisce il limite massimo per i valori in Set di colonne.
CeilingPower2
Restituisce il soffitto quadrato per i valori in Set di colonne.
Piano
Restituisce il piano per i valori in Set di colonne, alla precisione specificata.
Mod
Restituisce la parte frazionaria dei valori in Set di colonne, sulla precisione specificata.
Quoziente
Restituisce la parte frazionaria dei valori in Set di colonne, sulla precisione specificata.
Residuo
Restituisce il resto per i valori in Set di colonne.
RoundDigits
Restituisce i valori in Set di colonne, arrotondati dalla regola 4/5 al numero specificato di cifre.
RoundDown
Restituisce i valori in Set di colonne, arrotondati per difetto al numero specificato di cifre.
RoundUp
Restituisce i valori in Set di colonne, arrotondati fino al numero specificato di cifre.
ToEven
Restituisce i valori in Set di colonne, arrotondati all'intero più vicino, numero pari.
ToOdd
Restituisce i valori in Set di colonne, arrotondati all'intero numero dispari più vicino.
Truncate
Tronca i valori in Column set rimuovendo tutte le cifre non consentite dalla precisione specificata.
Funzioni matematiche speciali
Questa categoria include funzioni matematiche specializzate spesso usate nell'analisi scientifica dei dati. Se non diversamente specificato, la funzione è unaria e restituisce il calcolo specificato per ogni valore nella colonna o nelle colonne selezionate.
Beta
Restituisce il valore della funzione beta di Euler.
EllipticIntegralE
Restituisce il valore dell'integrale ellittico incompleto.
EllipticIntegralK
Restituisce il valore dell'integrale ellittico completo (K).
Erf
Restituisce il valore della funzione di errore.
La funzione di errore (chiamata anche funzione di errore Gauss) è una funzione speciale della forma sigmoide usata in probabilità per descrivere la diffusione.
Erfc
Restituisce il valore della funzione di errore complementare.
Erfc
è definito come 1 – erf(x).
ErfScaled
Restituisce il valore della funzione di errore ridimensionata.
La versione ridimensionata della funzione di errore può essere usata per evitare l'underflow aritmetico.
ErfInverse
Restituisce il valore della funzione inversa erf
.
ExponentialIntegralEin
Restituisce il valore dell'Ei integrale esponenziale.
Gamma
Restituisce il valore della funzione gamma.
GammaLn
Restituisce il logaritmo naturale della funzione gamma.
GammaRegularizedP
Restituisce il valore della funzione gamma incompleta regolarizzata.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
GammaRegularizedPInverse
Restituisce il valore della funzione gamma inversamente regolarizzata incompleta.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
GammaRegularizedQ
Restituisce il valore della funzione gamma incompleta regolarizzata.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
GammaRegularizedQInverse
Restituisce il valore della funzione gamma regolarizzata regolarizzata generalizzata inversa.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
PolyGamma
Restituisce il valore della funzione polygamma.
Questa funzione accetta un secondo argomento, che può essere fornito come costante o colonna di valori.
Funzioni trigonometriche
Questa categoria include la maggior parte delle funzioni trigonometriche e trigonometriche inverse. Tutte le funzioni trigonometriche sono unarie e non richiedono argomenti aggiuntivi.
Acos
Calcola l'arcocosine per i valori di colonna.
AcosDegree
Calcola l'arcocosina dei valori di colonna, in gradi.
Acosh
Calcola l'arcocosine iperbolico dei valori di colonna.
Acot
Calcola l'arcocotangente dei valori di colonna.
AcotDegrees
Calcola l'arcocotangente dei valori di colonna, in gradi.
Acoth
Calcola l'arcocotangente iperbolico dei valori di colonna.
Acsc
Calcola l'arcocosecant dei valori di colonna.
AcscDegrees
Calcola l'arcocosecant dei valori di colonna, in gradi.
A sec
Calcola l'arcosecante dei valori di colonna.
AsecDegrees
Calcola l'arcosecante dei valori di colonna, in gradi.
Asech
Calcola l'arcobolico iperbolico dei valori di colonna.
Asin
Calcola l'arcosine dei valori di colonna.
AsinDegrees
Calcola l'arcosine dei valori di colonna, in gradi.
Asinh
Calcola l'arcosine iperbolico per i valori di colonna.
Atan
Calcola l'arcotangente dei valori di colonna.
AtanDegrees
Calcola l'arcotangente dei valori di colonna, in gradi.
Atanh
Calcola l'arcotangente iperbolico dei valori di colonna.
Cos
Calcola il coseno dei valori di colonna.
CosDegrees
Calcola il coseno per i valori di colonna, in gradi.
Cosh
Calcola il coseno iperbolico per i valori di colonna.
Cot
Calcola la cotangente per i valori di colonna.
CotDegrees
Calcola la cotangente per i valori di colonna, espressa in gradi.
Coth
Calcola la cotangente iperbolica per i valori di colonna.
Csc
Calcola il cosecante per i valori di colonna.
CscDegrees
Calcola il cosecante per i valori di colonna, in gradi.
Csch
Calcola il cosecante iperbolico per i valori di colonna.
DegreesToRadians
Converte i gradi in radianti.
Sec
Calcola la secante dei valori di colonna.
aSecDegrees
Calcola il secante per i valori di colonna, in gradi.
aSech
Calcola la sequenza iperbolica dei valori di colonna.
Segno
Restituisce il segno dei valori della colonna.
Sin
Calcola il seno dei valori di colonna.
Sinc
Calcola il valore seno-coseno dei valori della colonna.
SinDegrees
Calcola il seno per i valori di colonna, in gradi.
Sinh
Calcola il seno iperbolico dei valori di colonna.
Tan
Calcola la tangente dei valori di colonna.
TanDegrees
Calcola la tangente per l'argomento, espressa in gradi.
Tanh
Calcola la tangente iperbolica dei valori di colonna.
Note tecniche
Prestare attenzione quando si selezionano più colonne come secondo operatore. I risultati sono facili da comprendere se l'operazione è semplice, ad esempio l'aggiunta di una costante a tutte le colonne.
Si supponga che il set di dati abbia più colonne e si aggiunga il set di dati a se stesso. Nei risultati, ogni colonna viene aggiunta a se stessa, come indicato di seguito:
Num1 | Num2 | Num3 | Add(Num1_Num1) | Add(Num2_Num2) | Add(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Se è necessario eseguire calcoli più complessi, è possibile concatenare più istanze di Apply Math Operation. Ad esempio, è possibile aggiungere due colonne usando un'istanza di Apply Math Operation e quindi usare un'altra istanza di Apply Math Operation per dividere la somma per una costante per ottenere la media.
In alternativa, usare uno dei componenti seguenti per eseguire tutti i calcoli contemporaneamente, usando script SQL, R o Python:
- Execute R Script (Esegui script R)
- Execute Python Script (Esegui script Python)
- Apply SQL Transformation (Applica trasformazione SQL)
Passaggi successivi
Vedere il set di componenti disponibili per Azure Machine Learning.