Aplicar Operação Matemática
Este artigo descreve um componente do estruturador do Azure Machine Learning.
Utilize a Operação Aplicar Matemática para criar cálculos aplicados a colunas numéricas no conjunto de dados de entrada.
As operações matemáticas incluem funções aritméticas, funções trigonométricas, funções de arredondamento e funções especiais utilizadas na ciência de dados, como funções gama e erro.
Depois de definir uma operação e executar o pipeline, os valores são adicionados ao conjunto de dados. Consoante a forma como configura o componente, pode:
- Acrescente os resultados ao conjunto de dados (útil ao verificar o resultado da operação).
- Substitua os valores das colunas pelos novos valores calculados.
- Gerar uma nova coluna para resultados e não mostrar os dados originais.
Procure a operação de que precisa nestas categorias:
-
As funções na categoria Básico podem ser utilizadas para manipular um único valor ou coluna de valores. Por exemplo, pode obter o valor absoluto de todos os números numa coluna ou calcular a raiz quadrada de cada valor numa coluna.
-
As funções na categoria Comparar são todas utilizadas para comparação: pode fazer uma comparação em termos de pares dos valores em duas colunas ou comparar cada valor numa coluna com uma constante especificada. Por exemplo, pode comparar colunas para determinar se os valores eram os mesmos em dois conjuntos de dados. Em alternativa, pode utilizar uma constante, como um valor máximo permitido, para encontrar valores atípicos numa coluna numérica.
-
A categoria Operações inclui funções matemáticas básicas: adição, subtração, multiplicação e divisão. Pode trabalhar com colunas ou constantes. Por exemplo, pode adicionar o valor na Coluna A ao valor na Coluna B. Em alternativa, pode subtrair uma constante, como uma média calculada anteriormente, de cada valor na Coluna A.
-
A categoria Arredondamento inclui uma variedade de funções para realizar operações como arredondamento, teto, piso e truncagem para vários níveis de precisão. Pode especificar o nível de precisão para números decimais e inteiros.
-
A categoria Especial inclui funções matemáticas que são especialmente utilizadas na ciência de dados, como integrais elípticos e a função de erro gaussiano.
-
A categoria Trigonométrica inclui todas as funções trigonométricas padrão. Por exemplo, pode converter radianos em graus ou funções de computação como tangente em radianos ou graus. Estas funções são unárias, o que significa que assumem uma única coluna de valores como entrada, aplicam a função trigonométrica e devolvem uma coluna de valores como resultado. Certifique-se de que a coluna de entrada é o tipo adequado e contém o tipo correto de valores para a operação especificada.
Como configurar a Operação Aplicar Matemática
O componente Aplicar Operação Matemática requer um conjunto de dados que contenha pelo menos uma coluna que contenha apenas números. Os números podem ser discretos ou contínuos, mas têm de ser de um tipo de dados numérico, não de uma cadeia.
Pode aplicar a mesma operação a múltiplas colunas numéricas, mas todas as colunas têm de estar no mesmo conjunto de dados.
Cada instância deste componente só pode executar um tipo de operação de cada vez. Para realizar operações matemáticas complexas, poderá ter de agrupar várias instâncias do componente Aplicar Operação Matemática .
Adicione o componente Aplicar Operação Matemática ao pipeline.
Ligue um conjunto de dados que contenha, pelo menos, uma coluna numérica.
Selecione uma ou mais colunas de origem nas quais efetuar o cálculo.
- Qualquer coluna que escolher tem de ser um tipo de dados numérico.
- O intervalo de dados tem de ser válido para a operação matemática selecionada. Caso contrário, poderá ocorrer um erro ou um resultado naN (não um número). Por exemplo, Ln(-1.0) é uma operação inválida e resulta num valor de
NaN
.
Selecione Categoria para selecionar o tipo de operação matemática a executar.
Escolha uma operação específica na lista nessa categoria.
Defina parâmetros adicionais necessários para cada tipo de operação.
Utilize a opção Modo de saída para indicar como pretende que a operação matemática seja gerada:
- Acrescentar. Todas as colunas utilizadas como entradas estão incluídas no conjunto de dados de saída. Além disso, é acrescentada uma coluna adicional que contém os resultados da operação matemática.
- No local. Os valores nas colunas utilizadas como entradas são substituídos pelos novos valores calculados.
- ResultOnly. É devolvida uma única coluna que contém os resultados da operação matemática.
Submeta o pipeline.
Resultados
Se gerar os resultados com as opções Acrescentar ou ResultadoOnly , os cabeçalhos de coluna do conjunto de dados devolvido indicam a operação e as colunas utilizadas. Por exemplo, se comparar duas colunas com o operador Equals , os resultados teriam o seguinte aspeto:
- É igual(Col2_Col1), indicando que testou Col2 contra Col1.
- É igual(Col2_$10), indicando que comparou a coluna 2 com a constante 10.
Mesmo que utilize a opção No local , os dados de origem não são eliminados nem alterados; a coluna no conjunto de dados original ainda está disponível no estruturador. Para ver os dados originais, pode ligar o componente Adicionar Colunas e associá-lo à saída da Operação Aplicar Matemática.
Operações matemáticas básicas
Normalmente, as funções na categoria Básico tiram um único valor de uma coluna, executam a operação predefinida e devolvem um único valor. Para algumas funções, pode especificar uma constante ou um conjunto de colunas como um segundo argumento.
O Azure Machine Learning suporta as seguintes funções na categoria Básico :
Abs
Devolve o valor absoluto das colunas selecionadas.
Atan2
Devolve uma tangente inversa de quatro quadrantes.
Selecione as colunas que contêm as coordenadas de ponto. Para o segundo argumento, que corresponde à coordenada x, também pode especificar uma constante.
Corresponde à função ATAN2 no MATLAB.
Conj
Devolve o conjugado para os valores na coluna selecionada.
CubeRoot
Calcula a raiz do cubo para os valores na coluna selecionada.
DoubleFactorial
Calcula o fatorial duplo para os valores na coluna selecionada. O fatorial duplo é uma extensão da função factorial normal e é indicado como x!!
.
Eps
Devolve o tamanho do intervalo entre o valor atual e o número de precisão dupla mais alto seguinte. Corresponde à função EPS no MATLAB.
Exp
Devolve e elevado à potência do valor na coluna selecionada. Esta função é igual à função EXP do Excel.
Exp2
Devolve o exponencial base-2 dos argumentos, resolvendo para y = x * 2t em que t é uma coluna de valores que contêm expoentes.
Em Conjunto de colunas, selecione a coluna que contém os valores expoentes t.
Para Exp2 , pode especificar um segundo argumento x, que pode ser uma constante ou outra coluna de valores. No segundo tipo de argumento, indique se irá fornecer o multiplicador x como uma constante ou um valor numa coluna.
Por exemplo, se selecionar uma coluna com os valores {0,1,2,3,4,5} do multiplicador e do expoente, a função devolve {0, 2, 8, 24, 64 160).
ExpMinus1
Devolve o expoente negativo para valores na coluna selecionada.
Fatorial
Devolve o fatorial dos valores na coluna selecionada.
Hipotenusa
Calcula a hipotenusa de um triângulo no qual o comprimento de um lado é especificado como uma coluna de valores e o comprimento do segundo lado é especificado como uma constante ou como duas colunas.
Ln
Devolve o logaritmo natural para os valores na coluna selecionada.
LnPlus1
Devolve o logaritmo natural mais um para os valores na coluna selecionada.
Registo
Devolve o registo dos valores na coluna selecionada, dada a base especificada.
Pode especificar a base (o segundo argumento) como uma constante ou ao selecionar outra coluna de valores.
Log10
Devolve os valores base de 10 logaritmos para a coluna selecionada.
Registo2
Devolve os valores base de 2 logaritmos para a coluna selecionada.
NthRoot
Devolve a n.ª raiz do valor, utilizando um n que especificar.
Selecione as colunas para as quais pretende calcular a raiz com a opção ColumnSet .
Em Segundo tipo de argumento, selecione outra coluna que contenha a raiz ou especifique uma constante a utilizar como raiz.
Se o segundo argumento for uma coluna, cada valor na coluna é utilizado como o valor de n para a linha correspondente. Se o segundo argumento for uma constante, escreva o valor para n na caixa de texto Segundo argumento .
Pow
Calcula X elevado à potência de Y para cada um dos valores na coluna selecionada.
Primeiro, selecione as colunas que contêm a base, que deve ser um flutuante, com a opção ColumnSet .
Em Segundo tipo de argumento, selecione a coluna que contém o expoente ou especifique uma constante a utilizar como expoente.
Se o segundo argumento for uma coluna, cada valor na coluna é utilizado como expoente para a linha correspondente. Se o segundo argumento for uma constante, escreva o valor do expoente na caixa de texto Segundo argumento .
Sqrt
Devolve a raiz quadrada dos valores na coluna selecionada.
SqrtPi
Para cada valor na coluna selecionada, multiplica o valor por pi e, em seguida, devolve a raiz quadrada do resultado.
Square
Quadrados dos valores na coluna selecionada.
Operações de comparação
Utilize as funções de comparação no estruturador do Azure Machine Learning sempre que precisar de testar dois conjuntos de valores entre si. Por exemplo, num pipeline, poderá ter de efetuar estas operações de comparação:
- Avalie uma coluna do modelo de classificações de probabilidade em relação a um valor de limiar.
- Determine se dois conjuntos de resultados são iguais. Para cada linha diferente, adicione um sinalizador FALSO que pode ser utilizado para processamento ou filtragem adicionais.
EqualTo
Devolve Verdadeiro se os valores forem os mesmos.
GreaterThan
Devolve Verdadeiro se os valores no Conjunto de colunas forem maiores do que a constante especificada ou superior aos valores correspondentes na coluna de comparação.
GreaterThanOrEqualTo
Devolve Verdadeiro se os valores no Conjunto de colunas forem maiores ou iguais à constante especificada ou maiores ou iguais aos valores correspondentes na coluna de comparação.
LessThan
Devolve Verdadeiro se os valores no Conjunto de colunas forem inferiores à constante especificada ou inferiores aos valores correspondentes na coluna de comparação.
LessThanOrEqualTo
Devolve Verdadeiro se os valores no Conjunto de colunas forem menores ou iguais à constante especificada ou menores ou iguais aos valores correspondentes na coluna de comparação.
NotEqualTo
Devolve Verdadeiro se os valores no Conjunto de colunas não forem iguais à coluna de constante ou comparação e devolver Falso se forem iguais.
PairMax
Devolve o valor que é maior — o valor em Conjunto de colunas ou o valor na coluna constante ou de comparação.
PairMin
Devolve o valor menor — o valor em Conjunto de colunas ou o valor na coluna constante ou de comparação
Operações aritméticas
Inclui as operações aritméticas básicas: adição e subtração, divisão e multiplicação. Uma vez que a maioria das operações é binária, que requer dois números, primeiro escolhe a operação e, em seguida, escolhe a coluna ou números a utilizar no primeiro e segundo argumentos.
A ordem de divisão e subtração é a seguinte:
- Subtrair(Arg1_Arg2) = Arg1 - Arg 2
- Dividir(Arg1_Arg2) = Arg1/Arg 2
A tabela seguinte mostra alguns exemplos
Operação | Num1 | Num2 | Coluna de resultados | Valor do resultado |
---|---|---|---|---|
Adição | 1 | 5 | Adicionar(Num2_Num1) | 6 |
Multiplicação | 1 | 5 | Múltiplos (Num2_Num1) | 5 |
Subtração | 5 | 1 | Subtrair(Num2_Num1) | 4 |
Subtração | 0 | 1 | Subtrair(Num2_Num1) | -1 |
Divisão | 5 | 1 | Dividir(Num2_Num1) | 5 |
Divisão | 1 | 0 | Dividir(Num2_Num1) | Infinity |
Adicionar
Especifique as colunas de origem com o Conjunto de colunas e, em seguida, adicione a esses valores um número especificado no segundo argumento.
Para adicionar os valores em duas colunas, escolha uma coluna ou colunas com o Conjunto de colunas e, em seguida, escolha uma segunda coluna com o segundo argumento.
Dividir
Divide os valores em Coluna definidos por uma constante ou pelos valores de coluna definidos no segundo argumento. Por outras palavras, escolha primeiro o divisor e, em seguida, o dividendo. O valor de saída é o quociente.
Multiplicar
Multiplica os valores em Coluna definidos pelos valores de constante ou coluna especificados.
Subtrair
Especifique a coluna de valores a operar (o minuend), ao escolher uma coluna diferente, utilizando a opção Conjunto de colunas . Em seguida, especifique o número a subtrair (o subtraído) com a lista pendente Segundo argumento . Pode escolher uma constante ou coluna de valores.
Operações de arredondamento
O estruturador do Azure Machine Learning suporta várias operações de arredondamento. Para muitas operações, tem de especificar a quantidade de precisão a utilizar ao arredondar. Pode utilizar um nível de precisão estático, especificado como uma constante, ou pode aplicar um valor de precisão dinâmico obtido a partir de uma coluna de valores.
Se utilizar uma constante, defina Tipo de Precisão como Constante e, em seguida, escreva o número de dígitos como um número inteiro na caixa de texto Precisão Constante . Se escrever um número não inteiro, o componente não gera um erro, mas os resultados podem ser inesperados.
Para utilizar um valor de precisão diferente para cada linha no conjunto de dados, defina Precision Type como ColumnSet e, em seguida, escolha a coluna que contém os valores de precisão adequados.
Ceiling
Devolve o limite para os valores em Conjunto de colunas.
CeilingPower2
Devolve o limite ao quadrado para os valores em Conjunto de colunas.
Floor
Devolve o piso dos valores em Conjunto de colunas, para a precisão especificada.
Mod
Devolve a parte fracionária dos valores em Conjunto de colunas, para a precisão especificada.
Quociente
Devolve a parte fracionária dos valores em Conjunto de colunas, para a precisão especificada.
Resto
Devolve o resto dos valores em Conjunto de colunas.
RoundDigits
Devolve os valores no Conjunto de colunas, arredondados pela regra 4/5 para o número especificado de dígitos.
RoundDown
Devolve os valores no Conjunto de colunas, arredondados por defeito para o número especificado de dígitos.
RoundUp
Devolve os valores em Conjunto de colunas, arredondados para o número especificado de dígitos.
ToEven
Devolve os valores em Conjunto de colunas, arredondados para o número par e inteiro mais próximo.
ToOdd
Devolve os valores em Conjunto de colunas, arredondados para o número ímpar e inteiro mais próximo.
Truncar
Trunca os valores em Conjunto de colunas ao remover todos os dígitos não permitidos pela precisão especificada.
Funções matemáticas especiais
Esta categoria inclui funções matemáticas especializadas frequentemente utilizadas na ciência de dados. Salvo indicação em contrário, a função é unária e devolve o cálculo especificado para cada valor na coluna ou colunas selecionadas.
Beta
Devolve o valor da função beta de Euler.
EllipticIntegralE
Devolve o valor do integral elíptico incompleto.
EllipticIntegralK
Devolve o valor do integral elíptico completo (K).
Funcerro
Devolve o valor da função de erro.
A função de erro (também denominada função de erro Gauss) é uma função especial da forma sigmóide que é utilizada com probabilidade para descrever a difusão.
Erfc
Devolve o valor da função de erro complementar.
Erfc
é definido como 1 – erf(x).
ErfScaled
Devolve o valor da função de erro dimensionado.
A versão dimensionada da função de erro pode ser utilizada para evitar o subfluxo aritmético.
ErfInverse
Devolve o valor da função inversa erf
.
ExponentialIntegralEin
Devolve o valor do Ei integral exponencial.
Gama
Devolve o valor da função gama.
GamaLn
Devolve o logaritmo natural da função gama.
GammaRegularizedP
Devolve o valor da função gama incompleta regularizada.
Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
GammaRegularizedPInverse
Devolve o valor da função gama incompleta normalizada inversa.
Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
GammaRegularizedQ
Devolve o valor da função gama incompleta regularizada.
Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
GammaRegularizedQInverse
Devolve o valor da função gama incompleta generalizada inversa.
Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
PolyGamma
Devolve o valor da função polygamma.
Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.
Funções trigonométricas
Esta categoria inclui a maioria das importantes funções trigonométricas e trigonométricas inversas. Todas as funções trigonométricas são unárias e não requerem argumentos adicionais.
Acos
Calcula o arco de cosseno para os valores da coluna.
AcosDegree
Calcula o arco de cosseno dos valores da coluna, em graus.
Acosh
Calcula o arco de cosseno hiperbólico dos valores da coluna.
Acot
Calcula o arco de tangente dos valores da coluna.
AcotDegrees
Calcula o arco de tangente dos valores da coluna, em graus.
Autenticação
Calcula o arco de tangente hiperbólico dos valores da coluna.
Acsc
Calcula o arco de secante dos valores da coluna.
AcscDegrees
Calcula o arco de secante dos valores da coluna, em graus.
Asec
Calcula a arcsecante dos valores da coluna.
AsecDegrees
Calcula o arcocante dos valores da coluna, em graus.
Asech
Calcula a arcsecantecant hiperbólica dos valores da coluna.
Asin
Calcula o arco de seno dos valores da coluna.
AsinDegrees
Calcula o arco de seno dos valores da coluna, em graus.
Asinh
Calcula a arcsina hiperbólica para os valores da coluna.
Atan
Calcula o arco de tangente dos valores da coluna.
AtanDegrees
Calcula o arco de tangente dos valores da coluna, em graus.
Atanh
Calcula a arctangent hiperbólica dos valores da coluna.
Cos
Calcula o cosseno dos valores da coluna.
CosDegrees
Calcula o cosseno para os valores da coluna, em graus.
Cosh
Calcula o cosseno hiperbólico para os valores da coluna.
Cot
Calcula a cótula para os valores de coluna.
CotDegrees
Calcula a tangente para os valores da coluna, em graus.
Coth
Calcula a tangente hiperbólica para os valores da coluna.
Csc
Calcula a cossecante para os valores de coluna.
CscDegrees
Calcula a cossecante para os valores de coluna, em graus.
Csch
Calcula a cossecante hiperbólica para os valores da coluna.
DegreesToRadians
Converte graus em radianos.
Seg
Calcula a secante dos valores da coluna.
aSecDegrees
Calcula a secante para os valores da coluna, em graus.
aSech
Calcula a secante hiperbólica dos valores da coluna.
Assinar
Devolve o sinal dos valores da coluna.
Sin
Calcula o seno dos valores da coluna.
Sinc
Calcula o valor sine-cosine dos valores da coluna.
SinDegrees
Calcula o seno para os valores da coluna, em graus.
Sinh
Calcula o seno hiperbólico dos valores da coluna.
Tan
Calcula a tangente dos valores da coluna.
TanDegrees
Calcula a tangente para o argumento, em graus.
Tanh
Calcula a tangente hiperbólica dos valores da coluna.
Notas técnicas
Tenha cuidado quando selecionar mais do que uma coluna como o segundo operador. Os resultados são fáceis de entender se a operação é simples, como adicionar uma constante a todas as colunas.
Suponha que o conjunto de dados tem múltiplas colunas e que adiciona o conjunto de dados a si próprio. Nos resultados, cada coluna é adicionada a si mesma, da seguinte forma:
Num1 | Num2 | Num3 | Adicionar(Num1_Num1) | Adicionar(Num2_Num2) | Adicionar(Num3_Num3) |
---|---|---|---|---|---|
1 | 5 | 2 | 2 | 10 | 4 |
2 | 3 | -1 | 4 | 6 | -2 |
0 | 1 | -1 | 0 | 2 | -2 |
Se precisar de realizar cálculos mais complexos, pode encadear várias instâncias da Operação Aplicar Matemática. Por exemplo, pode adicionar duas colunas ao utilizar uma instância de Aplicar Operação Matemática e, em seguida, utilizar outra instância de Aplicar Operação Matemática para dividir a soma por uma constante para obter a média.
Em alternativa, utilize um dos seguintes componentes para efetuar todos os cálculos ao mesmo tempo, com o script SQL, R ou Python:
Passos seguintes
Veja o conjunto de componentes disponíveis para o Azure Machine Learning.