Aplicar Operação Matemática

Este artigo descreve um componente do estruturador do Azure Machine Learning.

Utilize a Operação Aplicar Matemática para criar cálculos aplicados a colunas numéricas no conjunto de dados de entrada.

As operações matemáticas incluem funções aritméticas, funções trigonométricas, funções de arredondamento e funções especiais utilizadas na ciência de dados, como funções gama e erro.

Depois de definir uma operação e executar o pipeline, os valores são adicionados ao conjunto de dados. Consoante a forma como configura o componente, pode:

  • Acrescente os resultados ao conjunto de dados (útil ao verificar o resultado da operação).
  • Substitua os valores das colunas pelos novos valores calculados.
  • Gerar uma nova coluna para resultados e não mostrar os dados originais.

Procure a operação de que precisa nestas categorias:

  • Básica

    As funções na categoria Básico podem ser utilizadas para manipular um único valor ou coluna de valores. Por exemplo, pode obter o valor absoluto de todos os números numa coluna ou calcular a raiz quadrada de cada valor numa coluna.

  • Comparar

    As funções na categoria Comparar são todas utilizadas para comparação: pode fazer uma comparação em termos de pares dos valores em duas colunas ou comparar cada valor numa coluna com uma constante especificada. Por exemplo, pode comparar colunas para determinar se os valores eram os mesmos em dois conjuntos de dados. Em alternativa, pode utilizar uma constante, como um valor máximo permitido, para encontrar valores atípicos numa coluna numérica.

  • Operações

    A categoria Operações inclui funções matemáticas básicas: adição, subtração, multiplicação e divisão. Pode trabalhar com colunas ou constantes. Por exemplo, pode adicionar o valor na Coluna A ao valor na Coluna B. Em alternativa, pode subtrair uma constante, como uma média calculada anteriormente, de cada valor na Coluna A.

  • Arredondamento

    A categoria Arredondamento inclui uma variedade de funções para realizar operações como arredondamento, teto, piso e truncagem para vários níveis de precisão. Pode especificar o nível de precisão para números decimais e inteiros.

  • Especial

    A categoria Especial inclui funções matemáticas que são especialmente utilizadas na ciência de dados, como integrais elípticos e a função de erro gaussiano.

  • Trigonométrico

    A categoria Trigonométrica inclui todas as funções trigonométricas padrão. Por exemplo, pode converter radianos em graus ou funções de computação como tangente em radianos ou graus. Estas funções são unárias, o que significa que assumem uma única coluna de valores como entrada, aplicam a função trigonométrica e devolvem uma coluna de valores como resultado. Certifique-se de que a coluna de entrada é o tipo adequado e contém o tipo correto de valores para a operação especificada.

Como configurar a Operação Aplicar Matemática

O componente Aplicar Operação Matemática requer um conjunto de dados que contenha pelo menos uma coluna que contenha apenas números. Os números podem ser discretos ou contínuos, mas têm de ser de um tipo de dados numérico, não de uma cadeia.

Pode aplicar a mesma operação a múltiplas colunas numéricas, mas todas as colunas têm de estar no mesmo conjunto de dados.

Cada instância deste componente só pode executar um tipo de operação de cada vez. Para realizar operações matemáticas complexas, poderá ter de agrupar várias instâncias do componente Aplicar Operação Matemática .

  1. Adicione o componente Aplicar Operação Matemática ao pipeline.

  2. Ligue um conjunto de dados que contenha, pelo menos, uma coluna numérica.

  3. Selecione uma ou mais colunas de origem nas quais efetuar o cálculo.

    • Qualquer coluna que escolher tem de ser um tipo de dados numérico.
    • O intervalo de dados tem de ser válido para a operação matemática selecionada. Caso contrário, poderá ocorrer um erro ou um resultado naN (não um número). Por exemplo, Ln(-1.0) é uma operação inválida e resulta num valor de NaN.
  4. Selecione Categoria para selecionar o tipo de operação matemática a executar.

  5. Escolha uma operação específica na lista nessa categoria.

  6. Defina parâmetros adicionais necessários para cada tipo de operação.

  7. Utilize a opção Modo de saída para indicar como pretende que a operação matemática seja gerada:

    • Acrescentar. Todas as colunas utilizadas como entradas estão incluídas no conjunto de dados de saída. Além disso, é acrescentada uma coluna adicional que contém os resultados da operação matemática.
    • No local. Os valores nas colunas utilizadas como entradas são substituídos pelos novos valores calculados.
    • ResultOnly. É devolvida uma única coluna que contém os resultados da operação matemática.
  8. Submeta o pipeline.

Resultados

Se gerar os resultados com as opções Acrescentar ou ResultadoOnly , os cabeçalhos de coluna do conjunto de dados devolvido indicam a operação e as colunas utilizadas. Por exemplo, se comparar duas colunas com o operador Equals , os resultados teriam o seguinte aspeto:

  • É igual(Col2_Col1), indicando que testou Col2 contra Col1.
  • É igual(Col2_$10), indicando que comparou a coluna 2 com a constante 10.

Mesmo que utilize a opção No local , os dados de origem não são eliminados nem alterados; a coluna no conjunto de dados original ainda está disponível no estruturador. Para ver os dados originais, pode ligar o componente Adicionar Colunas e associá-lo à saída da Operação Aplicar Matemática.

Operações matemáticas básicas

Normalmente, as funções na categoria Básico tiram um único valor de uma coluna, executam a operação predefinida e devolvem um único valor. Para algumas funções, pode especificar uma constante ou um conjunto de colunas como um segundo argumento.

O Azure Machine Learning suporta as seguintes funções na categoria Básico :

Abs

Devolve o valor absoluto das colunas selecionadas.

Atan2

Devolve uma tangente inversa de quatro quadrantes.

Selecione as colunas que contêm as coordenadas de ponto. Para o segundo argumento, que corresponde à coordenada x, também pode especificar uma constante.

Corresponde à função ATAN2 no MATLAB.

Conj

Devolve o conjugado para os valores na coluna selecionada.

CubeRoot

Calcula a raiz do cubo para os valores na coluna selecionada.

DoubleFactorial

Calcula o fatorial duplo para os valores na coluna selecionada. O fatorial duplo é uma extensão da função factorial normal e é indicado como x!!.

Eps

Devolve o tamanho do intervalo entre o valor atual e o número de precisão dupla mais alto seguinte. Corresponde à função EPS no MATLAB.

Exp

Devolve e elevado à potência do valor na coluna selecionada. Esta função é igual à função EXP do Excel.

Exp2

Devolve o exponencial base-2 dos argumentos, resolvendo para y = x * 2t em que t é uma coluna de valores que contêm expoentes.

Em Conjunto de colunas, selecione a coluna que contém os valores expoentes t.

Para Exp2 , pode especificar um segundo argumento x, que pode ser uma constante ou outra coluna de valores. No segundo tipo de argumento, indique se irá fornecer o multiplicador x como uma constante ou um valor numa coluna.

Por exemplo, se selecionar uma coluna com os valores {0,1,2,3,4,5} do multiplicador e do expoente, a função devolve {0, 2, 8, 24, 64 160).

ExpMinus1

Devolve o expoente negativo para valores na coluna selecionada.

Fatorial

Devolve o fatorial dos valores na coluna selecionada.

Hipotenusa

Calcula a hipotenusa de um triângulo no qual o comprimento de um lado é especificado como uma coluna de valores e o comprimento do segundo lado é especificado como uma constante ou como duas colunas.

Ln

Devolve o logaritmo natural para os valores na coluna selecionada.

LnPlus1

Devolve o logaritmo natural mais um para os valores na coluna selecionada.

Registo

Devolve o registo dos valores na coluna selecionada, dada a base especificada.

Pode especificar a base (o segundo argumento) como uma constante ou ao selecionar outra coluna de valores.

Log10

Devolve os valores base de 10 logaritmos para a coluna selecionada.

Registo2

Devolve os valores base de 2 logaritmos para a coluna selecionada.

NthRoot

Devolve a n.ª raiz do valor, utilizando um n que especificar.

Selecione as colunas para as quais pretende calcular a raiz com a opção ColumnSet .

Em Segundo tipo de argumento, selecione outra coluna que contenha a raiz ou especifique uma constante a utilizar como raiz.

Se o segundo argumento for uma coluna, cada valor na coluna é utilizado como o valor de n para a linha correspondente. Se o segundo argumento for uma constante, escreva o valor para n na caixa de texto Segundo argumento .

Pow

Calcula X elevado à potência de Y para cada um dos valores na coluna selecionada.

Primeiro, selecione as colunas que contêm a base, que deve ser um flutuante, com a opção ColumnSet .

Em Segundo tipo de argumento, selecione a coluna que contém o expoente ou especifique uma constante a utilizar como expoente.

Se o segundo argumento for uma coluna, cada valor na coluna é utilizado como expoente para a linha correspondente. Se o segundo argumento for uma constante, escreva o valor do expoente na caixa de texto Segundo argumento .

Sqrt

Devolve a raiz quadrada dos valores na coluna selecionada.

SqrtPi

Para cada valor na coluna selecionada, multiplica o valor por pi e, em seguida, devolve a raiz quadrada do resultado.

Square

Quadrados dos valores na coluna selecionada.

Operações de comparação

Utilize as funções de comparação no estruturador do Azure Machine Learning sempre que precisar de testar dois conjuntos de valores entre si. Por exemplo, num pipeline, poderá ter de efetuar estas operações de comparação:

  • Avalie uma coluna do modelo de classificações de probabilidade em relação a um valor de limiar.
  • Determine se dois conjuntos de resultados são iguais. Para cada linha diferente, adicione um sinalizador FALSO que pode ser utilizado para processamento ou filtragem adicionais.

EqualTo

Devolve Verdadeiro se os valores forem os mesmos.

GreaterThan

Devolve Verdadeiro se os valores no Conjunto de colunas forem maiores do que a constante especificada ou superior aos valores correspondentes na coluna de comparação.

GreaterThanOrEqualTo

Devolve Verdadeiro se os valores no Conjunto de colunas forem maiores ou iguais à constante especificada ou maiores ou iguais aos valores correspondentes na coluna de comparação.

LessThan

Devolve Verdadeiro se os valores no Conjunto de colunas forem inferiores à constante especificada ou inferiores aos valores correspondentes na coluna de comparação.

LessThanOrEqualTo

Devolve Verdadeiro se os valores no Conjunto de colunas forem menores ou iguais à constante especificada ou menores ou iguais aos valores correspondentes na coluna de comparação.

NotEqualTo

Devolve Verdadeiro se os valores no Conjunto de colunas não forem iguais à coluna de constante ou comparação e devolver Falso se forem iguais.

PairMax

Devolve o valor que é maior — o valor em Conjunto de colunas ou o valor na coluna constante ou de comparação.

PairMin

Devolve o valor menor — o valor em Conjunto de colunas ou o valor na coluna constante ou de comparação

Operações aritméticas

Inclui as operações aritméticas básicas: adição e subtração, divisão e multiplicação. Uma vez que a maioria das operações é binária, que requer dois números, primeiro escolhe a operação e, em seguida, escolhe a coluna ou números a utilizar no primeiro e segundo argumentos.

A ordem de divisão e subtração é a seguinte:

  • Subtrair(Arg1_Arg2) = Arg1 - Arg 2
  • Dividir(Arg1_Arg2) = Arg1/Arg 2

A tabela seguinte mostra alguns exemplos

Operação Num1 Num2 Coluna de resultados Valor do resultado
Adição 1 5 Adicionar(Num2_Num1) 6
Multiplicação 1 5 Múltiplos (Num2_Num1) 5
Subtração 5 1 Subtrair(Num2_Num1) 4
Subtração 0 1 Subtrair(Num2_Num1) -1
Divisão 5 1 Dividir(Num2_Num1) 5
Divisão 1 0 Dividir(Num2_Num1) Infinity

Adicionar

Especifique as colunas de origem com o Conjunto de colunas e, em seguida, adicione a esses valores um número especificado no segundo argumento.

Para adicionar os valores em duas colunas, escolha uma coluna ou colunas com o Conjunto de colunas e, em seguida, escolha uma segunda coluna com o segundo argumento.

Dividir

Divide os valores em Coluna definidos por uma constante ou pelos valores de coluna definidos no segundo argumento. Por outras palavras, escolha primeiro o divisor e, em seguida, o dividendo. O valor de saída é o quociente.

Multiplicar

Multiplica os valores em Coluna definidos pelos valores de constante ou coluna especificados.

Subtrair

Especifique a coluna de valores a operar (o minuend), ao escolher uma coluna diferente, utilizando a opção Conjunto de colunas . Em seguida, especifique o número a subtrair (o subtraído) com a lista pendente Segundo argumento . Pode escolher uma constante ou coluna de valores.

Operações de arredondamento

O estruturador do Azure Machine Learning suporta várias operações de arredondamento. Para muitas operações, tem de especificar a quantidade de precisão a utilizar ao arredondar. Pode utilizar um nível de precisão estático, especificado como uma constante, ou pode aplicar um valor de precisão dinâmico obtido a partir de uma coluna de valores.

  • Se utilizar uma constante, defina Tipo de Precisão como Constante e, em seguida, escreva o número de dígitos como um número inteiro na caixa de texto Precisão Constante . Se escrever um número não inteiro, o componente não gera um erro, mas os resultados podem ser inesperados.

  • Para utilizar um valor de precisão diferente para cada linha no conjunto de dados, defina Precision Type como ColumnSet e, em seguida, escolha a coluna que contém os valores de precisão adequados.

Ceiling

Devolve o limite para os valores em Conjunto de colunas.

CeilingPower2

Devolve o limite ao quadrado para os valores em Conjunto de colunas.

Floor

Devolve o piso dos valores em Conjunto de colunas, para a precisão especificada.

Mod

Devolve a parte fracionária dos valores em Conjunto de colunas, para a precisão especificada.

Quociente

Devolve a parte fracionária dos valores em Conjunto de colunas, para a precisão especificada.

Resto

Devolve o resto dos valores em Conjunto de colunas.

RoundDigits

Devolve os valores no Conjunto de colunas, arredondados pela regra 4/5 para o número especificado de dígitos.

RoundDown

Devolve os valores no Conjunto de colunas, arredondados por defeito para o número especificado de dígitos.

RoundUp

Devolve os valores em Conjunto de colunas, arredondados para o número especificado de dígitos.

ToEven

Devolve os valores em Conjunto de colunas, arredondados para o número par e inteiro mais próximo.

ToOdd

Devolve os valores em Conjunto de colunas, arredondados para o número ímpar e inteiro mais próximo.

Truncar

Trunca os valores em Conjunto de colunas ao remover todos os dígitos não permitidos pela precisão especificada.

Funções matemáticas especiais

Esta categoria inclui funções matemáticas especializadas frequentemente utilizadas na ciência de dados. Salvo indicação em contrário, a função é unária e devolve o cálculo especificado para cada valor na coluna ou colunas selecionadas.

Beta

Devolve o valor da função beta de Euler.

EllipticIntegralE

Devolve o valor do integral elíptico incompleto.

EllipticIntegralK

Devolve o valor do integral elíptico completo (K).

Funcerro

Devolve o valor da função de erro.

A função de erro (também denominada função de erro Gauss) é uma função especial da forma sigmóide que é utilizada com probabilidade para descrever a difusão.

Erfc

Devolve o valor da função de erro complementar.

Erfc é definido como 1 – erf(x).

ErfScaled

Devolve o valor da função de erro dimensionado.

A versão dimensionada da função de erro pode ser utilizada para evitar o subfluxo aritmético.

ErfInverse

Devolve o valor da função inversa erf .

ExponentialIntegralEin

Devolve o valor do Ei integral exponencial.

Gama

Devolve o valor da função gama.

GamaLn

Devolve o logaritmo natural da função gama.

GammaRegularizedP

Devolve o valor da função gama incompleta regularizada.

Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

GammaRegularizedPInverse

Devolve o valor da função gama incompleta normalizada inversa.

Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

GammaRegularizedQ

Devolve o valor da função gama incompleta regularizada.

Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

GammaRegularizedQInverse

Devolve o valor da função gama incompleta generalizada inversa.

Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

PolyGamma

Devolve o valor da função polygamma.

Esta função utiliza um segundo argumento, que pode ser fornecido como uma constante ou uma coluna de valores.

Funções trigonométricas

Esta categoria inclui a maioria das importantes funções trigonométricas e trigonométricas inversas. Todas as funções trigonométricas são unárias e não requerem argumentos adicionais.

Acos

Calcula o arco de cosseno para os valores da coluna.

AcosDegree

Calcula o arco de cosseno dos valores da coluna, em graus.

Acosh

Calcula o arco de cosseno hiperbólico dos valores da coluna.

Acot

Calcula o arco de tangente dos valores da coluna.

AcotDegrees

Calcula o arco de tangente dos valores da coluna, em graus.

Autenticação

Calcula o arco de tangente hiperbólico dos valores da coluna.

Acsc

Calcula o arco de secante dos valores da coluna.

AcscDegrees

Calcula o arco de secante dos valores da coluna, em graus.

Asec

Calcula a arcsecante dos valores da coluna.

AsecDegrees

Calcula o arcocante dos valores da coluna, em graus.

Asech

Calcula a arcsecantecant hiperbólica dos valores da coluna.

Asin

Calcula o arco de seno dos valores da coluna.

AsinDegrees

Calcula o arco de seno dos valores da coluna, em graus.

Asinh

Calcula a arcsina hiperbólica para os valores da coluna.

Atan

Calcula o arco de tangente dos valores da coluna.

AtanDegrees

Calcula o arco de tangente dos valores da coluna, em graus.

Atanh

Calcula a arctangent hiperbólica dos valores da coluna.

Cos

Calcula o cosseno dos valores da coluna.

CosDegrees

Calcula o cosseno para os valores da coluna, em graus.

Cosh

Calcula o cosseno hiperbólico para os valores da coluna.

Cot

Calcula a cótula para os valores de coluna.

CotDegrees

Calcula a tangente para os valores da coluna, em graus.

Coth

Calcula a tangente hiperbólica para os valores da coluna.

Csc

Calcula a cossecante para os valores de coluna.

CscDegrees

Calcula a cossecante para os valores de coluna, em graus.

Csch

Calcula a cossecante hiperbólica para os valores da coluna.

DegreesToRadians

Converte graus em radianos.

Seg

Calcula a secante dos valores da coluna.

aSecDegrees

Calcula a secante para os valores da coluna, em graus.

aSech

Calcula a secante hiperbólica dos valores da coluna.

Assinar

Devolve o sinal dos valores da coluna.

Sin

Calcula o seno dos valores da coluna.

Sinc

Calcula o valor sine-cosine dos valores da coluna.

SinDegrees

Calcula o seno para os valores da coluna, em graus.

Sinh

Calcula o seno hiperbólico dos valores da coluna.

Tan

Calcula a tangente dos valores da coluna.

TanDegrees

Calcula a tangente para o argumento, em graus.

Tanh

Calcula a tangente hiperbólica dos valores da coluna.

Notas técnicas

Tenha cuidado quando selecionar mais do que uma coluna como o segundo operador. Os resultados são fáceis de entender se a operação é simples, como adicionar uma constante a todas as colunas.

Suponha que o conjunto de dados tem múltiplas colunas e que adiciona o conjunto de dados a si próprio. Nos resultados, cada coluna é adicionada a si mesma, da seguinte forma:

Num1 Num2 Num3 Adicionar(Num1_Num1) Adicionar(Num2_Num2) Adicionar(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

Se precisar de realizar cálculos mais complexos, pode encadear várias instâncias da Operação Aplicar Matemática. Por exemplo, pode adicionar duas colunas ao utilizar uma instância de Aplicar Operação Matemática e, em seguida, utilizar outra instância de Aplicar Operação Matemática para dividir a soma por uma constante para obter a média.

Em alternativa, utilize um dos seguintes componentes para efetuar todos os cálculos ao mesmo tempo, com o script SQL, R ou Python:

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.