수학 연산 적용

이 문서에서는 Azure Machine Learning 디자이너의 구성 요소에 대해 설명합니다.

수학 연산 적용을 사용하여 입력 데이터 세트의 숫자 열에 적용되는 계산을 만들 수 있습니다.

수학 연산에는 산술 함수, 삼각 함수, 반올림 함수 및 데이터 과학에 사용되는 감마 및 오류 함수와 같은 특수 함수가 포함됩니다.

연산을 정의하고 파이프라인을 실행한 후에는 값이 데이터 세트에 추가됩니다. 구성 요소를 구성하는 방법에 따라 다음을 수행할 수 있습니다.

  • 결과를 데이터 세트에 추가합니다(작업의 결과를 확인하는 경우에 유용).
  • 열 값을 새로 계산된 값으로 바꿉니다.
  • 결과의 새 열을 생성하고 원래 데이터를 표시하지 않습니다.

다음 범주에서 필요한 연산을 찾습니다.

  • 기본

    기본 범주의 함수는 단일 값 또는 값 열을 조작하는 데 사용할 수 있습니다. 예를 들어 열에 있는 모든 숫자의 절댓값을 가져오거나 열에서 각 값의 제곱근을 계산할 수 있습니다.

  • 비교

    비교 범주의 함수는 모두 비교에 사용됩니다. 두 열의 값을 쌍으로 비교하거나 열의 각 값을 지정된 상수와 비교할 수 있습니다. 예를 들어 열을 비교하여 두 데이터 세트의 값이 동일한지 여부를 확인할 수 있습니다. 또는 허용되는 최댓값과 같은 상수를 사용하여 숫자 열에서 이상값을 찾을 수 있습니다.

  • 작업

    연산 범주에는 더하기, 빼기, 곱하기 및 나누기 같은 기본 수학 함수가 포함됩니다. 열 또는 상수로 작업할 수 있습니다. 예를 들어 열 A의 값을 열 B의 값에 더할 수 있습니다. 또는 이전에 계산된 평균과 같은 상수를 열 A의 각 값에서 뺄 수도 있습니다.

  • 반올림

    반올림 범주에는 반올림, 최댓값, 최솟값, 다양한 정밀도 수준으로 자르기 등 연산을 수행하기 위한 다양한 함수가 포함됩니다. 10진수와 정수 모두에 정밀도 수준을 지정할 수 있습니다.

  • 특수

    특수 범주에는 타원 정수 및 가우스 오류 함수와 같이 특히 데이터 과학에 사용되는 수학 함수가 포함됩니다.

  • 삼각

    삼각 범주에는 모든 표준 삼각 함수가 포함됩니다. 예를 들어 라디안을 각도로 변환하거나 라디안 또는 각도의 탄젠트와 같은 함수를 계산할 수 있습니다. 이러한 함수는 단항이며 값의 단일 열을 입력으로 사용하고, 삼각 함수를 적용하며, 값 열을 결과로 반환합니다. 입력 열이 적절한 형식이고 지정된 연산에 대한 올바른 값 형식을 포함하는지 확인합니다.

수학 연산 적용을 구성하는 방법

수학 연산 적용 구성 요소에는 숫자만 있는 열이 하나 이상 포함된 데이터 세트가 필요합니다. 숫자는 불연속적이거나 연속적일 수 있지만 문자열이 아니라 숫자 데이터 형식이어야 합니다.

동일한 연산을 여러 숫자 열에 적용할 수 있지만 모든 열이 동일한 데이터 세트에 있어야 합니다.

이 구성 요소의 각 인스턴스는 한 번에 하나의 연산 형식만 수행할 수 있습니다. 복잡한 수학 연산을 수행하려면 수학 연산 적용 구성 요소의 여러 인스턴스를 연결해야 할 수 있습니다.

  1. 파이프라인에 수학 연산 적용 구성 요소를 추가합니다.

  2. 하나 이상의 숫자 열이 있는 데이터 세트를 연결합니다.

  3. 계산을 수행할 원본 열을 하나 이상 선택합니다.

    • 선택하는 모든 열은 숫자 데이터 형식이어야 합니다.
    • 데이터 범위는 선택한 수학 연산에 대해 유효해야 합니다. 그렇지 않으면 오류 또는 NaN(숫자 아님) 결과가 발생할 수 있습니다. 예를 들어 Ln(-1.0)은 잘못된 연산이며 값이 NaN로 반환됩니다.
  4. 범주를 선택하여 수행할 수학 연산 형식을 선택합니다.

  5. 해당 범주의 목록에서 특정 연산을 선택합니다.

  6. 각 연산 형식에 필요한 추가 매개 변수를 설정합니다.

  7. 출력 모드 옵션을 사용하여 수학 연산이 생성되는 방식을 지정할 수 있습니다.

    • Append. 입력으로 사용되는 모든 열이 출력 데이터 세트에 포함되고 수학 연산의 결과를 포함하는 하나의 추가 열이 추가됩니다.
    • Inplace. 입력으로 사용된 열의 값은 새롭게 계산된 값으로 대체됩니다.
    • ResultOnly. 수학 연산의 결과를 포함하는 단일 열이 반환됩니다.
  8. 파이프라인을 제출합니다.

결과

Append 또는 ResultOnly 옵션을 사용하여 결과를 생성하는 경우 반환된 데이터 세트의 열 제목은 연산과 그 연산이 사용된 열을 표시합니다. 예를 들어 Equals 연산자를 사용하여 두 열을 비교하는 경우 결과는 다음과 같습니다.

  • Equals(Col2_Col1)는 Col2를 Col1에 테스트했음을 나타냅니다.
  • Equals(Col2_$10) 는 열 2를 상수 10과 비교했음을 나타냅니다.

In place 옵션을 사용하는 경우에도 원본 데이터는 삭제되거나 변경되지 않습니다. 원본 데이터 세트의 열은 디자이너에서 계속 사용할 수 있습니다. 원본 데이터를 보려면 열 추가 구성 요소를 연결하고 수학 연산 적용의 출력에 조인하세요.

기본 수학 연산

기본 범주의 함수는 일반적으로 열에서 단일 값을 사용하여 미리 정의된 연산을 수행하고 단일 값을 반환합니다. 일부 함수의 경우 상수 또는 열 집합을 두 번째 인수로 지정할 수 있습니다.

Azure Machine Learning은 기본 범주에서 다음 함수를 지원합니다.

Abs

선택된 열의 절댓값을 반환합니다.

Atan2

4사분면 역탄젠트를 반환합니다.

점 좌표가 포함된 열을 선택합니다. x 좌표에 해당하는 두 번째 인수에 상수를 지정할 수도 있습니다.

MATLAB의 ATAN2 함수에 해당합니다.

Conj

선택한 열에 있는 값에 대해 켤레 복소수를 반환합니다.

CubeRoot

선택한 열에 있는 값의 세제곱근을 계산합니다.

DoubleFactorial

선택한 열에 있는 값의 이중 계승 값을 계산합니다. 이중 계승값은 일반 계승 함수의 확장이며 x!!로 표시됩니다.

Eps

현재 값과 다음으로 높은 배정밀도 값 사이의 크기 차이를 반환합니다. MATLAB의 EPS 함수에 해당합니다.

Exp

선택된 열에서 값의 거듭제곱을 e로 반환합니다. 이 함수는 Excel EXP 함수와 동일합니다.

Exp2

인수의 밑이 2인 지수를 반환하고 y = x * 2t를 해결합니다. 여기서 t는 지수를 포함하는 값의 열입니다.

열 집합에서 지수 값 t가 포함된 열을 선택합니다.

Exp2의 경우 두 번째 인수 x(상수 또는 값의 다른 열)를 지정할 수 있습니다. 두 번째 인수 형식에서 승수 x를 상수로 제공할지 또는 열의 값을 제공할지를 나타냅니다.

예를 들어 승수와 지수 모두의 값이 {0,1,2,3,4,5}인 열을 선택하는 경우 함수는{0, 2, 8, 24, 64 160)을 반환합니다.

ExpMinus1

선택한 열에 있는 값의 음의 지수를 반환합니다.

계승

선택한 열에 있는 값의 계승을 반환합니다.

빗변

한 변의 길이가 값의 열로 지정되고 두 번째 변의 길이가 상수 또는 두 개의 열로 지정된 삼각형의 빗변을 계산합니다.

Ln

선택한 열에 있는 값의 자연 로그를 반환합니다.

LnPlus1

선택한 열에 있는 값에 대한 자연 로그에 1을 더한 값을 반환합니다.

로그

지정된 밑을 사용하여 선택한 열에 있는 값의 로그를 반환합니다.

베이스(두 번째 인수)를 상수로 지정하거나 다른 값의 열을 선택하여 지정할 수 있습니다.

Log10

선택한 열에 대한 밑이 10인 로그 값을 반환합니다.

Log2

선택한 열에 대한 밑이 2인 로그 값을 반환합니다.

NthRoot

지정한 n을 사용하여 값의 n번째 루트를 반환합니다.

ColumnSet 옵션을 사용하여 루트를 계산하려는 열을 선택합니다.

두 번째 인수 형식에서 루트가 있는 다른 열을 선택하거나 루트로 사용할 상수를 지정합니다.

두 번째 인수가 열이면 열의 각 값이 해당 행의 n의 값으로 사용됩니다. 두 번째 인수가 상수이면 두 번째 인수 텍스트 상자에 n의 값을 입력합니다.

Pow

선택한 열에 있는 각 값에 대해 Y의 거듭제곱으로 제곱한 X를 계산합니다.

먼저 부동이어야 하는 베이스가 포함된 열을 ColumnSet 옵션으로 선택합니다.

두 번째 인수 형식에서 지수를 포함하는 열을 선택하거나 지수로 사용할 상수를 지정합니다.

두 번째 인수가 열이면, 이 열의 각 값을 해당 행의 지수로 사용합니다. 두 번째 인수가 상수이면 두 번째 인수 텍스트 상자에 지수의 값을 입력합니다.

Sqrt

선택한 열에 있는 값의 제곱근을 반환합니다.

SqrtPi

선택한 열의 각 값에 pi를 곱한 다음 결과의 제곱근을 반환합니다.

Square

선택한 열의 값을 제곱합니다.

비교 연산

두 값 집합을 서로 테스트해야 할 때는 언제든지 Azure Machine Learning 디자이너에서 비교 함수를 사용하세요. 예를 들어 파이프라인에서 다음과 같은 비교 연산을 수행해야 할 수 있습니다.

  • 임계값에 대한 가능성 점수 모델의 열을 평가합니다.
  • 두 결과 집합이 동일한지 여부를 확인합니다. 다른 각 행에 대해 추가 처리 또는 필터링에 사용할 수 있는 FALSE 플래그를 추가합니다.

EqualTo

값이 같으면 True를 반환합니다.

GreaterThan

열 집합의 값이 지정된 상수보다 크거나 비교 열의 해당 값보다 크면 True를 반환합니다.

GreaterThanOrEqualTo

열 집합의 값이 지정된 상수보다 크거나 같으면, 혹은 비교 열의 상응하는 값과 크거나 같으면 True를 반환합니다.

LessThan

열 집합 의 값이 지정된 상수보다 작거나 비교 열의 해당 값보다 작은 경우 True를 반환합니다.

LessThanOrEqualTo

열 집합 의 값이 지정된 상수보다 작거나 같으면, 또는 비교 열의 해당 값보다 작거나 같으면 True를 반환합니다.

NotEqualTo

열 집합의 값이 상수 또는 비교 열과 다르면 True를 반환하고, 동일하면 False를 반환합니다.

PairMax

열 집합의 값과 상수 또는 비교 열의 값 중 더 큰 값을 반환합니다.

PairMin

열 집합의 값이나 상수 또는 비교 열의 값 중 더 작은 값을 반환합니다.

산술 연산

더하기와 빼기, 나누기와 곱하기와 같은 기본 산술 연산을 포함합니다. 대부분의 연산은 이진이며 두 개의 숫자가 필요하므로 먼저 연산을 선택한 다음 첫 번째와 두 번째 인수에 사용할 열을 하나 이상 선택합니다.

나누기와 빼기의 순서는 다음과 같습니다.

  • Subtract(Arg1_Arg2) = Arg1 - Arg 2
  • Divide(Arg1_Arg2) = Arg1 / Arg 2

다음 표에서 몇 가지 예시를 설명합니다

작업 Num1 Num2 결과 열 결과 값
더하기 1 5 Add(Num2_Num1) 6
곱하기 1 5 Multiple(Num2_Num1) 5
빼기 5 1 Subtract(Num2_Num1) 4
빼기 0 1 Subtract(Num2_Num1) -1
사업부 5 1 Divide(Num2_Num1) 5
사업부 1 0 Divide(Num2_Num1) Infinity

추가

열 집합을 사용하여 원본 열을 지정한 다음 두 번째 인수에 지정된 숫자를 해당 값에 더합니다.

두 열의 값을 더하려면 열 집합을 사용하여 하나 이상의 열을 선택한 다음 두 번째 인수를 사용하여 두 번째 열을 선택합니다.

나누기

열 집합의 값을 두 번째 인수에 정의된 상수 또는 열 값으로 나눕니다. 즉, 먼저 제수를 선택한 다음 피제수를 선택합니다. 출력 값은 몫입니다.

곱하기

열 집합의 값을 지정된 상수 또는 열 값으로 곱합니다.

빼기

연산할 값 (피감수)의 열을 열 집합 옵션을 사용하여 다른 열을 선택해 지정합니다. 그런 다음 뺄 숫자인 감수두 번째 인수 드롭다운 목록을 사용하여 지정합니다. 상수 또는 값의 열을 선택할 수 있습니다.

반올림 연산

Azure Machine Learning 디자이너는 다양한 반올림 연산을 지원합니다. 많은 연산은 반올림할 때 사용할 정밀도를 지정해야 합니다. 상수로 지정된 정적 정밀도 수준을 사용하거나 값의 열에서 얻은 동적 정밀도 값을 적용할 수 있습니다.

  • 상수를 사용하는 경우 정밀도 형식상수로 설정하고 상수 정밀도 텍스트 상자에 자릿수를 정수로 입력합니다. 정수가 아닌 숫자를 입력하는 경우 구성 요소에서 오류가 발생하지는 않지만 예기치 않은 결과가 나올 수 있습니다.

  • 데이터 세트의 각 행에 대해 다른 정밀도 값을 사용하려면 정밀도 형식ColumnSet로 설정하고 적절한 정밀도 값을 포함하는 열을 선택합니다.

Ceiling

열 집합에 있는 값의 최대값을 반환합니다.

CeilingPower2

열 집합에 있는 값의 최대값을 제곱하여 반환합니다.

Floor

열 집합에 있는 값의 최소값을 지정된 정밀도로 반환합니다.

Mod

열 집합에 있는 값의 소수 부분을 지정된 정밀도로 반환합니다.

열 집합에 있는 값의 소수 부분을 지정된 정밀도로 반환합니다.

나머지

열 집합에 있는 값의 나머지를 반환합니다.

RoundDigits

열 집합의 값을 4/5 규칙을 통해 지정된 자릿수로 반올림하여 반환합니다.

RoundDown

열 집합의 값을 지정된 자릿수로 반내림하여 반환합니다.

RoundUp

열 집합의 값을 지정된 자릿수로 반올림하여 반환합니다.

ToEven

열 집합의 값을 근사치 짝수 정수로 반올림하여 반환합니다.

ToOdd

열 집합의 값을 근사치 홀수 정수로 반올림하여 반환합니다.

Truncate

지정된 정밀도로 허용되지 않는 모든 자릿수를 제거하여 열 집합의 값을 자릅니다.

특수 수학 함수

이 범주에는 데이터 과학에 자주 사용되는 특수한 수학 함수가 포함됩니다. 별도로 언급하지 않는 한 함수는 단항이며 선택한 열 또는 열의 각 값에 대해 지정된 계산을 반환합니다.

베타

오일러 베타 함수 값을 반환합니다.

EllipticIntegralE

불완전 타원 정수 값을 반환합니다.

EllipticIntegralK

완전한 타원 적분(K)의 값을 반환합니다.

Erf

오차 함수의 값을 반환합니다.

오차 함수(가우스 오차 함수라고도 함)는 확률에서 확산을 설명하기 위해 사용하는 시그모이드 셰이프의 특수 함수입니다.

Erfc

보상 오차 함수의 값을 반환합니다.

Erfc은 1 – erf(x)로 정의됩니다.

ErfScaled

축척 오차 함수의 값을 반환합니다.

산술 연산 언더플로를 방지하기 위해 축척 버전의 오차 함수를 사용할 수 있습니다.

ErfInverse

erf 함수의 값을 반환합니다.

ExponentialIntegralEin

지수 정수 Ei의 값을 반환합니다.

감마

감마 함수의 값을 반환합니다.

GammaLn

감마 함수의 자연 로그를 반환합니다.

GammaRegularizedP

정규화된 불완전 감마 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

GammaRegularizedPInverse

역으로 정규화된 불완전 감마 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

GammaRegularizedQ

정규화된 불완전 감마 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

GammaRegularizedQInverse

역으로 일반화된 정규적인 불완전 감마 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

PolyGamma

폴리감마 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

삼각 함수

이 범주에는 대부분의 중요한 삼각 함수와 역삼각 함수가 포함됩니다. 모든 삼각 함수는 단항이며 추가 인수가 필요하지 않습니다.

Acos

열 값의 아크코사인을 계산합니다.

AcosDegree

열 값의 아크코사인을 각도로 계산합니다.

Acosh

열 값의 쌍곡 아크코사인을 계산합니다.

Acot

열 값의 아크코탄젠트를 계산합니다.

AcotDegrees

열 값의 아크코탄젠트를 각도로 계산합니다.

ACOTH

열 값의 쌍곡 아크코탄젠트를 계산합니다.

Acsc

열 값의 아크코시컨트를 계산합니다.

AcscDegrees

열 값의 아크코시컨트를 각도로 계산합니다.

Asec

열 값의 아크시컨트를 계산합니다.

AsecDegrees

열 값의 아크시컨트를 각도로 계산합니다.

Asech

열 값의 쌍곡 아크시컨트를 계산합니다.

Asin

열 값의 아크사인을 계산합니다.

AsinDegrees

열 값의 아크사인을 각도로 계산합니다.

Asinh

열 값의 쌍곡 아크사인을 계산합니다.

Atan

열 값의 아크탄젠트를 계산합니다.

AtanDegrees

열 값의 아크탄젠트를 각도로 계산합니다.

Atanh

열 값의 쌍곡 아크탄젠트를 계산합니다.

Cos

열 값의 코사인을 계산합니다.

CosDegrees

열 값의 코사인을 각도로 계산합니다.

Cosh

열 값의 쌍곡 코사인을 계산합니다.

Cot

열 값의 코탄젠트를 계산합니다.

CotDegrees

열 값의 코탄젠트를 각도로 계산합니다.

Coth

열 값의 쌍곡 코탄젠트를 계산합니다.

Csc

열 값의 코시컨트를 계산합니다.

CscDegrees

열 값의 코시컨트를 각도로 계산합니다.

Csch

열 값의 쌍곡 코시컨트를 계산합니다.

DegreesToRadians

도를 라디안으로 변환합니다.

Sec

열 값의 시컨트를 계산합니다.

aSecDegrees

열 값의 시컨트를 각도로 계산합니다.

aSech

열 값의 쌍곡 시컨트를 계산합니다.

Sign

열 값의 부호를 반환합니다.

Sin

열 값의 사인을 계산합니다.

Sinc

열 값의 사인 코사인 값을 계산합니다.

SinDegrees

열 값의 사인을 각도로 계산합니다.

Sinh

열 값의 쌍곡 사인을 계산합니다.

Tan

열 값의 탄젠트를 계산합니다.

TanDegrees

인수의 탄젠트를 각도로 계산합니다.

Tanh

열 값의 쌍곡 탄젠트를 계산합니다.

기술 정보

두 개 이상의 열을 두 번째 연산자로 선택하는 경우에는 주의하세요. 모든 열에 상수를 추가하는 등의 간단한 작업은 결과를 쉽게 이해할 수 있습니다.

데이터 세트에 여러 열이 있고 데이터 세트를 그 자체에 추가한다고 가정합니다. 결과에서 각 열은 다음과 같이 열 자체에 추가됩니다.

Num1 Num2 Num3 Add(Num1_Num1) Add(Num2_Num2) Add(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

더 복잡한 계산을 수행해야 하는 경우 수학 연산 적용의 여러 인스턴스를 연결할 수 있습니다. 예를 들어 한 수치 연산 적용 인스턴스를 사용하여 두 개의 열을 추가한 후 다른 수치 연산 적용 인스턴스를 사용하여 상수로 합계를 나누어 평균을 계산합니다.

또는 SQL, R 또는 Python 스크립트를 사용하여 다음 구성 요소 중 하나를 사용하여 모든 계산을 한 번에 수행할 수 있습니다.

다음 단계

Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.