다음을 통해 공유


수학 연산 적용

이 문서에서는 Azure Machine Learning 디자이너의 구성 요소에 대해 설명합니다.

수학 적용 연산을 사용하여 입력 데이터 세트의 숫자 열에 적용되는 계산을 만듭니다.

수학 연산에는 산술 함수, 삼각 함수, 반올림 함수 및 감마 및 오류 함수와 같은 데이터 과학에 사용되는 특수 함수가 포함됩니다.

작업을 정의하고 파이프라인을 실행하면 값이 데이터 세트에 추가됩니다. 구성 요소를 구성하는 방법에 따라 다음을 수행할 수 있습니다.

  • 결과를 데이터 세트에 추가합니다(작업의 결과를 확인하는 경우에 유용).
  • 열 값을 계산된 새 값으로 바꿉니다.
  • 결과의 새 열을 생성하고 원래 데이터를 표시하지 않습니다.

다음 범주에서 필요한 작업을 찾습니다.

  • 기본

    기본 범주의 함수를 사용하여 값의 단일 값 또는 열을 조작할 수 있습니다. 예를 들어 열에 있는 모든 숫자의 절대값을 얻거나 열에 있는 각 값의 제곱근을 계산할 수 있습니다.

  • 비교

    비교 범주의 함수는 모두 비교에 사용됩니다. 두 열의 값을 쌍으로 비교하거나 열의 각 값을 지정된 상수와 비교할 수 있습니다. 예를 들어 열을 비교하여 두 데이터 세트의 값이 동일한지 여부를 확인할 수 있습니다. 또는 최대 허용 값과 같은 상수를 사용하여 숫자 열에서 이상값을 찾을 수 있습니다.

  • 작업

    연산 범주에는 추가, 빼기, 곱하기 및 나누기 등의 기본 수학 함수가 포함됩니다. 열 또는 상수로 작업할 수 있습니다. 예를 들어 열 A의 값을 열 B의 값에 추가할 수 있습니다. 또는 이전에 계산된 평균과 같은 상수는 열 A의 각 값에서 뺄 수 있습니다.

  • 반올림

    반올림 범주에는 반올림, 천장, 바닥 및 잘림과 같은 작업을 다양한 정밀도 수준으로 수행하기 위한 다양한 함수가 포함됩니다. 소수와 정수 모두에 대한 전체 자릿수 수준을 지정할 수 있습니다.

  • 특수

    특수 범주에는 타원 정수 및 가우스 오차 함수와 같이 데이터 과학에 특히 사용되는 수학 함수가 포함됩니다.

  • 삼각

    삼각 범주에는 모든 표준 삼각 함수가 포함됩니다. 예를 들어 라디안을 도로 변환하거나 라디안 또는 도에서 탄젠트 같은 함수를 계산할 수 있습니다. 이러한 함수는 단항 함수입니다. 즉, 단일 값 열을 입력으로 사용하고, 삼각 함수를 적용하고, 값 열을 결과로 반환합니다. 입력 열이 적절한 형식이고 지정된 작업에 대한 올바른 형식의 값을 포함하는지 확인합니다.

수학 연산 적용을 구성하는 방법

수학 연산 적용 구성 요소에는 숫자만 있는 열이 하나 이상 포함된 데이터 세트가 필요합니다. 숫자는 불연속적이거나 연속적일 수 있지만 문자열이 아닌 숫자 데이터 형식이어야 합니다.

동일한 연산을 여러 숫자 열에 적용할 수 있지만 모든 열이 동일한 데이터 세트에 있어야 합니다.

이 구성 요소의 각 인스턴스는 한 번에 하나의 연산 형식만 수행할 수 있습니다. 복잡한 수학 연산을 수행하려면 수학 연산 적용 구성 요소의 여러 인스턴스를 연결해야 할 수 있습니다.

  1. 파이프라인에 수학 연산 적용 구성 요소를 추가합니다.

  2. 하나 이상의 숫자 열이 포함된 데이터 세트를 연결합니다.

  3. 계산을 수행할 원본 열을 하나 이상 선택합니다.

    • 선택하는 모든 열은 숫자 데이터 형식이어야 합니다.
    • 데이터 범위는 선택한 수학 연산에 유효해야 합니다. 그렇지 않으면 오류 또는 NaN(숫자가 아님) 결과가 발생할 수 있습니다. 예를 들어 Ln(-1.0)은 잘못된 작업이며 값 NaN이 입니다.
  4. 범주를 선택하여 수행할 수학 연산 유형을 선택합니다.

  5. 해당 범주의 목록에서 특정 작업을 선택합니다.

  6. 각 연산 형식에 필요한 추가 매개 변수를 설정합니다.

  7. 출력 모드 옵션을 사용하여 수학 연산을 생성하는 방법을 나타냅니다.

    • Append. 입력으로 사용되는 모든 열은 출력 데이터 세트에 포함되며 수학 연산 결과를 포함하는 하나의 추가 열이 추가됩니다.
    • Inplace. 입력으로 사용된 열의 값은 새롭게 계산된 값으로 대체됩니다.
    • ResultOnly. 수학 연산의 결과를 포함하는 단일 열이 반환됩니다.
  8. 파이프라인을 제출합니다.

결과

Append 또는 ResultOnly 옵션을 사용하여 결과를 생성하는 경우 반환된 데이터 세트의 열 머리글은 작업 및 사용된 열을 나타냅니다. 예를 들어 Equals 연산자를 사용하여 두 열을 비교하면 결과는 다음과 같습니다.

  • Equals(Col2_Col1)는 Col2를 Col1에 테스트했음을 나타냅니다.
  • Equals(Col2_$10)는 열 2를 상수 10과 비교했음을 나타냅니다.

In place 옵션을 사용하는 경우에도 원본 데이터는 삭제되거나 변경되지 않습니다. 원본 데이터 세트의 열은 디자이너에서 계속 사용할 수 있습니다. 원본 데이터를 보려면 열 추가 구성 요소를 연결하고 수학 연산 적용의 출력에 조인하세요.

기본 수학 연산

기본 범주의 함수는 일반적으로 열에서 단일 값을 사용하여 미리 정의된 연산을 수행하고 단일 값을 반환합니다. 일부 함수의 경우 상수 또는 열 집합을 두 번째 인수로 지정할 수 있습니다.

Azure Machine Learning은 기본 범주에서 다음 함수를 지원합니다.

Abs

선택한 열의 절대값을 반환합니다.

Atan2

네 개의 사분면 역 탄젠트를 반환합니다.

점 좌표가 포함된 열을 선택합니다. x 좌표에 해당하는 두 번째 인수에 상수를 지정할 수도 있습니다.

MATLAB의 ATAN2 함수에 해당합니다.

Conj

선택한 열의 값에 대한 conjugate를 반환합니다.

CubeRoot

선택한 열의 값에 대한 큐브 루트를 계산합니다.

DoubleFactorial

선택한 열의 값에 대한 이중 요소를 계산합니다. double 팩터리얼은 일반 팩터리 함수의 확장이며 x!!.

Eps

현재 값과 다음으로 높은 배정밀도 숫자 사이의 간격 크기를 반환합니다. MATLAB의 EPS 함수에 해당합니다.

Exp

선택한 열에 있는 값의 힘까지 e를 반환합니다. 이 함수는 Excel EXP 함수와 동일합니다.

Exp2

인수의 base-2 지수를 반환하며, 여기서 t는 지수를 포함하는 값의 열인 y = x * 2t 에 대해 해결합니다.

열 집합에서 지수 값 t가 포함된 열을 선택합니다.

Exp2의 경우 상수 또는 값의 다른 열일 수 있는 두 번째 인수 x를 지정할 수 있습니다. 두 번째 인수 형식에서 승수 x를 상수로 제공할지 아니면 열의 값을 제공할지 여부를 나타냅니다.

예를 들어 승수와 지수에 대한 값 {0,1,2,3,4,5} 이 있는 열을 선택하면 함수는 {0, 2, 8, 24, 64 160을 반환합니다.

ExpMinus1

선택한 열에 있는 값의 음의 지수를 반환합니다.

계승

선택한 열에 있는 값의 계승을 반환합니다.

빗변

한 변의 길이가 값의 열로 지정되고 두 번째 변의 길이가 상수 또는 두 개의 열로 지정된 삼각형의 빗변을 계산합니다.

Ln

선택한 열의 값에 대한 자연 로그를 반환합니다.

LnPlus1

선택한 열에 있는 값에 대한 자연 로그에 1을 더한 값을 반환합니다.

로그

지정된 기준이 지정된 경우 선택한 열에 있는 값의 로그를 반환합니다.

기본(두 번째 인수)을 상수로 지정하거나 값의 다른 열을 선택하여 지정할 수 있습니다.

Log10

선택한 열의 기본 10 로그 값을 반환합니다.

Log2

선택한 열의 기본 2 로그 값을 반환합니다.

NthRoot

지정한 n을 사용하여 값의 n번째 루트를 반환합니다.

ColumnSet 옵션을 사용하여 루트를 계산할 열을 선택합니다.

두 번째 인수 형식에서 루트가 포함된 다른 열을 선택하거나 루트로 사용할 상수를 지정합니다.

두 번째 인수가 열인 경우 열의 각 값은 해당 행의 n 값으로 사용됩니다. 두 번째 인수가 상수이면 두 번째 인수 텍스트 상자에 n 값을 입력합니다.

Pow

선택한 열의 각 값에 대해 Y의 성능으로 높아진 X를 계산합니다.

먼저 부동이어야 하는 베이스가 포함된 열을 ColumnSet 옵션으로 선택합니다.

두 번째 인수 형식에서 지수를 포함하는 열을 선택하거나 지수로 사용할 상수를 지정합니다.

두 번째 인수가 열이면 열의 각 값이 해당 행의 지수로 사용됩니다. 두 번째 인수가 상수이면 두 번째 인수 텍스트 상자에 지수의 값을 입력합니다.

Sqrt

선택한 열에 있는 값의 제곱근을 반환합니다.

SqrtPi

선택한 열의 각 값에 대해 값을 pi로 곱한 다음 결과의 제곱근을 반환합니다.

Square

선택한 열의 값을 제곱합니다.

비교 작업

두 값 집합을 서로 테스트해야 하는 경우 언제든지 Azure Machine Learning 디자이너에서 비교 함수를 사용합니다. 예를 들어 파이프라인에서 다음 비교 작업을 수행해야 할 수 있습니다.

  • 임계값에 대해 확률 점수 모델의 열을 평가합니다.
  • 두 결과 집합이 동일한지 여부를 확인합니다. 다른 각 행에 대해 추가 처리 또는 필터링에 사용할 수 있는 FALSE 플래그를 추가합니다.

EqualTo

값이 같으면 True를 반환합니다.

GreaterThan

열 집합의 값이 지정된 상수보다 크거나 비교 열의 해당 값보다 크면 True를 반환합니다.

GreaterThanOrEqualTo

열 집합의 값이 지정된 상수보다 크거나 같으면, 혹은 비교 열의 상응하는 값과 크거나 같으면 True를 반환합니다.

LessThan

열 집합의 값이 지정된 상수보다 작거나 비교 열의 해당 값보다 작으면 True를 반환합니다.

LessThanOrEqualTo

열 집합의 값이 지정된 상수보다 작거나 같거나 비교 열의 해당 값보다 작거나 같으면 True를 반환합니다.

NotEqualTo

열 집합의 값이 상수 또는 비교 열과 같지 않으면 True를 반환하고, 값이 같으면 False를 반환합니다.

PairMax

더 큰 값(열 집합의 값 또는 상수 또는 비교 열의 값)을 반환합니다.

PairMin

열 집합의 값 또는 상수 또는 비교 열의 값 중 더 작은 값을 반환합니다.

산술 연산

추가 및 빼기, 나누기 및 곱하기 등의 기본 산술 연산을 포함합니다. 대부분의 작업은 두 개의 숫자가 필요한 이진 작업이기 때문에 먼저 작업을 선택한 다음 첫 번째 및 두 번째 인수에서 사용할 열 또는 숫자를 선택합니다.

나누기 및 빼기 순서는 다음과 같습니다.

  • Subtract(Arg1_Arg2) = Arg1 - Arg 2
  • Divide(Arg1_Arg2) = Arg1 / Arg 2

다음 표에서 몇 가지 예시를 설명합니다

연산 Num1 Num2 결과 열 결과 값
더하기 1 5 Add(Num2_Num1) 6
곱하기 1 5 Multiple(Num2_Num1) 5
빼기 5 1 Subtract(Num2_Num1) 4
빼기 0 1 Subtract(Num2_Num1) -1
나누기 5 1 Divide(Num2_Num1) 5
나누기 1 0 Divide(Num2_Num1) Infinity(무한)

추가

열 집합을 사용하여 원본 열을 지정한 다음 두 번째 인수에 지정된 숫자를 해당 값에 추가합니다.

두 열에 값을 추가하려면 열 집합을 사용하여 열 또는 열을 선택한 다음 두 번째 인수를 사용하여 두 번째 열을 선택합니다.

Divide

열 집합의 값을 상수 또는 두 번째 인수정의된 열 값으로 나눕니다. 즉, 먼저 제수를 선택한 다음 피제수를 선택합니다. 출력 값은 몫입니다.

곱하기

열 집합의 값을 지정된 상수 또는 열 값으로 곱합니다.

빼기

연산할 값 (피감수)의 열을 열 집합 옵션을 사용하여 다른 열을 선택해 지정합니다. 그런 다음 뺄 숫자인 감수두 번째 인수 드롭다운 목록을 사용하여 지정합니다. 값의 상수 또는 열을 선택할 수 있습니다.

반올림 연산

Azure Machine Learning 디자이너는 다양한 반올림 작업을 지원합니다. 많은 연산은 반올림할 때 사용할 정밀도를 지정해야 합니다. 상수로 지정된 정적 정밀도 수준을 사용하거나 값 열에서 가져온 동적 정밀도 값을 적용할 수 있습니다.

  • 상수를 사용하는 경우 정밀도 형식상수로 설정하고 상수 정밀도 텍스트 상자에 자릿수를 정수로 입력합니다. 정수가 아닌 숫자를 입력하는 경우 구성 요소에서 오류가 발생하지는 않지만 예기치 않은 결과가 나올 수 있습니다.

  • 데이터 세트의 각 행에 대해 다른 정밀도 값을 사용하려면 정밀도 형식ColumnSet로 설정하고 적절한 정밀도 값을 포함하는 열을 선택합니다.

Ceiling

열 집합의 값에 대한 최대값을 반환합니다.

CeilingPower2

열 집합의 값에 대한 제곱된 천장을 반환합니다.

열 집합의 값에 대한 층을 지정된 전체 자릿수로 반환합니다.

Mod

열 집합에 있는 값의 소수 부분을 지정된 전체 자릿수로 반환합니다.

열 집합에 있는 값의 소수 부분을 지정된 전체 자릿수로 반환합니다.

나머지

열 집합의 값에 대한 나머지를 반환합니다.

RoundDigits

4/5 규칙으로 반올림된 열 집합의 값을 지정된 숫자 수로 반환합니다.

RoundDown

열 집합값을 지정된 숫자 수로 반올림하여 반환합니다.

RoundUp

지정된 숫자 수로 반올림된 열 집합의 값을 반환합니다.

ToEven

가장 가까운 정수( 짝수)로 반올림된 열 집합의 값을 반환합니다.

ToOdd

가장 가까운 정수 홀수로 반올림된 열 집합의 값을 반환합니다.

Truncate

지정된 전체 자릿수에서 허용되지 않는 모든 숫자를 제거하여 열 집합 의 값을 자립니다.

특수 수학 함수

이 범주에는 데이터 과학에 자주 사용되는 특수한 수학 함수가 포함됩니다. 달리 명시되지 않는 한 함수는 단항이며 선택한 열 또는 열의 각 값에 대해 지정된 계산을 반환합니다.

베타

Euler의 베타 함수 값을 반환합니다.

EllipticIntegrale

불완전 타원 정수 값을 반환합니다.

EllipticIntegralK

전체 타원 정수 계열(K)의 값을 반환합니다.

Erf

오류 함수의 값을 반환합니다.

오차 함수(Gauss 오류 함수라고도 함)는 확산을 설명하기 위해 확률에 사용되는 시그모이드 셰이프의 특수 함수입니다.

Erfc

보완 오류 함수의 값을 반환합니다.

Erfc은 1 – erf(x)로 정의됩니다.

ErfScaled

크기 조정된 오류 함수의 값을 반환합니다.

크기가 조정된 버전의 오류 함수를 사용하여 산술 언더플로를 방지할 수 있습니다.

ErfInverse

erf 함수의 값을 반환합니다.

ExponentialIntegralEin

지수 정수 계열 Ei의 값을 반환합니다.

감마

감마 함수의 값을 반환합니다.

GammaLn

감마 함수의 자연 로그를 반환합니다.

GammaRegularizedP

정규화된 불완전 감마 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

GammaRegularizedPInverse

역 정규화된 불완전 감마 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

GammaRegularizedQ

정규화된 불완전 감마 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

GammaRegularizedQInverse

역 일반화된 정규화된 불완전한 감마 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

PolyGamma

일부다처제 함수의 값을 반환합니다.

이 함수는 상수 또는 값의 열로 제공될 수 있는 두 번째 인수를 사용합니다.

삼각 함수

이 범주는 중요한 삼각 및 역 삼각 함수의 대부분을 iIncludes합니다. 모든 삼각 함수는 단항 함수이며 추가 인수가 필요하지 않습니다.

Acos

열 값의 아크코사인을 계산합니다.

AcosDegree

열 값의 아크코사인을 도 단위로 계산합니다.

Acosh

열 값의 쌍곡 아크코사인을 계산합니다.

Acot

열 값의 아크코탄젠트를 계산합니다.

AcotDegrees

열 값의 아크코탄젠트를 도 단위로 계산합니다.

Acoth

열 값의 하이퍼볼릭 아크코탄젠트를 계산합니다.

Acsc

열 값의 아크코시컨트를 계산합니다.

AcscDegrees

열 값의 아크코시컨트를 도 단위로 계산합니다.

Asec

열 값의 아크시컨트를 계산합니다.

AsecDegrees

열 값의 아크시컨트를 도 단위로 계산합니다.

Asech

열 값의 하이퍼볼릭 아크시컨트를 계산합니다.

Asin

열 값의 아크사인을 계산합니다.

AsinDegrees

열 값의 아크사인을 각도로 계산합니다.

Asinh

열 값의 하이퍼볼릭 아크사인을 계산합니다.

Atan

열 값의 아크탄젠트를 계산합니다.

AtanDegrees

열 값의 아크탄젠트를 도 단위로 계산합니다.

Atanh

열 값의 하이퍼볼릭 아크탄젠트를 계산합니다.

Cos

열 값의 코사인을 계산합니다.

CosDegrees

열 값의 코사인을 도 단위로 계산합니다.

Cosh

열 값의 하이퍼볼릭 코사인을 계산합니다.

Cot

열 값의 코탄젠트를 계산합니다.

CotDegrees

열 값의 코탄젠트를 도 단위로 계산합니다.

Coth

열 값의 쌍곡 코탄젠트를 계산합니다.

Csc

열 값의 코시컨트를 계산합니다.

CscDegrees

열 값의 코시컨트를 도 단위로 계산합니다.

Csch

열 값의 하이퍼볼릭 코시컨트를 계산합니다.

DegreesToRadians

각도를 라디안으로 변환합니다.

보조

열 값의 시컨트를 계산합니다.

aSecDegrees

열 값의 시컨트를 도 단위로 계산합니다.

aSech

열 값의 쌍곡 시컨트를 계산합니다.

Sign

열 값의 부호를 반환합니다.

Sin

열 값의 사인을 계산합니다.

Sinc

열 값의 사인 코사인 값을 계산합니다.

SinDegrees

열 값의 사인을 도 단위로 계산합니다.

Sinh

열 값의 하이퍼볼릭 사인을 계산합니다.

Tan

열 값의 탄젠트를 계산합니다.

TanDegrees

인수의 탄젠트를 도 단위로 계산합니다.

Tanh

열 값의 하이퍼볼릭 탄젠트를 계산합니다.

기술 정보

두 번째 연산자로 둘 이상의 열을 선택할 때는 주의해야 합니다. 모든 열에 상수 추가와 같이 작업이 간단한지 쉽게 이해할 수 있습니다.

데이터 세트에 여러 열이 있고 데이터 세트를 그 자체에 추가한다고 가정합니다. 결과에서 각 열은 다음과 같이 열 자체에 추가됩니다.

Num1 Num2 Num3 Add(Num1_Num1) Add(Num2_Num2) Add(Num3_Num3)
1 5 2 2 10 4
2 3 -1 4 6 -2
0 1 -1 0 2 -2

더 복잡한 계산을 수행해야 하는 경우 수학 연산 적용의 여러 인스턴스를 연결할 수 있습니다. 예를 들어 수학 연산 적용의 한 인스턴스를 사용하여 두 개의 열을 추가한 다음, 수학 연산 적용의 다른 인스턴스를 사용하여 합계를 상수로 나누어 평균을 얻을 수 있습니다.

또는 SQL, R 또는 Python 스크립트를 사용하여 다음 구성 요소 중 하나를 사용하여 모든 계산을 한 번에 수행할 수 있습니다.

다음 단계

Azure Machine Learning에서 사용 가능한 구성 요소 집합을 참조하세요.