다음을 통해 공유


TopPercent(DMX)

TopPercent 함수는 누적 합계가 지정한 비율 이상인 테이블의 최상위 행을 내림차순으로 정렬하여 반환합니다.

구문

TopPercent(<table expression>, <rank expression>, <percent>)

적용 대상

<table column reference>와 같이 테이블을 반환하는 식 또는 테이블을 반환하는 함수입니다.

반환 형식

<table expression>

주의

TopPercent 함수는 각 행의 <rank expression> 인수 값을 평가하여 <rank expression> 값의 합계가 <percent> 인수로 지정한 비율 이상인 최상위 행을 내림차순으로 반환합니다. TopPercent는 지정한 비율 값을 충족하면서 가능한 가장 작은 요소 수를 반환합니다.

다음 예에서는 기본 데이터 마이닝 자습서를 사용하여 작성한 연결 모델에 대한 예측 쿼리를 만듭니다.

우선 중첩 테이블만 반환하는 예측 쿼리를 실행해 보면 TopPercent의 작동 방식을 이해하는 데 도움이 됩니다.

SELECT Predict ([Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 10)
FROM 
     [Association]
NATURAL PREDICTION JOIN
SELECT (SELECT 'Women''s Mountain Shorts' as [Model]) AS [v Assoc Seq Line Items]) AS t

[!참고]

이 예에서 입력으로 제공된 값에는 작은따옴표가 들어 있으므로 작은따옴표를 앞에 추가하여 이스케이프해야 합니다. 이스케이프 문자를 삽입하는 구문을 모르는 경우 예측 쿼리 작성기를 사용하여 쿼리를 만들 수 있습니다. 드롭다운 목록에서 값을 선택하면 필요한 이스케이프 문자가 자동으로 삽입됩니다. 자세한 내용은 방법: 데이터 마이닝 디자이너에서 단일 쿼리 작성를 참조하십시오.

예 결과:

Model

$SUPPORT

$PROBABILITY

$ADJUSTEDPROBABILITY

Sport-100

4334

0.291283016

0.252695851

Water Bottle

2866

0.192620472

0.175205052

Patch kit

2113

0.142012232

0.132389356

Mountain Tire Tube

1992

0.133879965

0.125304948

Mountain-200

1755

0.117951475

0.111260823

Road Tire Tube

1588

0.106727603

0.101229538

Cycling Cap

1473

0.098998589

0.094256014

Fender Set - Mountain

1415

0.095100477

0.090718432

Mountain Bottle Cage

1367

0.091874454

0.087780332

Road Bottle Cage

1195

0.080314537

0.077173962

TopPercent 함수는 이 쿼리의 결과를 받아 합계가 지정된 백분율인 최대값 행을 반환합니다.

SELECT 
TopPercent
    (
    Predict ([Association].[v Assoc Seq Line Items],INCLUDE_STATISTICS,10),
    $SUPPORT,
    50)
FROM 
     [Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Women''s Mountain Shorts' as [Model]) AS [v Assoc Seq Line Items]) AS t

TopPercent 함수에 대한 첫 번째 인수는 테이블 열의 이름입니다. 이 예에서는 Predict 함수를 호출하고 INCLUDE_STATISTICS 인수를 사용하여 중첩 테이블을 반환합니다.

TopPercent 함수에 대한 두 번째 인수는 중첩 테이블에서 결과를 정렬하는 데 사용할 열입니다. 이 예에서 INCLUDE_STATISTICS 옵션은 $SUPPORT, $PROBABILTY 및 $ADJUSTED PROBABILITY 열을 반환합니다. 지원 값이 확인하기 쉬운 정수이므로 이 예에서는 $SUPPORT를 사용합니다.

TopPercent 함수에 대한 세 번째 인수는 백분율을 double 값으로 지정합니다. 총 지원의 하위 50%를 나타내는 최상위 제품의 행을 가져오려면 50을 입력합니다.

예 결과:

Model

$SUPPORT

$PROBABILITY

$ADJUSTEDPROBABILITY

Sport-100

4334

0.29…

0.25…

Water Bottle

2866

0.19…

0.17…

Patch kit

2113

0.14…

0.13…

Mountain Tire Tube

1992

0.133…

0.12…

참고   이 예는 TopPercent 사용법을 보여 주기 위해서만 제공됩니다. 데이터 집합의 크기에 따라 이 쿼리를 실행하는 데 시간이 오래 걸릴 수 있습니다.