TopPercent(DMX)
TopPercent 함수는 누적 합계가 지정한 비율 이상인 테이블의 최상위 행을 내림차순으로 정렬하여 반환합니다.
구문
TopPercent(<table expression>, <rank expression>, <percent>)
적용 대상
<table column reference>와 같이 테이블을 반환하는 식 또는 테이블을 반환하는 함수입니다.
반환 형식
<table expression>
주의
TopPercent 함수는 각 행의 <rank expression> 인수 값을 평가하여 <rank expression> 값의 합계가 <percent> 인수로 지정한 비율 이상인 최상위 행을 내림차순으로 반환합니다. TopPercent는 지정한 비율 값을 충족하면서 가능한 가장 작은 요소 수를 반환합니다.
예
다음 예에서는 기본 데이터 마이닝 자습서를 사용하여 작성한 연결 모델에 대한 예측 쿼리를 만듭니다.
우선 중첩 테이블만 반환하는 예측 쿼리를 실행해 보면 TopPercent의 작동 방식을 이해하는 데 도움이 됩니다.
SELECT Predict ([Association].[v Assoc Seq Line Items], INCLUDE_STATISTICS, 10)
FROM
[Association]
NATURAL PREDICTION JOIN
SELECT (SELECT 'Women''s Mountain Shorts' as [Model]) AS [v Assoc Seq Line Items]) AS t
[!참고]
이 예에서 입력으로 제공된 값에는 작은따옴표가 들어 있으므로 작은따옴표를 앞에 추가하여 이스케이프해야 합니다. 이스케이프 문자를 삽입하는 구문을 모르는 경우 예측 쿼리 작성기를 사용하여 쿼리를 만들 수 있습니다. 드롭다운 목록에서 값을 선택하면 필요한 이스케이프 문자가 자동으로 삽입됩니다. 자세한 내용은 방법: 데이터 마이닝 디자이너에서 단일 쿼리 작성를 참조하십시오.
예 결과:
Model |
$SUPPORT |
$PROBABILITY |
$ADJUSTEDPROBABILITY |
---|---|---|---|
Sport-100 |
4334 |
0.291283016 |
0.252695851 |
Water Bottle |
2866 |
0.192620472 |
0.175205052 |
Patch kit |
2113 |
0.142012232 |
0.132389356 |
Mountain Tire Tube |
1992 |
0.133879965 |
0.125304948 |
Mountain-200 |
1755 |
0.117951475 |
0.111260823 |
Road Tire Tube |
1588 |
0.106727603 |
0.101229538 |
Cycling Cap |
1473 |
0.098998589 |
0.094256014 |
Fender Set - Mountain |
1415 |
0.095100477 |
0.090718432 |
Mountain Bottle Cage |
1367 |
0.091874454 |
0.087780332 |
Road Bottle Cage |
1195 |
0.080314537 |
0.077173962 |
TopPercent 함수는 이 쿼리의 결과를 받아 합계가 지정된 백분율인 최대값 행을 반환합니다.
SELECT
TopPercent
(
Predict ([Association].[v Assoc Seq Line Items],INCLUDE_STATISTICS,10),
$SUPPORT,
50)
FROM
[Association]
NATURAL PREDICTION JOIN
(SELECT (SELECT 'Women''s Mountain Shorts' as [Model]) AS [v Assoc Seq Line Items]) AS t
TopPercent 함수에 대한 첫 번째 인수는 테이블 열의 이름입니다. 이 예에서는 Predict 함수를 호출하고 INCLUDE_STATISTICS 인수를 사용하여 중첩 테이블을 반환합니다.
TopPercent 함수에 대한 두 번째 인수는 중첩 테이블에서 결과를 정렬하는 데 사용할 열입니다. 이 예에서 INCLUDE_STATISTICS 옵션은 $SUPPORT, $PROBABILTY 및 $ADJUSTED PROBABILITY 열을 반환합니다. 지원 값이 확인하기 쉬운 정수이므로 이 예에서는 $SUPPORT를 사용합니다.
TopPercent 함수에 대한 세 번째 인수는 백분율을 double 값으로 지정합니다. 총 지원의 하위 50%를 나타내는 최상위 제품의 행을 가져오려면 50을 입력합니다.
예 결과:
Model |
$SUPPORT |
$PROBABILITY |
$ADJUSTEDPROBABILITY |
---|---|---|---|
Sport-100 |
4334 |
0.29… |
0.25… |
Water Bottle |
2866 |
0.19… |
0.17… |
Patch kit |
2113 |
0.14… |
0.13… |
Mountain Tire Tube |
1992 |
0.133… |
0.12… |
참고 이 예는 TopPercent 사용법을 보여 주기 위해서만 제공됩니다. 데이터 집합의 크기에 따라 이 쿼리를 실행하는 데 시간이 오래 걸릴 수 있습니다.