요약
이 문서에서는 Microsoft Office Excel 2003 및 이후 버전의 Excel에서 RSQ 함수를 설명합니다. 이 문서에서는 함수를 사용하는 방법을 설명하고 이러한 이후 버전의 Excel에서 RSQ 결과를 이전 버전의 Excel의 RSQ 결과와 비교합니다.
더 많은 정보
RSQ(array1, array2) 함수는 두 데이터 배열 간의 Pearson Product-Moment 상관 관계 계수의 제곱을 반환합니다.
문법
RSQ(array1, array2)
array1 및 array2 인수는 숫자 또는 이름, 배열 상수 또는 숫자가 포함된 참조여야 합니다.
RSQ의 가장 일반적인 사용은 RSQ(A1:A100, B1:B100)와 같은 데이터를 포함하는 두 개의 셀 범위를 포함합니다.
사용 예
RSQ 함수를 설명하려면 다음 단계를 수행합니다.
빈 Excel 워크시트를 만든 다음 다음 표를 복사합니다.
A b C D 1 = 3 + 10^$D$2 데이터에 추가할 10의 힘 2 =4 + 10^$D$2 0 3 =2 + 10^$D$2 4 =5 + 10^$D$2 5 =4+10^$D$2 6 =7+10^$D$2 Excel 2003 이전 =RSQ(A1:A6,B1:B6) 때 D2 = 7.5 =PEARSON(A1:A6,B1:B6)^2 RSQ = PEARSON^2 0.492857142857143 =CORREL(A1:A6,B1:B6)^2 CORREL^2 0.509470304975923 때 D2 = 8 RSQ = PEARSON^2 #DIV/0! CORREL^2 0.509470304975923 빈 Excel 워크시트에서 셀 A1을 선택한 다음 표가 워크시트의 셀 A1:D13을 채우도록 항목을 붙여넣습니다.
표를 새 Excel 워크시트에 붙여넣은 후 [붙여넣기 옵션] 단추를 선택한 다음 [ 대상 서식 일치]를 선택합니다. 붙여넣은 범위를 계속 선택한 상태에서 실행 중인 Excel 버전에 적합한 다음 절차 중 하나를 사용합니다.
- Microsoft Office Excel 2007에서 홈 탭을 선택하고 셀 그룹에서서식을 선택한 다음 열 너비 자동 맞춤을 선택합니다.
- Excel 2003에서 서식 메뉴의 열을 가리킨 다음 선택 항목 자동 맞춤을 선택합니다.
비고
셀 B1:B6의 서식을 소수 자릿수가 0인 숫자로 지정할 수 있습니다.
셀 A1:A6 및 B1:B6에는 셀 A8:A10에서 RSQ, PEARSON 및 CORREL을 호출하는 데 사용되는 두 개의 데이터 배열이 포함되어 있습니다. RSQ는 기본적으로 PEARSON을 계산하고 결과를 제곱하여 계산됩니다. PEARSON과 CORREL은 모두 Pearson Product-Moment 상관 관계 계수를 계산하기 때문에 결과가 동의해야 합니다. RSQ는 기본적으로 CORREL을 계산하고 결과를 제곱하는 것으로 구현될 수 있습니다(하지만 구현되지 않았습니다).
Excel 2003 이전 버전의 Excel에서는 PEARSON에서 반올림 오류가 발생할 수 있습니다. 이 동작은 RSQ에서 반올림 오류로 이어집니다. PEARSON 및 RSQ의 동작은 Excel 2003 및 이후 버전의 Excel에서 개선되었습니다. CORREL은 항상 Excel 2003 및 이후 버전의 Excel에서 찾을 수 있는 향상된 프로시저를 사용하여 구현되었습니다. 따라서 이전 버전의 Excel용 RSQ 대신 CORREL을 사용한 다음 결과를 제곱하는 것이 대안입니다.
Excel 2003 이전 버전의 Excel에서는 이 문서의 워크시트를 사용하여 실험을 실행하고 반올림 오류가 발생하는 시기를 검색할 수 있습니다. B1:B6의 각 관찰에 상수를 추가하는 경우 셀 A7:A9의 RSQ, PEARSON^2 및 CORREL^2 값은 영향을 받지 않습니다. D2에서 값을 늘리면 B1:B6에 더 큰 상수가 추가됩니다. D2 <= 7이면 A7:A9에 표시되는 라운드오프 오류가 없습니다. 이제 7.25, 7.5, 7.75 및 8 값을 변경합니다. A9의 CORREL^2는 영향을 받지 않지만 RSQ 및 PEARSON^2(이러한 식은 항상 서로 동의함)는 A7:A8에서 반올림 오류를 표시합니다. D6:D13은 각각 D2 = 7.5 및 8인 경우 RSQ = PEARSON^2 및 CORREL^2의 값을 표시합니다.
CORREL은 여전히 잘 동작하지만 PEARSON의 라운드 오프 오류는 너무 심각해져서 D2 = 8일 때 RSQ 및 PEARSON^2에서 0으로 나누기가 발생합니다.
이전 버전의 Excel에서는 이러한 Excel 버전에서 사용하는 계산 수식과 함께 라운드오프 오류의 영향이 더 심오하기 때문에 이러한 경우 잘못된 답변을 표시합니다. 그러나 이 실험에서 사용되는 사례는 극단으로 간주될 수 있습니다.
Excel 2003 이상 버전이 있는 경우 실험을 시도하면 RSQ 및 PEARSON^2 값이 변경되지 않습니다. 그러나 셀 D6:D13은 이전 버전의 Excel에서 발생했던 것과 유사한 반올림 오류를 표시합니다.
이전 버전의 Excel 결과
두 데이터 배열 X와 Y의 이름을 지정하는 경우 이전 버전의 Excel에서는 데이터를 단일 패스로 사용하여 X 제곱의 합계, Y의 제곱 합계, X의 합계, Y의 합계, XY의 합계 및 각 배열의 관찰 횟수를 계산했습니다. 그런 다음 이러한 수량은 이전 버전의 Excel의 도움말 파일에 제공된 계산 수식에 결합되었습니다. RSQ에 대한 도움말 파일에는 Pearson Product-Moment 상관 관계 계수에 대한 수식이 표시됩니다. 이 결과는 RSQ를 얻기 위해 제곱됩니다.
Excel 2003 이상 버전의 Excel 결과
Excel 2003 및 이후 버전의 Excel에서 사용되는 프로시저는 데이터를 통해 2단계 프로세스를 사용합니다. 첫째, X와 Y의 합계와 각 배열의 관찰 횟수가 계산되며, 이러한 평균(평균)에서 X 및 Y 관찰을 계산할 수 있습니다. 그런 다음 두 번째 패스에서 각 X와 X 평균 간의 제곱 차이를 발견하고 이러한 제곱 차이를 합산합니다. 각 Y와 Y 평균 간의 제곱 차이는 발견되며 이러한 제곱 차이는 합산됩니다. 또한 각 데이터 요소 쌍에 대해 제품(X – X 평균) * (Y – Y 평균)이 검색되고 합계가 계산됩니다. 이러한 세 가지 합계는 PEARSON의 수식에 결합됩니다. Y 배열(또는 X 배열)의 각 값에 상수를 추가하는 경우 세 가지 합계 중 어느 것도 영향을 받지 않습니다. 이 동작은 동일한 값이 Y 평균(또는 X 평균)에 추가되기 때문에 발생합니다. 숫자 예제에서는 D12 셀에 10의 높은 성능이 있더라도 이러한 세 가지 합계는 영향을 받지 않으며 두 번째 패스의 결과는 D2 셀의 항목과 독립적입니다. 따라서 Excel 2003 및 이후 버전의 Excel의 결과는 수치적으로 더 안정적입니다.
결론
원패스 접근 방식을 2단계 접근 방식으로 대체하면 EXCEL 2003 및 이후 버전의 Excel에서 PEARSON 및 RSQ의 숫자 성능이 향상됩니다. Excel 2003 및 이후 버전의 Excel에서 가져온 결과는 이전 버전의 Excel에서 얻은 결과보다 정확도가 떨어지지 않습니다.
가장 실용적인 예제에서는 이후 버전의 Excel 결과와 이전 버전의 Excel 결과 간에 차이가 없을 것입니다. 이 동작은 일반적인 데이터가 이 실험에서 보여 주는 비정상적인 동작의 종류를 나타낼 가능성이 낮기 때문에 발생합니다. 데이터가 데이터 값 간의 상대적으로 작은 변형과 결합된 많은 수의 유효 자릿수를 포함하는 경우 숫자 불안정성이 이전 버전의 Excel에 나타날 가능성이 높습니다.
샘플 평균을 찾고, 각 제곱 편차를 계산하고, 제곱 편차를 합산하여 샘플 평균에 대한 제곱 편차의 합계를 찾는 절차는 대체 프로시저보다 더 정확합니다. 이 대체 프로시저는 몇 가지 데이터 포인트에서 계산기를 사용하는 데 적합하기 때문에 "계산기 수식"이라는 이름이 자주 지정되었습니다. 대체 프로시저는 다음 절차를 사용했습니다.
- 모든 관찰의 제곱 합계, 샘플 크기 및 모든 관찰의 합계를 찾았습니다.
- 모든 관측값의 제곱 합계를 뺀 값([모든 관찰의 합계]^2)/샘플 크기를 계산했습니다.
Excel 2003 및 이후 버전의 Excel에 대해 개선된 다른 많은 함수가 있습니다. 이후 버전의 Excel에서 원패스 프로시저를 첫 번째 패스에서 샘플 평균을 찾은 다음 두 번째 패스의 샘플 평균에 대한 제곱 편차의 합계를 계산하는 2-pass 프로시저로 대체하므로 이러한 함수가 향상되었습니다.
다음 목록은 이러한 함수의 목록입니다.
- VAR
- VARP
- STDEV
- STDEVP
- DVAR
- DVARP
- DSTDEV
- DSTDEVP
- 예보
- 경사
- 가로채
- 피어슨
- RSQ
- STEYX
분석 도구의 세 가지 분산 분석 도구에서 각각 비슷한 개선이 이루어졌습니다.