다음을 통해 공유


열 배포(데이터 마이닝)

적용 대상: SQL Server 2019 및 이전 Analysis Services Azure Analysis Services Fabric/Power BI Premium

중요

데이터 마이닝은 SQL Server 2017 Analysis Services에서 더 이상 사용되지 않으며 이제 SQL Server 2022 Analysis Services에서 중단되었습니다. 더 이상 사용되지 않는 기능 및 중단된 기능에 대해서는 설명서가 업데이트되지 않습니다. 자세한 내용은 Analysis Services 이전 버전과의 호환성을 참조하세요.

Microsoft SQL Server SQL Server Analysis Services 마이닝 구조에서 열 분포를 정의하여 마이닝 모델을 만들 때 알고리즘이 해당 열의 데이터를 처리하는 방식에 영향을 줄 수 있습니다. 이렇게 하면 공통적인 값 배포가 열에 포함되어 있을 경우 모델을 처리하기 전에 몇몇 알고리즘에서 연속 열 배포를 정의하는 데 도움이 됩니다. 배포를 정의하지 않으면 알고리즘이 데이터를 해석하는 데 사용할 정보가 더 줄어듭니다. 따라서 마이닝 모델에서 얻는 예측의 정확도가 배포를 정의했을 경우보다 낮아질 수 있습니다.

SQL Server Analysis Services 사용할 수 있는 알고리즘은 다음 배포 유형을 지원합니다.

보통
연속 열 값이 정규 분포로 된 히스토그램을 형성합니다.

정상 분포 히스토그램

Log Normal
연속 열 값이 위쪽 끝 곡선은 늘어나고 아래쪽 끝 곡선은 기울어진 히스토그램을 형성합니다.

로그 정규 분포 히스토그램

유니폼
연속 열에 대한 값은 모든 값이 균일한 평탄 곡선을 형성합니다.

균일한 분포 히스토그램과 균일

SQL Server Analysis Services 제공하는 알고리즘에 대한 자세한 내용은 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)을 참조하세요.

참고 항목

내용 유형(데이터 마이닝)
마이닝 구조(Analysis Services - 데이터 마이닝)
분할 방법(데이터 마이닝)
분포(DMX)
마이닝 구조 열