다음을 통해 공유


데이터 형식(데이터 마이닝)

적용 대상: SQL Server 2019 및 이전 Analysis Services Azure Analysis Services Fabric/Power BI Premium

중요

데이터 마이닝은 SQL Server 2017 Analysis Services에서 더 이상 사용되지 않으며 이제 SQL Server 2022 Analysis Services에서 중단되었습니다. 더 이상 사용되지 않는 기능 및 중단된 기능에 대해서는 설명서가 업데이트되지 않습니다. 자세한 내용은 Analysis Services 이전 버전과의 호환성을 참조하세요.

Microsoft SQL Server SQL Server Analysis Services 마이닝 모델 또는 마이닝 구조를 만들 때 마이닝 구조의 각 열에 대한 데이터 형식을 정의해야 합니다. 데이터 형식은 분석 엔진에 데이터 원본의 데이터가 숫자인지 또는 텍스트인지 여부와 데이터 처리 방법을 알려 줍니다. 예를 들어 원본 데이터에 숫자 데이터가 포함되어 있는 경우 숫자를 정수로 처리할지, 아니면 소수 자릿수를 사용하여 처리할지 여부를 지정할 수 있습니다.

SQL Server Analysis Services 마이닝 구조 열에 대해 다음 데이터 형식을 지원합니다.

데이터 형식 지원하는 내용 유형
Text Cyclical, Discrete, Discretized, Key Sequence, Ordered, Sequence
Long Continuous, Cyclical, Discrete, Discretized, Key, Key Sequence, Key Time, Ordered, Sequence, Time

Classified
Boolean Cyclical, Discrete, Ordered
double Continuous, Cyclical, Discrete, Discretized, Key, Key Sequence, Key Time, Ordered, Sequence, Time

Classified
날짜 Continuous, Cyclical, Discrete, Discretized, Key, Key Sequence, Key Time, Ordered

참고

Time 및 Sequence 내용 유형은 타사 알고리즘에서만 지원됩니다. Cyclical 및 Ordered 내용 유형이 지원되기는 하지만 대부분의 알고리즘은 해당 유형을 불연속 값으로 처리하고 특수한 처리를 수행하지 않습니다.

표에서는 각 데이터 형식에 대해 지원되는 콘텐츠 형식 도 보여 줍니다.

콘텐츠 형식은 데이터 마이닝과 관련이 있으며, 마이닝 모델에서 데이터가 처리 또는 계산되는 방식을 사용자 지정할 수 있게 합니다. 예를 들어 열에 숫자가 들어 있는 경우 불연속 값으로 모델링해야 할 수도 있습니다. 열에 숫자가 들어 있는 경우 범주화 또는 불연속화되도록 지정하거나 모델에서 연속 값으로 처리되도록 지정할 수도 있습니다. 따라서 콘텐츠 형식은 모델에 큰 영향을 미칠 수 있습니다. 모든 콘텐츠 형식 목록은 콘텐츠 형식(데이터 마이닝)을 참조하세요.

참고

다른 기계 학습 시스템에서 명목 데이터, 요인 또는 범주, 순차적 데이터또는 시퀀스 데이터등의 용어를 발견할 수도 있습니다. 일반적으로 이러한 용어는 콘텐츠 형식에 해당합니다. SQL Server 데이터 형식은 모델의 사용량이 아닌 스토리지의 값 형식만 지정합니다.

데이터 형식 지정

DMX(Data Mining Extensions)를 사용하여 직접 마이닝 모델을 만드는 경우 모델을 정의할 때 각 열에 대한 데이터 형식을 정의할 수 있으며 동시에 Analysis Services가 지정된 데이터 형식을 사용하여 해당되는 마이닝 구조를 만듭니다. 마법사를 사용하여 마이닝 모델 또는 마이닝 구조를 만드는 경우 Analysis Services에서 데이터 형식을 제안하거나 사용자가 목록에서 데이터 형식을 선택할 수 있습니다.

데이터 형식 변경

열의 데이터 형식을 변경하는 경우 항상 마이닝 구조 및 이 구조를 기반으로 하는 모든 마이닝 모델을 다시 처리해야 합니다. 데이터 형식을 변경하는 경우 특정 모델에서 해당 열을 더 이상 사용할 수 없는 경우가 있습니다. 이 경우 Analysis Services에서는 사용자가 모델을 다시 처리할 때 오류를 발생시키거나 모델을 처리하지만 해당 특정 열을 제외합니다.

참고 항목

내용 유형(데이터 마이닝)
콘텐츠 형식(DMX)
데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)
마이닝 구조(Analysis Services - 데이터 마이닝)
데이터 형식(DMX)
마이닝 모델 열
마이닝 구조 열