SQL Server Analysis Services에서 모델링 플래그를 사용하여 사례 테이블에 정의된 데이터에 대한 데이터 마이닝 알고리즘에 추가 정보를 제공할 수 있습니다. 알고리즘은 이 정보를 사용하여 보다 정확한 데이터 마이닝 모델을 빌드할 수 있습니다.
일부 모델링 플래그는 마이닝 구조 수준에서 정의되는 반면 다른 모델링 플래그는 마이닝 모델 열 수준에서 정의됩니다. 예를 들어 NOT NULL 모델링 플래그는 마이닝 구조 열과 함께 사용됩니다. 모델을 만드는 데 사용하는 알고리즘에 따라 마이닝 모델 열에 추가 모델링 플래그를 정의할 수 있습니다.
비고
타사 플러그 인에는 Analysis Services에서 미리 정의된 플래그 외에도 다른 모델링 플래그가 있을 수 있습니다.
모델링 플래그 목록
다음 목록에서는 Analysis Services에서 지원되는 모델링 플래그에 대해 설명합니다. 특정 알고리즘에서 지원하는 모델링 플래그에 대한 자세한 내용은 모델을 만드는 데 사용된 알고리즘에 대한 기술 참조 항목을 참조하세요.
NOT NULL
특성 열의 값에 null 값이 포함되어서는 안 되었음을 나타냅니다. 모델 학습 프로세스 중에 Analysis Services가 이 특성 열에 대해 null 값을 발견하면 오류가 발생합니다.
모델 존재 여부만
열이 두 개의 상태를 MissingExisting갖는 것으로 처리됨을 나타냅니다. 값이 NULL면 Missing으로 처리됩니다. MODEL_EXISTENCE_ONLY 플래그는 예측 가능한 특성에 적용되며 대부분의 알고리즘에서 지원됩니다.
효과적으로, MODEL_EXISTENCE_ONLY 플래그를 설정하면 값의 표현이 True 두 가지 상태인 Missing 그리고 Existing로 변경됩니다. 누락되지 않은 모든 상태는 단일 Existing 값으로 결합됩니다.
이 모델링 플래그의 일반적인 용도는 상태에 암시적 의미가 있는 NULL 특성이며, 상태의 NOT NULL 명시적 값은 열에 값이 있다는 사실만큼 중요하지 않을 수 있습니다. 예를 들어 [DateContractSigned] 열은 계약이 서명되지 않았으면 NULL, 계약이 서명된 경우라면 NOT NULL일 수 있습니다. 따라서 모델의 목적이 계약의 서명 여부를 예측하는 경우 MODEL_EXISTENCE_ONLY 플래그를 사용하여 사례의 NOT NULL 정확한 날짜 값을 무시하고 계약이 MissingExisting있는 경우만 구분할 수 있습니다.
비고
누락은 알고리즘에서 사용하는 특수 상태이며 열의 텍스트 값 "Missing"과 다릅니다. 자세한 내용은 누락 값(Analysis Services - 데이터 마이닝)을 참조하세요.
REGRESSOR
열이 처리 중에 회귀 변수로 사용할 후보임을 나타냅니다. 이 플래그는 마이닝 모델 열에 정의되며 연속 숫자 데이터 형식이 있는 열에만 적용할 수 있습니다. 이 플래그의 사용에 대한 자세한 내용은 이 항목의 섹션인 회귀기 모델링 플래그의 사용을 참조하세요.
모델링 플래그 보기 및 변경
구조 또는 모델의 속성을 확인하여 데이터 마이닝 디자이너에서 마이닝 구조 열 또는 모델 열과 연결된 모델링 플래그를 볼 수 있습니다.
현재 마이닝 구조에 적용된 모델링 플래그를 확인하려면 다음과 같은 쿼리를 사용하여 구조 열에 대한 모델링 플래그만 반환하는 데이터 마이닝 스키마 행 집합에 대해 쿼리를 만들 수 있습니다.
SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS
WHERE STRUCTURE_NAME = '<structure name>'
데이터 마이닝 디자이너를 사용하고 연결된 열의 속성을 편집하여 모델에 사용되는 모델링 플래그를 추가하거나 변경할 수 있습니다. 이러한 변경 내용을 사용하려면 구조 또는 모델을 다시 처리해야 합니다.
DMX를 사용하거나 AMO 또는 XMLA 스크립트를 사용하여 새 마이닝 구조 또는 마이닝 모델에서 모델링 플래그를 지정할 수 있습니다. 그러나 DMX를 사용하여 기존 마이닝 모델 및 구조에 사용되는 모델링 플래그는 변경할 수 없습니다. 구문을 ALTER MINING STRUCTURE....ADD MINING MODEL사용하여 새 마이닝 모델을 만들어야 합니다.
회귀기 모델링 플래그 사용
열에 REGRESSOR 모델링 플래그를 설정할 때 열에 잠재적인 회귀 변수가 포함되어 있음을 알고리즘에 나타냅니다. 모델에 사용되는 실제 회귀 변수는 알고리즘에 의해 결정됩니다. 예측 가능한 특성을 모델링하지 않으면 잠재적인 회귀자를 삭제할 수 있습니다.
데이터 마이닝 마법사를 사용하여 모델을 빌드하는 경우 모든 연속 입력 열에 가능한 회귀 변수로 플래그가 지정됩니다. 따라서 열에 REGRESSOR 플래그를 명시적으로 설정하지 않더라도 열은 모델에서 회귀 변수로 사용될 수 있습니다.
다음 예제와 같이 마이닝 모델에 대한 스키마 행 집합에 대해 쿼리를 수행하여 처리된 모델에서 실제로 사용된 회귀자를 확인할 수 있습니다.
SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_COLUMNS
WHERE MODEL_NAME = '<model name>'
메모 마이닝 모델을 수정하고 열의 콘텐츠 형식을 연속에서 불연속으로 변경하는 경우 마이닝 열의 플래그를 수동으로 변경한 다음 모델을 다시 처리해야 합니다.
선형 회귀 모델의 회귀 변수
선형 회귀 모델은 Microsoft 의사 결정 트리 알고리즘을 기반으로 합니다. Microsoft 선형 회귀 알고리즘을 사용하지 않더라도 모든 의사 결정 트리 모델에는 연속 특성의 회귀를 나타내는 트리 또는 노드가 포함될 수 있습니다.
따라서 이러한 모델에서는 연속 열이 회귀를 나타내도록 지정할 필요가 없습니다. Microsoft 의사 결정 트리 알고리즘은 열에 REGRESSOR 플래그를 설정하지 않더라도 의미 있는 패턴을 사용하여 데이터 세트를 영역으로 분할합니다. 차이점은 모델링 플래그를 설정할 때 알고리즘이 트리 노드의 패턴에 맞게 다음 형식의 회귀 수식을 찾으려고 시도한다는 것입니다.
a*C1 + b*C2 + ...
그런 다음 잔차의 합계를 계산하고 편차가 너무 크면 트리에서 분할이 강제로 적용됩니다.
예를 들어 Income 을 특성으로 사용하여 고객 구매 동작을 예측하고 열에서 REGRESSOR 모델링 플래그를 설정하는 경우 알고리즘은 먼저 표준 회귀 수식을 사용하여 Income 값에 맞도록 시도합니다. 편차가 너무 크면 회귀 수식이 포기되고 트리가 다른 속성을 기준으로 분할됩니다. 그런 다음 의사 결정 트리 알고리즘은 분할 후 각 분기의 수입에 회귀자를 맞추려고 시도합니다.
FORCE_REGRESSOR 매개 변수를 사용하여 알고리즘이 특정 회귀 변수를 사용하도록 보장할 수 있습니다. 이 매개 변수는 의사 결정 트리 알고리즘 및 선형 회귀 알고리즘과 함께 사용할 수 있습니다.
관련 작업
모델링 플래그를 사용하는 방법에 대해 자세히 알아보려면 다음 링크를 사용합니다.
| 과업 | 주제 |
|---|---|
| 데이터 마이닝 디자이너를 사용하여 모델링 플래그 편집 | 모델링 플래그 보기 또는 변경(데이터 마이닝) |
| 알고리즘에 힌트를 제공하여 적절한 회귀 변수를 추천합니다. | 모델에서 회귀로 사용할 열 지정 |
| 특정 알고리즘에서 지원하는 모델링 플래그를 참조하세요(각 알고리즘 참조 항목의 모델링 플래그 섹션에서). | 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝) |
| 마이닝 구조 열 및 해당 열에 설정할 수 있는 속성에 대해 자세히 알아보기 | 마이닝 데이터 구조 열 |
| 모델 수준에서 적용할 수 있는 마이닝 모델 열 및 모델링 플래그에 대해 알아봅니다. | 마이닝 모델 열 |
| DMX 문의 모델링 플래그를 다루는 구문을 확인하세요. | 모델링 지표(DMX) |
| 누락된 값 및 해당 값을 사용하여 작업하는 방법 이해 | 누락된 값(Analysis Services - 데이터 마이닝) |
| 모델 및 구조 관리 및 사용 속성 설정에 대해 알아보기 | 데이터 마이닝 개체 이동 |