마이닝 모델(Analysis Services - 데이터 마이닝)
이 섹션에서는 데이터 마이닝 모델의 기본 아키텍처를 설명하고, 데이터 마이닝 모델의 속성을 전체적으로 살펴보고, 마이닝 모델을 만들고 사용하는 방법을 설명합니다.
Mining Model Architecture
Defining Mining Models
Mining Model Properties
Mining Model Columns
Processing Mining Models
Viewing and Querying Mining Models
마이닝 모델 아키텍처
데이터 마이닝 모델은 마이닝 구조에서 데이터를 가져온 다음 데이터 마이닝 알고리즘을 사용하여 해당 데이터를 분석합니다. 마이닝 구조와 마이닝 모델은 별개의 개체입니다. 마이닝 구조에는 데이터 원본을 정의하는 정보가 저장되고, 마이닝 모델에는 분석 결과로 발견된 패턴과 같이 데이터의 통계적 처리에서 파생된 정보가 저장됩니다.
마이닝 모델은 마이닝 구조에서 제공한 데이터가 처리 및 분석되기 전까지 비어 있습니다. 마이닝 모델이 처리된 후에는 메타데이터, 결과 및 마이닝 구조에 대한 바인딩으로 채워집니다.
메타데이터는 모델의 이름과 해당 모델이 저장된 서버뿐 아니라 모델을 만드는 데 사용된 마이닝 구조의 열 목록을 비롯한 모델 정의, 모델을 처리할 때 적용되는 선택적 필터 정의 및 데이터를 분석하는 데 사용된 알고리즘도 지정합니다. 열, 필터 및 알고리즘의 선택은 분석 결과에 상당한 영향을 줍니다. 예를 들어 동일한 데이터를 사용하여 클러스터링 모델과 의사 결정 트리 모델을 만드는 경우, 이 두 모델에서는 각기 다른 알고리즘과 필터를 사용하므로 모델 콘텐츠도 매우 달라질 수 있습니다. 자세한 내용은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하십시오.
모델에 저장되는 결과는 알고리즘에 따라 달라지지만 패턴, 항목 집합, 규칙 및 수식을 포함할 수 있습니다. 이러한 결과를 사용하여 예측을 만들 수 있습니다.
모델에 저장된 바인딩은 다시 마이닝 구조의 캐시된 데이터를 가리킵니다. 데이터가 구조에 캐시되었고 처리 후 아직 지워지지 않은 경우 이러한 바인딩을 통해 결과에서 해당 결과를 지원하는 사례로 드릴스루할 수 있습니다. 그러나 실제 데이터는 모델이 아니라 구조 캐시에 저장됩니다.
[맨 위]
데이터 마이닝 모델 정의
다음 단계에 따라 데이터 마이닝 모델을 만들 수 있습니다.
기본 마이닝 구조를 만듭니다.
알고리즘을 선택합니다.
모델 열 및 사용법을 지정합니다.
필요에 따라 매개 변수를 설정하여 알고리즘에 의한 처리를 세부 조정합니다.
모델을 처리합니다.
Analysis Services에서는 마이닝 모델을 관리하는 데 유용한 다음과 같은 도구를 제공합니다.
데이터 마이닝 마법사 - 구조와 관련 마이닝 모델을 만들 수 있습니다. 이 도구를 사용하는 것이 가장 쉬운 방법입니다. 이 마법사를 사용하면 필요한 마이닝 구조가 자동으로 만들어지며 중요한 설정을 구성하는 데 도움이 됩니다.
DMX CREATE MODEL 문 - 모델을 정의하는 데 사용할 수 있습니다. 필요한 구조가 처리 과정에서 자동으로 만들어지므로 이 방법을 사용할 경우에는 기존 구조를 다시 사용할 수 없습니다. 만들려는 모델을 이미 정확히 알고 있는 경우에 이 방법을 사용합니다.
DMX ALTER STRUCTURE ADD MODEL 문 - 기존 구조에 새 마이닝 모델을 추가하는 데 사용할 수 있습니다. 동일한 데이터 집합을 기반으로 하는 다양한 모델을 시험하려면 이 방법을 사용합니다.
AMO 또는 XML/A를 사용하거나 Excel용 데이터 마이닝 클라이언트 등의 다른 클라이언트를 사용하여 프로그래밍 방식으로 마이닝 모델을 만들 수도 있습니다. 자세한 내용은 다음 항목을 참조하십시오.
AMO(Analysis Management Objects)
[맨 위]
마이닝 모델 속성
각 마이닝 모델에는 모델 및 해당 메타데이터를 정의하는 속성이 있습니다. 이러한 속성으로는 이름, 설명, 모델이 마지막으로 처리된 날짜, 모델에 대한 사용 권한 및 학습에 사용되는 데이터에 대한 필터 등이 있습니다.
각 마이닝 모델에는 마이닝 구조에서 파생되었으며 해당 모델에서 사용하는 데이터의 열을 설명하는 속성도 있습니다. 열이 중첩 테이블인 경우 열에도 별도의 필터가 적용될 수 있습니다.
또한 각 마이닝 모델에는 Algorithm 및 Usage라는 두 특수 속성이 있습니다.
**Algorithm 속성 **모델을 만드는 데 사용되는 알고리즘을 지정합니다. 사용 가능한 알고리즘은 사용 중인 공급자에 따라 달라집니다. SQL ServerAnalysis Services에 포함된 알고리즘 목록은 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)을 참조하십시오. Algorithm 속성은 마이닝 모델에 적용되고 각 모델에 대해 한 번만 설정될 수 있습니다. 나중에 알고리즘을 변경할 수 있지만 마이닝 모델의 일부 열은 선택하는 알고리즘에서 지원하지 않는 경우 사용할 수 없게 될 수 있습니다. 또한 변경 후 모델을 항상 다시 처리해야 합니다.
**Usage 속성 **모델에서 각 열이 사용되는 방법을 정의합니다. 열 사용을 Input, Predict, Predict Only 또는 Key로 정의할 수 있습니다. Usage 속성은 개별 마이닝 모델 열에 적용되고 모델에 포함되어 있는 각 열에 대해 개별적으로 설정되어야 합니다. 구조에 모델에서 사용하지 않는 열이 포함되어 있는 경우 사용이 Ignore로 설정됩니다.
마이닝 모델을 만든 후 마이닝 모델 속성의 값을 변경할 수 있습니다. 그러나 마이닝 모델의 이름을 포함하여 어떤 속성이든 변경할 경우에는 해당 모델을 다시 처리해야 합니다. 모델을 다시 처리한 후에는 다른 결과가 표시될 수 있습니다.
[맨 위]
마이닝 모델 열
마이닝 구조와 마찬가지로 마이닝 모델에는 열이 포함됩니다. 마이닝 구조에서 모델에 사용할 열을 선택할 수 있습니다. 기본 마이닝 구조에 있는 열을 사용할 수 있을 뿐 아니라, 마이닝 구조 열의 복사본을 만든 다음 해당 이름을 바꾸거나 사용법을 변경할 수도 있습니다.
선택한 알고리즘에 따라 마이닝 구조의 일부 열은 모델과 호환되지 않거나 적절하지 않은 결과를 초래할 수 있습니다. 따라서 구조의 데이터를 주의 깊게 검토하여 분석에 적합한 열만 모델에 포함해야 합니다. 특정 열이 사용하기에 적합하지 않다고 생각되는 경우 해당 열을 마이닝 구조나 마이닝 모델에서 삭제할 필요는 없고, 대신 모델을 만들 때 열을 무시하도록 지정하는 플래그를 해당 열에 설정하면 됩니다. 이렇게 하면 해당 열은 마이닝 구조에 남아 있지만 마이닝 모델에는 사용되지 않습니다. 그러나 모델에서 마이닝 구조로 드릴스루할 수 있도록 설정된 경우에는 나중에 해당 열의 정보를 검색할 수 있습니다.
모델을 만든 후 모델 이름 변경이나 열 추가 또는 제거 등의 변경 작업을 수행할 수 있습니다. 그러나 모델 메타데이터만 변경할 경우를 포함하여 어떤 항목이든 변경할 경우에는 해당 모델을 다시 처리해야 합니다.
자세한 내용은 마이닝 구조 열 및 마이닝 모델 열을 참조하십시오.
[맨 위]
마이닝 모델 처리
데이터 마이닝 모델은 처리되기 전까지는 비어 있는 개체입니다. 모델을 처리하면 구조에서 캐시된 데이터가 필터(모델에 정의된 필터가 있는 경우)를 통과하고 알고리즘에 의해 분석됩니다. 이 알고리즘은 데이터 내의 규칙과 패턴을 파악한 다음 이를 사용하여 모델을 채웁니다. 알고리즘을 사용하여 마이닝 모델을 만드는 방법은 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)을 참조하십시오.
또한 모델이 처리된 후에는 해당 마이닝 모델에 분석 결과에 대한 정보가 저장됩니다. 마이닝 모델에 저장되는 데이터의 종류에 대한 자세한 내용은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하십시오.
[맨 위]
마이닝 모델 보기 및 쿼리
모델을 처리한 후에는 Business Intelligence Development Studio 및 SQL Server Management Studio에서 제공하는 사용자 지정 뷰어를 사용하여 모델을 탐색할 수 있습니다. Analysis Services의 사용자 지정 뷰어에 대한 자세한 내용은 데이터 마이닝 모델 보기를 참조하십시오.
마이닝 모델에 대한 쿼리를 작성하여 예측을 만들거나 모델 메타데이터 또는 해당 모델에서 생성된 패턴을 검색할 수도 있습니다. 쿼리를 작성하려면 DMX(Data Mining Extensions)를 사용합니다. 데이터 마이닝 모델에 대해 사용할 수 있는 다양한 쿼리 유형에 대한 자세한 내용은 데이터 마이닝 모델 쿼리(Analysis Services - 데이터 마이닝)를 참조하십시오.