데이터 마이닝 쿼리는 여러 용도로 유용합니다. 다음을 할 수 있습니다:
모델을 새 데이터에 적용하여 단일 또는 여러 예측을 만듭니다. 입력 값을 매개 변수로 제공하거나 일괄 처리로 제공할 수 있습니다.
학습에 사용되는 데이터의 통계 요약을 가져옵니다.
패턴 및 규칙을 추출하거나 모델의 패턴을 나타내는 일반적인 사례의 프로필을 생성합니다.
패턴을 설명하는 회귀 수식 및 기타 계산을 추출합니다.
특정 패턴에 맞는 사례를 가져옵니다.
분석에 사용되지 않는 데이터를 포함하여 모델에 사용되는 개별 사례에 대한 세부 정보를 검색합니다.
새 데이터를 추가하여 모델을 다시 학습하거나 교차 예측을 수행합니다.
이 섹션에서는 데이터 마이닝 쿼리를 시작하는 데 필요한 정보의 개요를 제공합니다. 데이터 마이닝 개체에 대해 만들 수 있는 쿼리 유형에 대해 설명하고, 쿼리 도구 및 쿼리 언어를 소개하며, SQL Server 데이터 마이닝에 제공된 알고리즘을 사용하여 빌드된 모델에 대해 만들 수 있는 쿼리 예제에 대한 링크를 제공합니다.
데이터 마이닝 쿼리 이해
Analysis Services 데이터 마이닝은 다음 유형의 쿼리를 지원합니다.
-
모델 및 입력 데이터의 패턴을 기반으로 유추를 만드는 쿼리입니다.
-
모델 자체에 대한 메타데이터, 통계 및 기타 정보를 반환하는 쿼리입니다.
-
모델에 대한 기본 사례 데이터 또는 모델에 사용되지 않은 구조체의 데이터를 검색할 수 있는 쿼리입니다.
-
모델에서 정보를 반환하지 않고 모델 및 구조를 빌드하거나 모델 또는 구조의 데이터를 업데이트하는 데 사용되는 쿼리입니다.
쿼리를 만들기 전에 SQL Server에서 제공하는 각 데이터 마이닝 알고리즘을 사용하여 만든 모델 간의 차이점을 숙지하는 것이 좋습니다.
각 알고리즘 유형에 대해 제공되는 사용자 지정 데이터 마이닝 뷰어를 사용하여 각 모델 형식을 찾아보고 탐색합니다. 자세한 내용은 마이닝 모델 뷰어 작업 및 방법 방법을 참조하세요.
Microsoft 일반 콘텐츠 트리 뷰어를 사용하여 각 모델 유형에 대한 모델 콘텐츠를 검토합니다. 이 정보를 해석하려면 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.
쿼리 도구 및 인터페이스
SQL Server에서 제공하는 쿼리 도구 중 하나를 사용하여 대화형으로 데이터 마이닝 쿼리를 빌드할 수 있습니다. 그래픽 예측 쿼리 작성기는 SSDT(SQL Server Data Tools) 및 SQL Server Management Studio 모두에서 제공됩니다. 이전에 예측 쿼리 작성기를 사용하지 않은 경우 기본 데이터 마이닝 자습서 의 단계에 따라 인터페이스를 숙지하는 것이 좋습니다. 단계에 대한 빠른 개요는 예측 쿼리 작성기를 사용하여 쿼리 만들기를 참조하세요.
예측 쿼리 작성기는 나중에 사용자 지정할 쿼리를 시작하는 데 유용합니다. 데이터 원본을 쉽게 추가하고 열에 매핑한 다음 DMX 보기로 전환하고 WHERE 절 또는 기타 함수를 추가하여 쿼리를 사용자 지정할 수 있습니다.
데이터 마이닝 모델 및 쿼리 작성 방법에 익숙해지면 DMX(데이터 마이닝 확장)를 사용하여 쿼리를 직접 작성할 수도 있습니다. DMX는 Transact-SQL과 유사하며 다양한 클라이언트에서 사용할 수 있는 쿼리 언어입니다. DMX는 사용자 지정 예측과 복잡한 쿼리를 모두 만들기 위한 도구입니다. DMX에 대한 소개는 DMX를 사용하여 데이터 마이닝 모델 만들기 및 쿼리: 자습서(Analysis Services - 데이터 마이닝)를 참조하세요.
DMX 편집기 모두 SSDT(SQL Server Data Tools) 및 SQL Server Management Studio에서 제공됩니다. 예측 쿼리 작성기를 사용하여 쿼리를 시작한 다음, 보기를 텍스트 편집기로 변경하고 DMX 문을 다른 클라이언트에 복사할 수도 있습니다. 자세한 내용은 데이터 마이닝 쿼리 인터페이스를 참조하세요.
AMO 또는 XMLA를 사용하여 프로그래밍 방식으로 DMX 문을 작성하고 클라이언트에서 Analysis Services 서버로 보낼 수 있습니다. 그러나 DMX는 마이닝 모델에 대한 쿼리를 만드는 데 사용해야 하는 언어입니다.
데이터 마이닝 스키마 행 집합을 기반으로 하는 DMV(동적 관리 뷰)를 사용하여 모델의 메타데이터, 통계 및 일부 콘텐츠를 쿼리할 수도 있습니다. 이러한 DMV를 사용하면 SELECT 문을 입력하여 모델에 대한 정보를 쉽게 검색할 수 있습니다. 그러나 예측을 만들 수는 없습니다. Analysis Services에서 지원하는 DMV에 대한 자세한 내용은 DMV(동적 관리 뷰)를 사용하여 Analysis Services 모니터링을 참조하세요.
마지막으로, 데이터 마이닝 쿼리 태스크 또는 데이터 마이닝 쿼리 변환을 사용하여 Integration Services 패키지에서 사용할 데이터 마이닝 쿼리를 만들 수 있습니다. 제어 흐름 태스크는 여러 유형의 DMX 쿼리를 지원하는 반면, 데이터 흐름 변환은 데이터 흐름의 데이터로 작동하는 쿼리만 지원합니다. 즉, PREDICTION JOIN 구문을 사용하는 쿼리를 의미합니다.
다양한 모델 형식에 대한 쿼리
모델을 만들 때 사용된 알고리즘은 데이터 마이닝 쿼리에서 가져올 수 있는 정보 유형에 큰 영향을 줍니다. 차이점의 이유는 각 알고리즘이 데이터를 다른 방식으로 처리하고 다양한 종류의 패턴을 저장하기 때문입니다. 예를 들어 일부 알고리즘은 클러스터를 만듭니다. 다른 사용자는 트리를 만듭니다. 따라서 작업 중인 모델 유형에 따라 특수 예측 및 쿼리 함수를 사용해야 할 수 있습니다.
다음 목록에서는 쿼리에 사용할 수 있는 함수의 요약을 제공합니다.
일반 예측 함수: 함수는
Predict다형성이므로 모든 모델 형식에서 작동합니다. 이 함수는 작업 중인 모델 유형을 자동으로 검색하고 추가 매개 변수를 묻는 메시지를 표시합니다. 자세한 내용은 Predict(DMX)를 참조하세요.경고
모든 모델이 예측을 만드는 데 사용되는 것은 아닙니다. 예를 들어 예측 가능한 특성이 없는 클러스터링 모델을 만들 수 있습니다. 그러나 모델에 예측 가능한 특성이 없더라도 모델에서 다른 유형의 유용한 정보를 반환하는 예측 쿼리를 만들 수 있습니다.
사용자 지정 예측 함수: 각 모델 형식은 해당 알고리즘에서 만든 패턴을 사용하기 위해 설계된 예측 함수 집합을 제공합니다.
예를 들어
Lag모델에 사용된 기록 데이터를 볼 수 있도록 시계열 모델에 대해 함수가 제공됩니다. 클러스터링 모델의 경우와 같은ClusterDistance함수가 더 의미가 있습니다.각 모델 유형에 대해 지원되는 함수에 대한 자세한 내용은 다음 링크를 참조하세요.
연결 모델 쿼리 예제 Microsoft Naive Bayes 알고리즘 클러스터링 모델 쿼리 예제 신경망 모델 쿼리 예제 의사 결정 트리 모델 쿼리 예제 시퀀스 클러스터링 모델 쿼리 예제 선형 회귀 모델 쿼리 예제 시계열 모델 쿼리 예제 로지스틱 회귀 모델 쿼리 예제 VBA 함수를 호출하거나 고유한 함수를 만들 수도 있습니다. 자세한 내용은 Functions(DMX)를 참조하세요.
일반 통계: 표준 편차와 같은 설명 통계의 표준 집합을 반환하는 거의 모든 모델 형식과 함께 사용할 수 있는 여러 함수가 있습니다.
예를 들어 함수는
PredictHistogram지정된 열의 모든 상태를 나열하는 테이블을 반환합니다.자세한 내용은 DMX(일반 예측 함수)를 참조하세요.
사용자 지정 통계: 특정 분석 작업과 관련된 통계를 생성하기 위해 각 모델 유형에 대해 추가 지원 함수가 제공됩니다.
예를 들어 클러스터링 모델을 사용하는 경우 함수
PredictCaseLikelihood를 사용하여 특정 사례 및 클러스터와 연결된 가능성 점수를 반환할 수 있습니다. 그러나 선형 회귀 모델을 만든 경우 콘텐츠 쿼리를 사용하여 수행할 수 있는 계수 및 절편을 검색하는 데 더 관심이 있을 것입니다.모델 콘텐츠 함수: 모든 모델의 콘텐츠 는 간단한 쿼리를 사용하여 정보를 검색할 수 있는 표준화된 형식으로 표시됩니다. DMX를 사용하여 모델 콘텐츠에 대한 쿼리를 만듭니다. 데이터 마이닝 스키마 행 집합을 사용하여 일부 유형의 모델 콘텐츠를 가져올 수도 있습니다.
모델 콘텐츠에서 반환되는 테이블의 각 행 또는 노드의 의미는 모델을 빌드하는 데 사용된 알고리즘의 유형과 열의 데이터 형식에 따라 다릅니다. 자세한 내용은 콘텐츠 쿼리(데이터 마이닝)를 참조하세요.
요구 사항
모델에 대한 쿼리를 만들려면 먼저 데이터 마이닝 모델을 처리해야 합니다. Analysis Services 개체를 처리하려면 특별한 권한이 필요합니다. 마이닝 모델 처리에 대한 자세한 내용은 처리 요구 사항 및 고려 사항(데이터 마이닝)을 참조하세요.
데이터 마이닝 모델에 대해 쿼리를 실행하려면 실행하는 쿼리 유형에 따라 다른 수준의 사용 권한이 필요합니다. 예를 들어 사례 또는 구조 데이터에 대한 드릴스루(세부 확인)에는 일반적으로 마이닝 구조 객체 또는 마이닝 모델 객체에 설정할 수 있는 추가 권한이 필요합니다.
그러나 쿼리가 외부 데이터를 사용하고 OPENROWSET 또는 OPENQUERY와 같은 문을 포함하는 경우 쿼리하는 데이터베이스는 이러한 문을 사용하도록 설정해야 하며 기본 데이터베이스 개체에 대한 권한이 있어야 합니다.
데이터 마이닝 쿼리를 실행하는 데 필요한 보안 컨텍스트에 대한 자세한 내용은 보안 개요(데이터 마이닝)를 참조하세요.
이 섹션 안에
이 섹션의 항목에서는 각 유형의 데이터 마이닝 쿼리를 더 자세히 소개하고 데이터 밍인 모델에 대한 쿼리를 만드는 방법에 대한 자세한 예제에 대한 링크를 제공합니다.
관련 작업
이러한 링크를 사용하여 데이터 마이닝 쿼리를 만들고 사용하는 방법을 알아봅니다.
| 업무 | 링크 |
|---|---|
| 데이터 마이닝 쿼리에 대한 자습서 및 연습 보기 |
6단원: 예측 만들기 및 작업(기본 데이터 마이닝 자습서) 시계열 예측 DMX 자습서 |
| SQL Server Management Studio 및 SSDT(SQL Server Data Tools)에서 데이터 마이닝 쿼리 도구 사용 |
SQL Server Management Studio에서 DMX 쿼리 만들기 예측 쿼리 작성기를 사용하여 예측 쿼리 만들기 모델에 예측 함수 적용 예측 쿼리 수동 편집 |
| 예측 쿼리에 사용되는 외부 데이터 작업 |
예측 쿼리에 대한 입력 데이터 선택 및 매핑 예측 쿼리에 대한 입력 데이터 선택 및 매핑 |
| 쿼리 결과를 가지고 작업하기 | 예측 쿼리 결과 보기 및 저장 |
| Management Studio에서 제공하는 DMX 및 XMLA 쿼리 템플릿 사용 |
템플릿에서 단일 예측 쿼리 만들기 XMLA를 사용하여 데이터 마이닝 쿼리 만들기 SQL Server Management Studio에서 Analysis Services 템플릿 사용 |
| 콘텐츠 쿼리에 대해 자세히 알아보고 예제 참조 |
마이닝 모델에서 콘텐츠 쿼리 만들기 마이닝 모델을 만드는 데 사용되는 매개 변수 쿼리 콘텐츠 쿼리(데이터 마이닝) |
| 쿼리 옵션 설정 및 쿼리 권한 및 문제 해결 | 데이터 마이닝 쿼리의 제한 시간 값 변경 |
| Integration Services에서 데이터 마이닝 구성 요소 사용 |
데이터 마이닝 쿼리 태스크 데이터 마이닝 쿼리 변환 |
또한 참조하십시오
데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)
마이닝 모델 콘텐츠(분석 서비스 - 데이터 마이닝)