데이터 마이닝과 함께 Integration Services 사용
새 설치: 2006년 4월 14일
데이터 마이닝을 흔히 작업 가능한 유효 정보를 큰 데이터베이스에서 추출하는 프로세스라고 설명합니다. 즉, 데이터 마이닝은 데이터에서 패턴 및 추세를 찾는 데 도움을 줍니다. Microsoft SQL Server 2005 Analysis Services는 이러한 패턴을 추출 및 분석하기 위한 강력한 데이터 마이닝 기능과 도구를 제공합니다. Integration Services는 이러한 데이터 마이닝 모델의 관리 및 쿼리를 지원하기 위한 다양한 구성 요소를 제공합니다.
SQL Server 2005 Analysis Services(SSAS)의 데이터 마이닝 기능에 대한 자세한 내용은 데이터 마이닝 개념 및 데이터 마이닝 작업을 참조하십시오.
[!참고] 이 항목에 설명된 일부 Integration Services 구성 요소는 SQL Server 2005 Enterprise Edition 및 Developer Edition에서만 사용할 수 있습니다.
연결 관리자
연결 관리자는 데이터 원본에 대한 연결을 논리적으로 나타낸 것입니다. Analysis Services 연결 관리자를 사용하여 마이닝 구조 및 모델이 저장되는 Analysis Services 데이터베이스에 연결할 수 있습니다. 이 항목에 설명된 모든 작업과 데이터 흐름 구성 요소에는 Analysis Services 연결 관리자가 필요합니다.
Analysis Services 연결 관리자
Analysis Services 연결 관리자를 사용하면 패키지에서 Analysis Services 데이터베이스를 실행하는 서버 또는 마이닝 구조 및 모델에 대한 액세스를 제공하는 Analysis Services 프로젝트에 연결할 수 있습니다. Business Intelligence Development Studio에서 패키지를 개발하는 동안에는 Analysis Services 프로젝트에만 연결할 수 있습니다. 런타임에는 사용자가 Analysis Services를 배포하는 서버 및 데이터베이스에 패키지가 연결됩니다.
자세한 내용은 Analysis Services 연결 관리자를 참조하십시오.
작업
작업은 패키지에서 수행되는 작업 단위를 정의하는 제어 흐름 요소입니다. 다음 작업을 사용하여 데이터 마이닝 구조나 모델을 생성 또는 수정하고 모델을 처리 또는 쿼리할 수 있습니다.
Analysis Services DDL 실행 작업
Analysis Services DDL 실행 작업은 마이닝 구조와 모델을 생성, 삭제 또는 변경할 수 있는 DDL(데이터 정의 언어) 문을 실행합니다. DDL 문은 ASSL(Analysis Services Scripting Language) 문으로 표현되고 XMLA(XML for Analysis) 명령에 포함됩니다.
이 작업에 대한 자세한 내용은 Analysis Services DDL 실행 작업을 참조하십시오. XMLA를 사용하여 Analysis Services 개체를 생성 및 변경하는 방법은 Creating and Altering Objects (XMLA)을 참조하십시오.
Analysis Services 처리 작업
Analysis Services 처리 작업은 마이닝 모델과 같은 Analysis Services 개체의 처리를 자동화합니다.
이 작업에 대한 자세한 내용은 Analysis Services 처리 작업을 참조하십시오. Analysis Services 개체를 처리하는 방법은 Analysis Services에서의 처리를 참조하십시오.
데이터 마이닝 쿼리 작업
데이터 마이닝 쿼리 작업은 Analysis Services에서 작성된 데이터 마이닝 모델을 기반으로 예측 쿼리를 실행합니다. 예측 쿼리는 마이닝 모델을 사용하여 새 데이터에 대한 예측을 만들고 해당 출력을 테이블에 저장합니다.
이 작업에 대한 자세한 내용은 데이터 마이닝 쿼리 작업을 참조하십시오. DMX를 사용하여 데이터 마이닝 모델을 쿼리하는 방법은 DMX 예측 쿼리 만들기를 참조하십시오.
데이터 흐름 변환
변환은 패키지의 데이터 흐름에서 데이터를 집계, 병합, 배포 및 수정하는 구성 요소입니다.
데이터 마이닝 쿼리 변환
데이터 마이닝 쿼리 변환은 데이터 마이닝 모델과 비교해서 예측 쿼리를 수행합니다. 이 변환에는 DMX(Data Mining Extensions) 쿼리를 만들기 위한 쿼리 작성기가 포함되어 있습니다. 쿼리 작성기를 사용하면 DMX 언어를 사용하는 기존 마이닝 모델과 비교해서 변환 입력 데이터를 평가하는 사용자 지정 문을 만들 수 있습니다. 출력을 테이블에 직접 저장하는 데이터 마이닝 쿼리 작업과 달리 데이터 마이닝 쿼리 변환은 패키지 데이터 흐름의 다운스트림 구성 요소에 해당 출력을 사용할 수 있게 합니다.
이 변환에 대한 자세한 내용은 데이터 마이닝 쿼리 변환을 참조하십시오. DMX를 사용하여 데이터 마이닝 모델을 쿼리하는 방법은 DMX 예측 쿼리 만들기를 참조하십시오.
데이터 흐름 대상
대상은 데이터 흐름의 출력을 다른 유형의 데이터 원본으로 로드하거나 메모리 내 데이터 집합을 만드는 데이터 흐름 구성 요소입니다.
데이터 마이닝 모델 성향 습득 대상
데이터 마이닝 모델 성향 습득 대상은 데이터 마이닝 모델 알고리즘을 통해 대상에서 수신하는 데이터를 전달함으로써 데이터 마이닝 모델의 성향을 습득합니다. 성향 습득 프로세스 진행 중 이 알고리즘은 데이터 요소 간의 패턴과 관계를 계산합니다. 새 마이닝 모델의 성향을 습득한 후에는 모델을 사용하여 예측 쿼리를 실행할 수 있습니다.
자세한 내용은 데이터 마이닝 모델 성향 습득 대상을 참조하십시오.
데이터 마이닝을 위한 다른 Integration Services 구성 요소
Integration Services에는 데이터 마이닝 솔루션의 일부로 유용할 수 있는 여러 다른 구성 요소가 있습니다.
- 데이터 하위 집합을 가진 데이터 마이닝 모델에 대한 성향 습득 또는 테스트를 수행하려면 다음을 사용합니다.
- 중복 항목을 제거하고 값을 표준화하여 데이터를 정리하려면 다음을 사용합니다.
- **정렬 변환. **데이터를 정렬하는 동안 중복된 행을 제거합니다. 자세한 내용은 정렬 변환을 참조하십시오.
- **유사 항목 그룹화 변환. **정확하게 일치하는 항목이 아니라 유사한 항목을 기준으로 행을 그룹화합니다. 자세한 내용은 유사 항목 그룹화 변환 및 방법: 유사 항목 그룹화 변환을 사용하여 유사한 데이터 행 식별을 참조하십시오.
- **유사 항목 조회 변환. **정확하게 일치하는 항목이 아니라 유사한 항목을 기준으로 참조 테이블에서 일치하는 항목을 찾습니다. 자세한 내용은 유사 항목 조회 변환을 참조하십시오.
- 텍스트 마이닝을 수행하려면 다음을 사용합니다.
참고 항목
개념
Analysis Services와 함께 Integration Services 사용
관련 자료
다른 SQL Server 기능과 함께 Integration Services 사용