마이닝 모델의 정확도를 테스트하고 결과에 만족한다고 결정한 후 데이터 마이닝 디자이너의 마이닝 모델 예측 탭에서 예측 쿼리 작성기를 사용하여 예측을 생성할 수 있습니다.
예측 쿼리 작성기에는 세 가지 보기 방식이 있습니다. 디자인 및 쿼리 뷰를 사용하여 쿼리를 빌드하고 검사할 수 있습니다. 그런 다음 쿼리를 실행하고 결과 보기에서 결과를 볼 수 있습니다.
모든 예측 쿼리는 DMX(데이터 마이닝 확장) 언어에 짧은 DMX를 사용합니다. DMX에는 T-SQL과 같은 구문이 있지만 데이터 마이닝 개체에 대한 쿼리에 사용됩니다. DMX 구문은 복잡하지는 않지만, 이와 같은 쿼리 작성기 또는 Office용 SQL Server 데이터 마이닝 Add-Ins 사용하면 입력을 선택하고 식을 빌드하는 것이 훨씬 쉬워지므로 기본 사항을 배우는 것이 좋습니다.
쿼리 만들기
예측 쿼리를 만드는 첫 번째 단계는 마이닝 모델 및 입력 테이블을 선택하는 것입니다.
모델 및 입력 테이블을 선택하려면
데이터 마이닝 디자이너의 마이닝 모델 예측 탭의 마이닝 모델 상자에서 모델 선택을 클릭합니다.
마이닝 모델 선택 대화 상자에서 트리를 탐색하여 대상 메일 구조로 이동하고, 구조를 확장하고, 선택한
TM_Decision_Tree다음 확인을 클릭합니다.입력 테이블 선택 상자에서 사례 테이블 선택을 클릭합니다.
테이블 선택 대화 상자의 데이터 원본 목록에서 데이터 원본 뷰 Adventure Works DW 다차원 2012를 선택합니다.
테이블/뷰 이름에서 ProspectiveBuyer(dbo) 테이블을 선택한 다음 확인을 클릭합니다.
이 테이블은
ProspectiveBuyervTargetMail 사례 테이블과 가장 유사합니다.
열 매핑
입력 테이블을 선택하면 예측 쿼리 작성기가 열의 이름을 기반으로 마이닝 모델과 입력 테이블 간에 기본 매핑을 만듭니다. 구조체에서 하나 이상의 열이 외부 데이터의 열과 일치해야 합니다.
중요합니다
모델의 정확도를 결정하는 데 사용하는 데이터에는 예측 가능한 열에 매핑할 수 있는 열이 포함되어야 합니다. 이러한 열이 없으면 빈 값으로 열 하나를 만들 수 있지만 예측 가능한 열과 동일한 데이터 형식이 있어야 합니다.
입력을 모델에 매핑하려면
마이닝 모델 창을 입력 테이블 선택 창에 연결하는 줄을 마우스 오른쪽 단추로 클릭하고 연결 수정을 선택합니다.
모든 열이 매핑되는 것은 아님을 유의하십시오. 여러 테이블 열에 대한 매핑을 추가합니다. 또한 열이 더 잘 일치할 수 있도록 현재 날짜 열을 기반으로 새 생년월일 열을 생성합니다.
표 열 아래에서
Bike Buyer셀을 클릭한 후 드롭다운에서 ProspectiveBuyer.Unknown을 선택합니다.예측 가능한 열 [Bike Buyer]를 입력 테이블 열에 매핑합니다.
OK를 클릭합니다.
솔루션 탐색기에서 대상 메일링 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭하고 뷰 디자이너를 선택합니다.
ProspectiveBuyer 테이블을 마우스 오른쪽 버튼으로 클릭하고 새 명명된 계산을 선택합니다.
명명된 계산 만들기 대화 상자에서 열 이름에 대해 .를 입력합니다
calcAge.설명의 경우 생년월일을 기준으로 나이 계산을 입력합니다.
식 상자에 입력
DATEDIFF(YYYY,[BirthDate],getdate())한 다음 확인을 클릭합니다.입력 테이블에 모델에 해당하는 Age 열이 없으므로 이 식을 사용하여 입력 테이블의 BirthDate 열에서 고객 연령을 계산할 수 있습니다. Age는 자전거 구매를 예측하는 데 가장 영향력 있는 열로 확인되었으므로 모델과 입력 테이블 모두에 존재해야 합니다.
데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 선택하고 연결 수정 창을 다시 엽니다.
표 열 아래의 Age 셀을 클릭하고 드롭다운에서 ProspectiveBuyer.calcAge를 선택합니다.
경고
목록에 열이 표시되지 않으면 디자이너에 로드된 데이터 원본 뷰의 정의를 새로 고쳐야 할 수 있습니다. 이렇게 하려면 [파일 ] 메뉴에서 [모두 저장]을 선택한 다음 디자이너에서 프로젝트를 닫고 다시 엽니다.
OK를 클릭합니다.
예측 쿼리 디자인
마이닝 모델 예측 탭의 도구 모음에 있는 첫 번째 단추는 디자인 보기로 전환/결과 보기로 전환/쿼리 보기로 전환 단추입니다. 이 단추에서 아래쪽 화살표를 클릭하고 디자인을 선택합니다.
마이닝 모델 예측 탭의 표에서 원본 열의 첫 번째 빈 행에 있는 셀을 클릭한 다음 예측 함수를 선택합니다.
예측 함수 행의 필드 열에서 .를 선택합니다
PredictProbability.같은 행의 별칭 열에 결과의 확률을 입력합니다.
위의 마이닝 모델 창에서 [Bike Buyer]를 선택하고 조건/인수 셀로 끌어옵니다.
놓으면 [TM_Decision_Tree]. [Bike Buyer]가 Criteria/Argument 셀에 나타납니다.
함수의 대상 열을 지정합니다
PredictProbability. 함수에 대한 자세한 내용은 DMX(데이터 마이닝 확장) 함수 참조를 참조하세요.원본 열에서 다음 빈 행을 클릭한 다음 TM_Decision_Tree 마이닝 모델을 선택합니다.
TM_Decision_Tree행의 필드 열에서Bike Buyer을 선택합니다.TM_Decision_Tree행의 조건/인수 열에=1을 입력합니다.원본 열에서 다음 빈 행을 클릭한 다음, ProspectiveBuyer 테이블을 선택합니다.
행의
ProspectiveBuyer필드 열에서 ProspectiveBuyerKey를 선택합니다.이렇게 하면 자전거 구입 가능성이 없는 사용자와 사용자를 식별할 수 있도록 예측 쿼리에 고유 식별자가 추가됩니다.
표에 5개의 행을 더 추가합니다. 각 행에 대해 ProspectiveBuyer 테이블을 소스로 선택한 다음, 필드 셀에 다음 열을 추가합니다.
calcAge // 나이 계산
성씨
이름 (FirstName)
주소 줄 1
AddressLine2
마지막으로 쿼리를 실행하고 결과를 찾습니다.
예측 쿼리 작성기에도 다음 컨트롤이 포함됩니다.
확인란 표시
디자이너에서 절을 삭제하지 않고도 쿼리에서 절을 제거할 수 있습니다. 이 기능은 복잡한 쿼리를 사용하고 DMX를 복사하여 창에 붙여넣지 않고도 구문을 유지하려는 경우에 유용할 수 있습니다.
그룹
선택한 줄의 시작 부분에 여는 괄호(왼쪽)를 삽입하거나 현재 줄 끝에 닫는(오른쪽) 괄호를 삽입합니다.
AND/OR
AND현재 함수 또는 열 바로 뒤에 연산자 또는OR연산자를 삽입합니다.
쿼리를 실행하고 결과를 보려면
마이닝 모델 예측 탭에서 결과 단추를 선택합니다.
쿼리가 실행되고 결과가 표시되면 결과를 검토할 수 있습니다.
마이닝 모델 예측 탭에는 자전거 구매자가 될 가능성이 있는 잠재 고객을 위한 연락처 정보가 표시됩니다. 결과 열의 확률은 예측이 정확할 확률을 나타냅니다. 이러한 결과를 사용하여 메일을 대상으로 지정할 잠재 고객을 결정할 수 있습니다.
이 시점에서 결과를 저장할 수 있습니다. 세 가지 옵션이 있습니다.
결과에서 데이터 행을 마우스 오른쪽 단추로 클릭하고 복사 를 선택하여 해당 값(및 열 머리글)만 클립보드에 저장합니다.
결과에서 행을 마우스 오른쪽 단추로 클릭하고 모두 복사 를 선택하여 열 머리글을 포함한 전체 결과 집합을 클립보드에 복사합니다.
쿼리 결과 저장을 클릭하여 다음과 같이 결과를 데이터베이스에 직접 저장합니다.
데이터 마이닝 쿼리 결과 저장 대화 상자에서 데이터 원본을 선택하거나 새 데이터 원본을 정의합니다.
쿼리 결과를 포함할 테이블의 이름을 입력합니다.
DSV에 추가 옵션을 사용하여 테이블을 만들고 기존 데이터 원본 뷰에 추가합니다. 이는 학습 데이터, 예측 원본 데이터 및 쿼리 결과와 같은 모델에 대한 모든 관련 테이블을 동일한 데이터 원본 뷰에 유지하려는 경우에 유용합니다.
기존 테이블이 있을 경우 덮어쓰기 옵션을 사용하여 최신 결과로 업데이트합니다.
예측 쿼리에 열을 추가하거나, 예측 쿼리에 있는 열의 이름 또는 데이터 형식을 변경했거나, 대상 테이블에서 ALTER 문을 실행한 경우 테이블을 덮어쓰는 옵션을 사용해야 합니다.
또한 여러 열의 이름이 같은 경우(예: 기본 열 이름 식) 이름이 중복된 열에 대한 별칭을 만들어야 합니다. 그렇지 않으면 디자이너가 SQL Server에 결과를 저장하려고 할 때 오류가 발생합니다. 그 이유는 SQL Server에서 여러 열의 이름이 같은 것을 허용하지 않기 때문입니다.
수업의 다음 과제
구조 데이터에 드릴스루 사용(기본 데이터 마이닝 자습서)