다음을 통해 공유


태스크 2: 일치 정책 테스트 및 게시

이 작업에서는 Remove Duplicate Suppliers 일치 정책을 테스트하고 게시합니다.

  1. 일치 결과 페이지에서 시작을 클릭하여 전체 정책을 테스트합니다. 여기에서는 정책에 규칙이 하나만 있으므로 규칙 및 정책을 테스트한 결과가 동일합니다.

  2. 모든 일치 레코드 및 일치 점수를 목록 상자에서 검토합니다. 녹색 아이콘이 연결된 레코드는 이 앞에 있는 피벗 레코드의 중복 항목입니다. 이에 대한 몇 가지 예는 다음과 같습니다.

    1. Record ID: 1000005 레코드와 Record Id: 1000004 레코드는 SupplierID(필수 구성 요소), Supplier NameContactEmailAddress 열의 값이 모두 동일하기 때문에 서로 일치하며 **Score: 100%**입니다. DQS는 클러스터의 피벗 레코드로 아무 레코드나 선택합니다.

    2. 1000023 레코드와 1000022 레코드는 SupplierID(필수 구성 요소)Supplier Name 열의 값이 동일하지만 ContactEmailAddress 열의 값이 다르기 때문에 서로 일치하더라도 일치 점수가 93%입니다.

    3. 목록 아래쪽으로 스크롤해서 레코드 ID가 10000511000052인 두 레코드를 표시합니다. 이 두 레코드는 SupplierIDContactEmailAddress 열의 값이 동일하지만 Supplier Name 열의 값이 다르기 때문에 1000052 레코드는 일치 항목으로 간주되며 일치 점수가 **91%**입니다.

    정책 정의 - 정책 결과

  3. 일치하는 레코드(녹색 아이콘)를 마우스 오른쪽 단추로 클릭하고 세부 정보 보기를 클릭하여 전체 일치 점수에 각 필드 점수가 기여하는 정도와 같은 추가 세부 정보를 확인합니다.

    일치 점수 정보 대화 상자

  4. 닫기를 클릭하여 일치 점수 정보 대화 상자를 닫습니다.

  5. 페이지 하단에서 일치 결과 탭을 클릭합니다. 이 탭에는 일치한 레코드 수, 일치하지 않은 레코드 수, 일치한 레코드가 포함된 클러스터 수, 평균 클러스터 크기, 최소 클러스터 크기 및 최대 클러스터 크기와 같은 세부 정보가 표시됩니다. 자세한 내용은 일치 정책 만들기를 참조하십시오. 이 작업에서는 결과를 내보낼 수 없습니다. 여기에서는 예제 데이터에 대해 규칙 및 정책을 테스트하기 위해 예제 데이터를 사용하여 일치 정책을 정의하기만 합니다.

    일치 결과 탭

  6. 마침을 클릭하여 일치 정책 만들기를 마칩니다.

    [!참고]

    여기에서는 일치 정책을 정의했습니다. 따라서 결과를 출력 파일로 내보낼 수 없습니다. 기본적으로 정책 정의를 위해 예제 입력 파일을 사용하고, 규칙을 만들고, 예제 데이터에 대해 규칙 및 정책을 테스트했습니다.

  7. SQL Server Data Quality Services 대화 상자에서 게시를 클릭하고 메시지 상자에서 확인을 클릭합니다. 그러면 사용자가 정의한 일치 정책이 Suppliers 기술 자료에 게시됩니다. 이 기술 자료를 사용해서 입력 파일에 대해 일치 프로세스를 실행하여 중복 항목을 식별하고 제거할 수 있습니다.

다음 단계

태스크 3: 일치에 대한 데이터 품질 프로젝트 만들기 및 실행