다음을 통해 공유


기술 자료 검색 수행

이 항목에서는 기술 자료 검색을 통해 기술 자료를 구축하는 방법에 대해 설명합니다. 검색 프로세스에서 DQS(Data Quality Services)는 컴퓨터 기반 프로세스를 통해 예제 데이터 원본의 데이터를 분석해서 얻은 정보를 기술 자료에 추가합니다. 이러한 정보는 기술 자료 검색 작업의 도메인 값 관리 단계 또는 도메인 관리 작업에서 수정하고 개선할 수 있습니다.

기술 자료 검색은 마법사 기반 프로세스로, 각각 완료되어야 하는 3단계를 포함합니다.

항목 내용

  • 시작하기 전에

    필수 구성 요소

    보안

  • 첫 번째 단계: 기술 자료 검색 시작

  • 매핑 단계

  • 검색 단계

  • 데이터 검색 결과 관리 단계

  • 후속 작업: 기술 자료 검색 수행 후

  • 올바름, 오류, 유효하지 않음 값의 의미

  • 적절한 값을 표시하는 방법

  • 프로파일러 통계

시작하기 전 주의 사항

필수 구성 요소

검색을 실행하려는 원본 데이터가 Excel 파일 형식일 경우 Data Quality 클라이언트 컴퓨터에 Microsoft Excel을 설치해야 합니다. 그렇지 않으면 매핑 단계에서 Excel 파일을 선택할 수 없습니다. Microsoft Excel에서 만든 파일은 .xlsx, .xls 또는.csv 확장명을 가질 수 있습니다. 64비트 버전의 Excel이 사용된 경우 Excel 2003 파일 (.xls)만 지원됩니다. Excel 2007 또는 2010 파일(.xlsx)은 지원되지 않습니다. 64비트 버전의 Excel 2007 또는 2010을 사용 중인 경우 파일을 .xls 파일 또는 .csv 파일로 저장하거나 32비트 버전의 Excel을 대신 설치하십시오.

보안

사용 권한

기술 자료를 만들려면 DQS_MAIN 데이터베이스에 대한 dqs_kb_editor 또는 dqs_administrator 역할이 있어야 합니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

첫 번째 단계: 기술 자료 검색 시작

  1. Data Quality 클라이언트를 시작합니다. 방법은 다음을 참조하십시오. 데이터 품질 클라이언트 응용 프로그램 실행.

  2. 새 기술 자료에서 기술 자료 검색을 수행하려면 새 기술 자료를 클릭하고, 이름과 설명을 입력하고, 기술 자료의 기반으로 사용할 데이터를 지정합니다(해당하는 경우). 기존 기술 자료에서 기술 자료 검색을 수행하려면 기술 자료 열기를 클릭한 다음 특정 기술 자료를 선택합니다.

  3. 기술 자료 검색을 작업으로 선택한 다음 만들기를 클릭하여 새 기술 자료를 만들거나 열기를 클릭하여 기존 기술 자료를 엽니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

매핑 단계

  1. 데이터 원본 필드에서 SQL Server(기본값) 또는 Excel 파일을 선택합니다.

    [!참고]

    이 페이지에서 SQL Server 또는 Excel 데이터 원본에 연결한 다음 데이터 원본의 열과 기술 자료의 도메인을 매핑합니다. 매핑 테이블에 정보를 해당 도메인에 추가하기 위해 분석할 원본 데이터베이스의 모든 열이 표시됩니다. 데이터 원본의 열과 기술 자료의 도메인이 매핑됩니다.

  2. 데이터 원본이 SQL Server인 경우 다음과 같이 계속합니다.

    1. 데이터베이스 필드에서 기술 자료를 만들기 위해 분석할 원본 데이터베이스를 선택합니다. 텍스트 상자 드롭다운에 사용할 수 있는 데이터베이스가 나열됩니다. 원본 데이터베이스는 Data Quality 서버와 동일한 SQL Server 인스턴스에 있어야 합니다. 그렇지 않으면 드롭다운 목록에 나타나지 않습니다.

    2. 테이블/뷰 필드에서 기술 자료를 만들기 위해 분석할 테이블 또는 뷰를 선택합니다. 이 테이블 또는 뷰는 데이터 정리 또는 일치를 수행하는 전체 원본 데이터베이스가 아니라 예제 데이터여야 합니다. 텍스트 상자 드롭다운에 선택한 데이터베이스에 사용할 수 있는 테이블 및 뷰가 나열됩니다.

  3. 데이터 원본이 Excel인 경우 다음과 같이 계속합니다.

    1. 찾아보기를 클릭하고 기술 자료를 만들기 위해 분석할 Excel 파일을 선택합니다. Excel 파일을 선택하려면 Data Quality 클라이언트 컴퓨터에 Excel이 설치되어 있어야 합니다. Data Quality 클라이언트 컴퓨터에 Excel이 설치되지 않은 경우 찾아보기 단추를 사용할 수 없으며 이 텍스트 상자 아래에 Excel이 설치되어 있지 않다는 알림이 표시됩니다.

    2. Excel 파일의 첫 행에 머리글 데이터가 들어 있는 경우 첫 번째 행을 헤더로 사용하십시오 확인란을 선택합니다.

  4. 매핑 테이블에서 다음과 같이 기술 자료 검색을 수행할 각 원본 열을 기술 자료의 도메인에 매핑합니다.

    1. 도메인이 있는 경우 빈 행의 원본 열 열에 대한 드롭다운 목록에서 원본 열을 선택한 다음 동일한 행의 도메인 열에 대한 드롭다운 목록에서 도메인을 선택하여 매핑을 만듭니다. 도메인이 없는 경우 도메인 만들기 또는 복합 도메인 만들기를 클릭하여 도메인을 만듭니다. 자세한 내용은 도메인 규칙 만들기 또는 복합 도메인 만들기를 참조하십시오.

    2. 각 매핑에 대해 이전 단계를 반복합니다. 테이블의 행 수를 변경하려면 열 매핑 추가를 클릭하거나 특정 행을 선택하고 선택한 열 매핑 제거를 클릭합니다. 채워진 행이 선택되었을 때 선택한 열 매핑 제거를 클릭하면 채워지지 않은 행이 있는 경우에도 선택된 행이 삭제됩니다.

      [!참고]

      원본 데이터 형식이 DQS에서 지원되고 DQS 도메인 데이터 형식과 일치하는 경우에만 데이터 기술 자료 검색을 수행하기 위해 DQS 도메인에 원본 데이터를 매핑할 수 있습니다. 지원되는 데이터 형식에 대한 자세한 내용은 DQS 도메인에 대해 지원되는 SQL Server 및 SSIS 데이터 형식을 참조하십시오.

    3. 정의된 복합 도메인을 표시하려면 복합 도메인 보기/선택을 클릭합니다. 복합 도메인이 정의되지 않은 경우 컨트롤을 사용할 수 없습니다.

    4. 테이블/뷰 또는 Excel 파일 텍스트 상자에서 선택한 데이터 원본의 모든 데이터를 팝업에 표시하려면 데이터 원본 미리 보기를 클릭합니다.

  5. 다음을 클릭하여 기술 자료 검색 마법사의 검색 페이지로 이동합니다. 다음을 선택할 수도 있습니다.

    • 작업 내용이 손실되어도 기술 자료 검색 작업을 종료하고 DQS 홈 페이지로 돌아가려면 취소를 클릭합니다.

    • 작업 내용을 저장하고 DQS 홈 페이지로 돌아가려면 닫기를 클릭합니다. 기술 자료가 잠기며 기술 자료 열기 화면의 기술 자료 테이블에서 기술 자료의 상태는 검색 - 매핑이 됩니다. 닫기를 클릭한 후 도메인 관리 작업을 수행하려면 기술 자료 열기 화면에서 기술 자료 검색을 클릭하고 기술 자료 관리: 도메인 용어 관리 화면으로 이동한 다음 마침을 클릭하고 를 클릭하여 기술 자료를 게시하거나 아니요를 클릭하여 기술 자료에 대한 작업 내용을 저장하고 끝내야 합니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

검색 단계

  1. 시작을 클릭하여 데이터 원본을 분석합니다.

    [!참고]

    검색은 페이지의 매핑 테이블에서 입력한 열에 대해 수행됩니다. 각 열에 매핑되는 도메인은 검색에서 얻은 정보로 채워집니다. 도메인이 복합 도메인일 경우 복합 도메인을 구성하는 개별 도메인에 정보가 추가됩니다.

  2. 검색 프로세스가 실행 중일 때 각 검색 단계 레코드 전처리 중, 도메인 규칙 실행 중검색 실행 중에 대해 표시되는 완료 상태를 확인합니다. 이러한 각 단계에 대해 완료율과 완료 상태가 표시됩니다.

  3. 분석이 완료되면 완료 통계 아래 상태 줄에 완료되었다는 메시지가 표시되는지 확인합니다.

    [!참고]

    파일이 업로드되기 전에 화면에서 나가면 파일 업로드 프로세스가 종료됩니다.

  4. 분석이 완료된 후 프로파일러 탭에서 통계를 확인하여 데이터의 상태를 봅니다. 자세한 내용은 DQS의 데이터 프로파일링 및 알림을 참조하십시오.

  5. 분석이 완료되면 시작 단추가 다시 시작 단추로 바뀝니다. 분석 프로세스를 다시 실행하려면 다시 시작을 클릭합니다. 그러나 이전 분석의 결과가 아직 저장되지 않은 경우 다시 시작을 클릭하면 이전 데이터가 손실됩니다. 계속하려면 팝업에서 를 클릭합니다. 분석이 실행 중일 때는 페이지에서 나가지 마십시오. 그러면 분석 프로세스가 종료됩니다.

  6. 다음을 클릭하여 기술 자료 검색 마법사의 도메인 값 관리 페이지로 이동합니다. 이 페이지에서 정보 자료의 도메인에 추가된 정보를 수정할 수 있습니다. 다음을 선택할 수도 있습니다.

    • 작업 내용이 손실되어도 기술 자료 검색 작업을 종료하고 DQS 홈 페이지로 돌아가려면 취소를 클릭합니다.

    • 작업 내용을 저장하고 DQS 홈 페이지로 돌아가려면 닫기를 클릭합니다. 기술 자료가 잠기며 기술 자료 열기 화면의 기술 자료 테이블에서 기술 자료의 상태는 검색 - 검색이 됩니다. 닫기를 클릭한 후 도메인 관리 작업을 수행하려면 기술 자료 열기 화면에서 기술 자료 검색을 클릭하고 기술 자료 관리: 도메인 용어 관리 화면으로 이동한 다음 마침을 클릭하고 를 클릭하여 기술 자료를 게시하거나 아니요를 클릭하여 기술 자료에 대한 작업 내용을 저장하고 끝내야 합니다.

    • 검색 페이지로 돌아가려면 클릭합니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

데이터 검색 결과 관리 단계

기술 자료 검색 작업을 수행한 후 다음과 같이 값을 변경할 수 있습니다.

  • 값 목록에 도메인 값을 추가하거나 특정 값을 선택하고 목록에서 삭제합니다.

  • 도메인 값의 상태를 DQS 검색 프로세스를 통해 지정된 상태에서 올바름, 오류 또는 유효하지 않음 상태로 변경합니다.

  • 오류가 있거나 유효하지 않은 값의 대체 값을 입력합니다.

  • 도메인을 만들 때 선행 값 사용 속성을 설정한 경우 둘 이상의 값을 동의어로 설정하고, 검색 프로세스에서 설정된 선행 값을 변경하여 선행 값이 동의어 값을 대체하도록 합니다.

  • Excel 파일에서 도메인 값을 가져옵니다.

테이블에는 단일 도메인의 기술 자료에 추가된 정보가 표시됩니다. 왼쪽 창의 도메인 목록에서 도메인을 선택합니다. 필드의 열은 다음과 같습니다.

  • 열에는 검색 프로세스에서 데이터 예제의 필드에서 선택된 도메인에 추가한 모든 값이 표시됩니다. 오류가 있는 것으로 추정되는 모든 값은 올바른 것으로 추정되는 값의 동의어로 표시됩니다.

  • 빈도 열에는 도메인이 매핑된 예제 데이터베이스 필드 값의 인스턴스 수가 표시됩니다. 복합 도메인의 경우 빈도가 20 보다 크거나 같은 해당 값만 표시됩니다. 빈도 데이터는 기술 자료 검색 프로세스가 아직 예제 데이터베이스에 연결되어 있는 경우에 사용할 수 있습니다. 도메인 관리 화면의 도메인 값 탭에 있는 도메인 테이블에서는 도메인 관리 프로세스가 예제 데이터베이스에 연결되어 있지 않기 때문에 빈도 데이터를 사용할 수 없습니다.

  • 형식 열에는 검색 프로세스에 의해 확인된 값의 상태가 표시됩니다. 녹색 확인 표시는 해당 값이 올바르거나 수정된 것임을, 빨간색 십자 표시는 해당 값에 오류가 있음을, 느낌표가 있는 주황색 삼각형은 해당 값이 유효하지 않음을 나타냅니다. 유효하지 않은 값은 도메인의 데이터 요구 사항에 맞지 않는 값입니다. 오류가 있는 값은 유효할 수도 있지만 데이터에 올바른 값은 아닙니다.

  • 다음으로 수정 열에는 오류가 있거나 유효하지 않은 것으로 표시된 원본 값이 변경될 올바른 대상 값이 표시됩니다. DQS는 검색 프로세스의 결과로 올바른 값을 제안할 수 있습니다.

검색 결과는 다음과 같이 관리합니다.

  1. 왼쪽의 도메인 목록 창에서 도메인 값을 설정할 도메인을 선택합니다. 다음과 같은 작업을 수행하여 표시된 값을 수정할 수 있습니다.

    • 필터 목록에서 상태를 선택하여 결과의 상태에 따라 테이블에서 원하는 결과를 표시합니다.

    • 찾기 입력란에 검색할 문자를 하나 이상 입력하여 확인하거나 수정할 데이터를 찾습니다. 이렇게 하면 표시된 모든 값에서 이러한 문자가 있는 모든 위치가 강조 표시됩니다.

    • 테이블에 표시되는 값을 이전 세션이 아닌 현재 세션에서 검색된 값으로만 제한하려면 새 항목만 표시를 클릭합니다.

    • 현재 축소된 상태에서 모든 동의어 그룹의 모든 값을 표시하려면 모두 확장 단추를 클릭하고, 현재 확장된 상태에서 모든 동의어 그룹의 선행 값을 제외한 모든 값을 숨기려면 모두 축소 단추를 클릭합니다.

    • 값 테이블 아래쪽에 도메인 값 컬렉션에 대한 최근의 변경 내용을 보여 주는 미리 보기 팝업을 표시하려면 도메인 값 변경 기록 패널 표시/숨기기를 클릭합니다.

  2. 필터오류로 설정하여 Data Quality Services에서 제안한 모든 수정 사항을 찾습니다. 실제로 값에 오류가 있고 다음으로 수정 열의 값이 적절한지 확인합니다.

  3. 필터모든 값으로 설정하고 값의 상태가 적절한지 확인합니다. 값의 상태를 변경하려면 값을 선택한 다음 선택한 도메인 값을 수정된 값으로 설정(확인 표시) 단추, 선택한 도메인 값을 오류로 설정(십자 표시) 단추 또는 선택한 도메인 값을 잘못된 값으로 설정(삼각형) 단추를 클릭합니다.

  4. 값의 상태를 변경하려면 다음과 같이 계속합니다.

    1. 선택한 도메인 값을 수정된 값으로 설정: 값의 상태를 오류 또는 유효하지 않음에서 올바름으로 변경하려면 아이콘 표시줄의 아래쪽 화살표 또는 형식 드롭다운 목록에서 값을 선택한 다음 선택한 도메인 값을 수정된 값으로 설정을 클릭합니다. 오류가 있거나 유효하지 않은 값이 올바른 값과 그룹화된 경우 작업 후 값을 삭제하십시오.

    2. 선택한 도메인 값을 오류로 설정: 값의 상태를 올바름 또는 유효하지 않음에서 오류로 변경하려면 아이콘 표시줄의 아래쪽 화살표 또는 형식 드롭다운 목록에서 값을 선택한 다음 선택한 도메인 값을 오류로 설정(십자 표시) 아이콘을 클릭합니다. 다음으로 수정 열에 수정 사항을 입력하거나 값을 비워 둘 수 있습니다.

    3. 선택한 도메인 값을 잘못된 값으로 설정: 값의 상태를 올바름 또는 오류에서 유효하지 않음으로 변경하려면 아이콘 표시줄의 아래쪽 화살표 또는 형식 드롭다운 목록에서 값을 선택한 다음 선택한 도메인 값을 잘못된 값으로 설정(삼각형) 아이콘을 클릭합니다. 다음으로 수정 열에 수정 사항을 입력하거나 값을 비워 둘 수 있습니다.

    4. 다음으로 수정: 값을 오류가 있거나 유효하지 않은 것으로 설정한 후에는 다음으로 수정 열에 새 값을 입력합니다. DQS에서 대체 값에 대한 새 행을 추가하고 이 값을 올바른 것으로 지정한 다음 두 값을 그룹화합니다. 새 값이 선행 값으로 표시되고, 선행 값은 굵게 표시되고 오류가 있거나 유효하지 않은 값은 들여쓰기로 표시됩니다.

  5. 여러 값을 동의어 그룹으로 지정하려면 올바른 여러 값을 선택한 후 다음과 같이 계속합니다.

    • 선택한 도메인 값을 동의어로 설정: 선택한 값을 동의어로 설정하려면 클릭합니다. DQS에서 값 중 하나를 나머지 값을 대체할 선행 값으로 지정합니다.

      [!참고]

      그룹 내부의 값을 두 개 이상 선택하고 그룹 외부의 다른 값을 선택한 다음 이러한 값을 동의어로 설정하면 잘못되었다는 오류 메시지가 표시됩니다. 오류 메시지 팝업을 닫으면 값이 동의어로 올바르게 설정됩니다.

    • 선택한 동의어 간의 관계 끊기: 동의어 지정을 실행 취소하려면 클릭합니다.

    • 선택한 도메인 값을 그룹의 선행 값으로 설정: 그룹에서 선행 값으로 지정되지 않은 값을 선택한 다음 선택한 도메인 값을 그룹의 선행 값으로 설정 단추를 클릭하여 그룹의 선행 값을 변경합니다.

  6. 맞춤법 검사기: 도메인 속성 페이지에서 맞춤법 검사기를 활성화한 경우 맞춤법 검사기에서 수정 사항을 제안하는 표시인 빨강 물결선 밑줄이 있는 값을 찾으십시오. 밑줄이 표시된 값을 마우스 오른쪽 단추로 클릭하고 해당하는 수정 사항을 선택합니다. 값 형식이 오류로 변경 또는 유지되고 수정 사항이 다음으로 수정 열에 추가됩니다. 제안된 수정 사항을 더 보려면 아래쪽 화살표를 클릭합니다. 수정 사항을 직접 입력하여 맞춤법 검사기 사전에 추가한 후 수정 사항으로 선택할 수 있습니다. 자세한 내용은 DQS 맞춤법 검사기 사용도메인 속성 설정을 참조하십시오.

    [!참고]

    맞춤법 검사기를 사용하려면 도메인 속성 페이지에서 맞춤법 검사기를 활성화하면 됩니다. 도메인 속성 페이지에서 맞춤법 검사기가 비활성화된 경우 데이터 검색 결과 관리 페이지에서 맞춤법 검사기를 설정/해제합니다 아이콘을 클릭하여 활성화할 수 있습니다.

  7. 새 도메인 값 추가: 테이블의 끝에 행을 추가하려면 새 도메인 값 추가 단추를 클릭하여 도메인에 새 값을 추가합니다. 값을 입력하면 행의 위치가 사전순으로 변경됩니다.

  8. Excel에서 도메인 값 가져오기: 값 가져오기 아이콘에 대해 아래쪽 화살표를 클릭한 다음 Excel에서 도메인 값 가져오기를 선택하여 Excel 스프레드시트에서 새 값을 추가합니다. 파일 이름을 입력하고 해당하는 경우 첫 번째 행을 헤더로 사용하십시오를 선택한 다음 확인을 클릭합니다. 자세한 내용은 Excel 파일에서 도메인으로 값 가져오기를 참조하십시오.

  9. 프로젝트 값 가져오기: 값 가져오기 아이콘에 대해 아래쪽 화살표를 클릭하고 프로젝트 값 가져오기를 선택하여 데이터 품질 프로젝트에서 새 값을 추가합니다. 파일 이름을 입력하고 해당하는 경우 첫 번째 행을 헤더로 사용하십시오를 선택한 다음 확인을 클릭합니다. 값을 가져올 프로젝트를 선택한 후 확인을 클릭합니다. 가져온 값이 표시됩니다. 마침을 클릭합니다. 자세한 내용은 도메인에 프로젝트 값 가져오기를 참조하십시오.

  10. 선택한 도메인 값 삭제: 값을 선택한 다음 선택한 도메인 값 삭제 단추를 클릭하여 하나 이상의 기존 값을 도메인에서 제거합니다. DQS_NULL 항목은 삭제할 수 없으므로 삭제할 값을 여러 개 선택한 경우 그중 DQS_NULL 항목이 포함되어 있으면 작업이 실패합니다.

  11. 마침을 클릭하여 기술 자료 검색 작업을 완료합니다. 각각의 도메인을 검토하지 않은 경우 팝업이 표시됩니다. 를 클릭하여 검토를 계속하거나 아니요를 클릭하여 다음을 계속합니다. 아니요를 클릭하면 다음 작업을 수행할 수 있는 다른 팝업이 표시됩니다.

    1. 게시: 현재 사용자나 다른 사용자가 사용할 수 있도록 기술 자료가 게시됩니다. 기술 자료가 잠기지 않고 기술 자료 테이블에서 기술 자료의 상태는 비어 있음으로 설정되며 도메인 관리 및 기술 자료 검색 작업을 둘 다 사용할 수 있습니다. 홈 페이지로 돌아갑니다. 프로세스를 완료하려면 팝업에서 를 클릭합니다.

    2. 아니요: 작업 내용이 저장되고 기술 자료가 잠긴 상태로 유지되며 기술 자료의 상태는 작업 중으로 설정됩니다. 도메인 관리 및 기술 자료 검색 작업을 둘 다 사용할 수 있습니다. 홈 페이지로 돌아갑니다.

    3. 취소: 팝업이 닫히고 도메인 값 관리 페이지로 돌아갑니다.

  12. 다음을 클릭할 수도 있습니다.

    • 작업 내용이 손실되어도 기술 자료 검색 작업을 종료하고 DQS 홈 페이지로 돌아가려면 취소를 클릭합니다.

    • 작업 내용을 저장하고 DQS 홈 페이지로 돌아가려면 닫기를 클릭합니다. 그러면 기술 자료가 잠기며 기술 자료 열기 화면의 기술 자료 테이블에서 기술 자료의 상태가 검색 - 값 관리가 됩니다.

    • 검색 페이지로 돌아가려면 뒤로를 클릭합니다. 닫기를 클릭한 후 도메인 관리 작업을 수행하려면 기술 자료 열기 화면에서 기술 자료 검색을 클릭하고 기술 자료 관리: 도메인 용어 관리 화면으로 이동한 다음 마침을 클릭하고 를 클릭하여 기술 자료를 게시하거나 아니요를 클릭하여 기술 자료에 대한 작업 내용을 저장하고 끝내야 합니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

후속 작업: 기술 자료 검색을 수행한 후

컴퓨터 기반 기술 자료 검색 프로세스에서 기술 자료에 정보를 추가한 후에는 기술 자료를 사용하여 프로젝트를 즉시 정리하거나 정리를 수행하기 전에 도메인 관리를 수행할 수 있습니다. 데이터 정리 또는 도메인 관리에 대한 자세한 내용은 데이터 정리 또는 도메인 관리를 참조하십시오.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

올바름, 오류, 유효하지 않음 값의 의미

도메인 값 페이지에서 테이블의 각 값에는 올바름, 오류 또는 유효하지 않음형식 설정이 할당됩니다. 값 형식은 초기에 기술 자료 검색 작업에 의해 생성되며 나중에 적절한 값으로 변경할 수 있습니다. 검색 및 대화식 변경 내용에 기초한 마지막 형식은 정리 작업에 의해 생성됩니다. 이러한 설정에는 다음과 같은 의미가 있습니다.

  • 올바름: 도메인에 속하며 구문 오류가 없는 값입니다. 예를 들어 City 도메인의 "Chicago"는 올바릅니다.

  • 오류: 도메인에 속해 있지만 올바르지 않은 값입니다. 예를 들어 City 도메인에서 "Chicago"가 아닌 "Shicago"에는 오류가 있습니다. DQS는 검색 프로세스에서 구문 오류 및 관련 수정 사항을 감지한 값을 오류가 있는 것으로 지정합니다. 구문 오류에는 맞춤법 오류가 포함됩니다.

  • 유효하지 않음: 도메인에 속하지 않으며 수정 사항이 없는 값입니다. 예를 들어 City 도메인의 값 "12345"는 유효하지 않습니다. DQS는 도메인 규칙에 실패한 값을 유효하지 않은 것으로 지정합니다.

수동으로 값의 형식을 나머지 두 값 중 하나로 변경할 수 있습니다. DQS는 수동 작업에 대해 유효성 및 오류 의미 체계를 적용하지 않습니다. 유효하지 않은 값의 상태를 변경하지 않고 수정 사항을 입력할 수 있습니다. 도메인 규칙에 실패하지 않은 값을 유효하지 않은 것으로 지정할 수 있습니다. 검색 프로세스에서 구문 오류가 없다고 표시한 값을 오류가 있는 것으로 지정할 수 있습니다. 또한 올바름으로 표시된 오류 값의 상태를 변경하지 않고 수정 사항을 제거할 수도 있습니다.

정리 작업의 결과 관리 및 보기 페이지에서 대화식 데이터 정리를 수행할 때는 결과 관리 및 보기 페이지의 유효하지 않음 탭에 유효하지 않음 값과 오류 값이 모두 포함됩니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

적절한 값을 표시하는 방법

다음과 같이 표시를 수정할 수 있습니다.

  • 필터 드롭다운 목록에서 상태를 선택하여 결과의 상태에 따라 테이블에서 원하는 결과를 필터링합니다.

  • 찾기 입력란에 검색할 문자를 하나 이상 입력하여 확인하거나 수정할 데이터를 찾습니다. 이렇게 하면 표시된 모든 값에서 이러한 문자가 있는 모든 위치가 강조 표시됩니다.

  • 테이블에 표시되는 값을 이전 세션이 아닌 현재 세션에서 검색된 값으로만 제한하려면 새 항목만 표시를 클릭합니다.

  • 현재 축소된 상태인 경우 모든 동의어 그룹의 모든 값을 표시하려면 모두 확장 단추를 클릭합니다.

  • 현재 확장된 상태인 경우 모든 동의어 그룹의 선행 값을 제외한 모든 값을 숨기려면 모두 축소 단추를 클릭합니다.

  • 값 테이블 아래쪽에 도메인 값 컬렉션에 대한 최근의 변경 내용을 보여 주는 미리 보기 팝업을 표시하려면 도메인 값 변경 기록 패널 표시/숨기기를 클릭합니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

프로파일러 통계

프로파일러 탭에서는 원본 데이터의 품질을 나타내는 통계를 제공합니다. 이러한 통계는 기술 자료의 품질을 평가하지 않습니다. 기술 자료 검색 프로파일링은 완결성 및 고유성에 대한 통찰력을 제공합니다. 기술 자료 검색 프로파일링은 정확성을 평가하지 않습니다. 정보 관리 프로파일링은 기술 자료의 정보를 구축하고 개선하는 데 데이터 원본이 얼마나 중요한지 평가하는 데 도움이 됩니다.

프로파일러 탭에서는 검색 프로세스에 대해 필드 및 도메인별로 다음과 같은 통계를 제공합니다.

  • 레코드: 데이터 예제에서 검색된 레코드 수

  • 전체 값: 각 필드에 대해 발견된 전체 값의 개수와 그 합계

  • 새 값: 마지막 검색 프로세스 이후로 각 필드 및 모든 매핑된 필드에 대해 새로 검색된 전체 값의 개수와 비율

  • 고유 값: 각 필드 및 모든 매핑된 필드의 고유한 전체 값 수와 비율

  • 새로운 고유 값: 마지막 검색 프로세스 이후로 각 필드 및 매핑된 모든 필드에 대해 새로 검색된 고유 값의 개수와 전체 값의 비율

  • 올바른 도메인 값: 각 필드 및 모든 매핑된 필드의 유효한 전체 값 수와 비율

필드 통계에는 다음이 포함됩니다.

  • 필드: 원본 데이터베이스의 필드 이름

  • 도메인: 필드에 매핑된 도메인의 이름

  • 신규: 필드의 새 값 수와 기존 값 대비 새 값의 백분율

  • 고유: 필드의 고유 레코드 수와 해당 백분율

  • 올바른 도메인: 유효한 도메인 값 수와 해당 백분율

  • 완결성: 일치 실행을 위해 매핑된 각 원본 필드의 완결성

기술 자료 검색 프로파일링은 완결성에 대한 통찰력을 제공합니다. 프로파일링 결과 필드가 상대적으로 불완전한 것으로 나오면 데이터 품질 프로젝트의 기술 자료에서 제거하는 것이 좋습니다. 프로파일링은 복합 도메인에 대한 신뢰할 수 있는 완결성 통계를 제공할 수 없습니다. 완결성 통계가 필요한 경우 복합 도메인 대신 단일 도메인을 사용하십시오. 복합 도메인을 사용하려는 경우 프로파일링을 위해 단일 도메인을 사용하는 하나의 기술 자료를 만들어 완결성을 확인하고 정리 프로세스를 위해 복합 도메인을 사용하는 다른 도메인을 만드는 것이 좋습니다. 예를 들어 프로파일링은 복합 도메인을 사용하는 주소 레코드에 대해 95%의 완결성을 표시할 수 있지만 우편 번호 열과 같은 열의 경우 불완결성 수준이 매우 높을 수 있습니다. 이 예에서는 단일 도메인을 사용하는 우편 번호 열의 완결성을 평가하는 것이 좋습니다. 프로파일링은 복합 도메인에 대해 신뢰할 수 있는 정확성 통계를 제공할 가능성이 높습니다. 여러 열의 정확성을 함께 평가할 수 있기 때문입니다. 이 데이터의 값은 복합 집계 형식이므로 복합 도메인을 사용하여 정확성을 평가하는 것이 좋습니다.

통계는 다음 단계에서 프로파일러 탭에 표시됩니다.

  • 레코드 전처리 중 단계에서는 DQS가 데이터를 로드하고 인덱싱합니다. 레코드나 일괄 처리별로 작업이 수행되므로 레코드별로 진행률이 표시될 수 있습니다. 이 단계가 수행되는 동안 올바른 도메인 값을 제외한 대부분의 프로파일링 데이터가 생성됩니다.

  • 도메인 규칙 실행 중 단계에서는 도메인 규칙이 모두 각 도메인 값의 최소 단위로 실행된 경우 올바른 도메인 열이 채워집니다.

  • 검색 실행 중 단계에서는 프로파일러 탭에 새 데이터가 업데이트되지 않습니다. 구문 오류가 발생한 경우 마법사의 다음 단계인 도메인 값 관리 단계에서 볼 수 있습니다.

기술 자료 검색 작업의 경우 다음과 같은 상황에서 알림이 발생합니다.

  • 필드에 새 값이 없는 경우 - 해당 필드를 매핑에서 제거하는 것이 좋습니다.

  • 필드에 새 값이 거의 없는 경우 - 해당 필드를 매핑에서 제거하는 것이 좋습니다.

  • 필드가 비어 있는 경우 - 해당 필드를 매핑에서 제거하는 것이 좋습니다.

  • 필드 완결성 점수가 매우 낮은 경우 - 해당 필드를 매핑에서 제거하는 것이 좋습니다.

  • 필드의 모든 값이 유효하지 않은 경우 - 필드 내용에 대한 도메인 규칙의 매핑과 관련성을 확인해야 합니다.

  • 필드에 유효한 값이 적은 경우 - 필드 내용에 대한 도메인 규칙의 매핑과 관련성을 확인해야 합니다.

프로파일링에 대한 자세한 내용은 DQS의 데이터 프로파일링 및 알림을 참조하십시오.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]