데이터 프로파일링 태스크 편집기의프로필 요청 페이지를 사용하여 컴퓨팅할 프로필을 선택하고 구성합니다. 단일 데이터 프로파일링 작업에서 여러 테이블 또는 뷰의 여러 열 또는 열 조합에 대해 여러 프로필을 계산할 수 있습니다.
데이터 프로파일링 태스크를 사용하는 방법에 대한 자세한 내용은 데이터 프로파일링 태스크 설정을 참조하세요. 데이터 프로필 뷰어를 사용하여 데이터 프로파일링 태스크의 출력을 분석하는 방법에 대한 자세한 내용은 데이터 프로필 뷰어를 참조하세요.
데이터 프로파일링 태스크 편집기의 프로필 요청 페이지를 열려면
SSDT(SQL Server Data Tools)에서 데이터 프로파일링 태스크가 있는 Integration Services 패키지를 엽니다.
제어 흐름 탭에서 데이터 프로파일링 작업을 두 번 클릭합니다.
데이터 프로파일링 태스크 편집기에서 프로필 요청을 클릭합니다.
요청 창 사용
요청 창은 페이지 맨 위에 표시되는 창입니다. 이 창에는 현재 데이터 프로파일링 작업에 대해 구성된 모든 프로필이 나열됩니다. 프로필이 구성되지 않은 경우 요청 창은 비어 있습니다. 새 프로필을 추가하려면 프로필 유형 열 아래의 빈 영역을 클릭하고 목록에서 프로필 유형을 선택합니다. 프로필을 구성하려면 요청 창에서 프로필을 선택한 다음 요청 속성 창에서 프로필의 속성을 설정합니다.
요청 창 옵션
요청 창에는 다음과 같은 옵션이 있습니다.
보기
작업에 대해 구성된 모든 프로필을 볼지 또는 프로필 중 하나만 볼지 선택합니다.
선택한 보기 에 따라 요청 창의 열이 변경되었습니다. 이러한 각 열에 대한 자세한 내용은 다음 섹션인 "요청 창 열"을 참조하세요.
요청 패널 열
요청 창에 표시되는 열은 선택한 보기 에 따라 달라집니다.
모든 요청을 보도록 선택하면 요청 창에 프로필 유형 및 요청 ID라는 두 개의 열이 있습니다.
5개 열 프로필 중 하나를 보도록 선택하면 요청 창에 프로필 유형, 테이블 또는 뷰, 열 및 요청 ID의 네 개의 열이 있습니다.
후보 키 프로필을 보도록 선택하면 요청 창에 프로필 유형, 테이블 또는 뷰, KeyColumns 및 요청 ID의 네 개의 열이 있습니다.
기능 종속성 프로필을 보려면 요청 창에 프로필 유형, 테이블 또는 뷰, 결정 열, 종속 열 및 요청 ID의 5개 열이 있습니다.
값 포함 프로필을 보도록 선택하면 요청 창에 프로필 유형, 하위 집합 측면 테이블 또는 뷰, 상위 집합 쪽 테이블 또는 뷰, 하위 집합 측면 열, 상위 집합 측면 열 및 요청 ID의 6개 열이 있습니다.
다음 섹션에서는 이러한 각 열에 대해 설명합니다.
모든 뷰에 공통된 열
프로필 형식
다음 옵션에서 데이터 프로필을 선택합니다.
| 가치 | 설명 |
|---|---|
| 후보 키 프로필 요청 | 후보 키 프로필을 계산합니다. 이 프로필 이 프로필은 열 또는 열 집합이 선택한 테이블의 키인지 대략적인 키인지를 보고합니다. 이 프로필은 잠재적인 키 열의 중복 값과 같은 데이터 문제를 식별하는 데 도움이 될 수도 있습니다. |
| 열 길이 분포 프로필 요청 | 열 길이 분포 프로필을 계산합니다. 열 길이 분포 프로필은 선택한 열에 있는 문자열 값의 모든 고유 길이와 각 길이가 나타내는 테이블의 행 백분율을 보고합니다. 이 프로필은 유효하지 않은 값과 같은 데이터의 문제를 식별하는 데 도움이 될 수 있습니다. 예를 들어 두 문자로 된 미국 주 코드의 열을 프로파일하고 두 문자보다 긴 값을 검색합니다. |
| 열 Null 비율 프로필 요청 | 열 Null 비율 프로필을 계산합니다. 열 Null 비율 프로필은 선택한 열에서 null 값의 백분율을 보고합니다. 이 프로필은 열에서 예기치 않게 높은 null 값 비율과 같은 데이터 문제를 식별하는 데 도움이 될 수 있습니다. 예를 들어 ZIP Code/Postal Code 열을 프로파일링하는 중 허용 불가능한 수준으로 높은 누락된 코드 백분율을 검색할 수 있습니다. |
| 컬럼 패턴 프로필 요청 | 열 패턴 프로필을 계산합니다. 열 패턴 프로필은 문자열 열에서 지정된 값 백분율을 포함하는 정규식 집합을 보고합니다. 이 프로필은 유효한 문자열이 아닌 문자열과 같은 데이터의 문제를 식별하는 데 도움이 될 수 있습니다. 또한 이 프로필은 앞으로 새 값의 유효성 검사에 사용할 수 있는 정규식을 제안해 줍니다. 예를 들어, 우편 번호/우편 구역 번호 열의 패턴 프로필은 다음과 같은 정규식을 생성할 수 있습니다: \d{5}-\d{4}, \d{5}, 그리고 \d{9}. 다른 정규식이 발견된다면 데이터에 유효하지 않거나 잘못된 형식의 값이 포함되어 있을 가능성이 높습니다. |
| 열 통계 프로필 요청 | 선택한 테이블 또는 뷰의 적용 가능한 모든 열에 대한 기본 설정을 사용하여 열 통계 프로필을 계산하려면 이 옵션을 선택합니다. 열 통계 프로필은 숫자 열의 최소값, 최대값, 평균 및 표준 편차, 열의 최소값 및 최대값과 같은 통계를 datetime 보고합니다. 이 프로필은 유효하지 않은 날짜와 같은 데이터의 문제를 식별하는 데 도움이 될 수 있습니다. 예를 들어 기록 날짜 열을 프로파일링하여 미래의 최대 날짜를 검색할 수 있습니다. |
| 열 값 분포 프로파일 요청 | 열 값 배포 프로필을 계산합니다. 열 값 분포 프로필은 선택한 열의 모든 고유 값과 각 값이 나타내는 테이블의 행 백분율을 보고합니다. 이 프로필은 테이블에서 지정된 백분율을 초과하는 값을 보고할 수도 있습니다. 이 프로필은 열의 잘못된 고유 값 수와 같은 데이터의 문제를 식별하는 데 도움이 될 수 있습니다. 예를 들어 미국의 상태를 포함하는 열을 프로파일하고 50개 이상의 고유 값을 검색합니다. |
| 기능 종속성 프로필 요청 | 기능 종속성 프로필을 컴퓨팅합니다. 함수 종속성 프로필은 한 열(종속 열)의 값이 다른 열 또는 열 집합(결정 열)의 값에 종속되는 정도를 보고합니다. 이 프로필은 유효하지 않은 값과 같은 데이터의 문제를 식별하는 데 도움이 될 수도 있습니다. 예를 들어 미국 우편 번호 열과 미국의 주 열 간의 종속성을 프로파일합니다. 동일한 우편 번호는 항상 동일한 상태를 가져야 하지만 프로필은 이 종속성의 위반을 검색합니다. |
| 값 포함 프로필 요청 | 값을 포함하는 프로필을 계산합니다. 값 포함 프로필은 두 열 또는 열 집합 사이의 값 중첩을 계산합니다. 이 프로필은 열 또는 열 집합이 선택한 테이블 간의 외래 키 역할을 하는 데 적합한지 여부를 확인할 수도 있습니다. 이 프로필은 유효하지 않은 값과 같은 데이터의 문제를 식별하는 데 도움이 될 수도 있습니다. 예를 들어 Sales 테이블의 ProductID 열을 프로파일하고 열에 Products 테이블의 ProductID 열에 없는 값이 포함되어 있는지 검색합니다. |
RequestID
요청에 대한 식별자를 표시합니다. 일반적으로 자동 생성된 값을 변경할 필요가 없습니다.
모든 개별 프로필에 공통된 열
연결 관리자
원본 데이터베이스에 연결하는 ADO.NET 연결 관리자를 표시합니다.
요청 ID
요청에 대한 식별자를 표시합니다. 일반적으로 자동 생성된 값을 변경할 필요가 없습니다.
5개의 개별 열 프로필에 공통으로 포함된 항목들
테이블 또는 뷰
선택한 열이 포함된 테이블 또는 뷰를 표시합니다.
열
프로파일링을 위해 선택한 열을 표시합니다.
후보 키 프로필에 특정한 열
테이블 또는 뷰
선택한 열이 포함된 테이블 또는 뷰를 표시합니다.
중요 열
프로파일링을 위해 선택한 열을 표시합니다.
기능 종속성 프로필과 관련된 열
테이블 또는 뷰
선택한 열이 포함된 테이블 또는 뷰를 표시합니다.
결정 열
프로파일링을 위해 선택한 열을 결정 열 또는 열로 표시합니다. 미국 우편 번호가 미국의 상태를 결정하는 예제에서 결정 열은 우편 번호 열입니다.
종속 열
프로파일링을 위해 선택한 열을 종속 열로 표시합니다. 미국 우편 번호가 미국의 상태를 결정하는 예제에서 종속 열은 상태 열입니다.
값 포함 프로필과 관련된 열
부분 집합 보조 테이블 또는 뷰
선택한 하위 집합 열을 포함하는 테이블 또는 뷰를 표시합니다.
슈퍼셋 사이드 테이블 또는 뷰
상위 집합 측면 열로 선택한 열 또는 열이 포함된 테이블 또는 뷰를 표시합니다.
하위 집합 사이드 열
프로파일링을 위해 선택한 하나 이상의 열을 하부 열로 표시합니다. 미국 주 열의 값이 2자 미국 주 코드의 참조 테이블에 있는지 확인하려는 예제에서 하위 집합 열은 원본 테이블의 상태 열입니다.
슈퍼셋 측면 열
프로파일링을 위해 선택된 열 또는 열을 상위 집합 측면 열로 표시합니다. 미국 주 열의 값이 2자 미국 주 코드의 참조 테이블에 있는지 확인하려는 예제에서 상위 집합 열은 참조 테이블의 상태 코드 열입니다.
요청 속성 창 사용
요청 속성 창이 요청 창 아래에 나타납니다. 이 창에는 요청 창에서 선택한 프로필에 대한 옵션이 표시됩니다.
비고
프로필 유형을 선택한 후 요청 ID 필드를 선택하여 요청 속성 창에서 프로필 요청에 대한 속성을 확인해야 합니다.
이러한 옵션은 선택한 프로필에 따라 달라집니다. 개별 프로필 유형에 대한 옵션에 대한 자세한 내용은 다음 항목을 참조하세요.