다음을 통해 공유


데이터 프로필 뷰어

적용 대상: Azure Data Factory의 SQL Server SSIS Integration Runtime

데이터 프로필 보기 및 분석은 데이터 프로파일링 프로세스의 다음 단계입니다. Integration Services 패키지 내에서 데이터 프로파일링 작업을 실행하고 데이터 프로필을 계산한 후 이러한 프로필을 볼 수 있습니다. 데이터 프로파일링 작업을 설정하고 실행하는 방법에 대한 자세한 내용은 데이터 프로파일링 태스크 설정을 참조하세요.

Important

출력 파일에는 데이터베이스 및 데이터베이스에 포함된 데이터에 대한 중요한 데이터가 포함될 수 있습니다. 이 파일을 보다 안전하게 만드는 방법에 대한 제안 사항은 패키지에서 사용하는 파일에 대한 액세스를 참조하세요.

데이터 프로필

데이터 프로필을 보려면 파일로 출력을 보내도록 데이터 프로파일링 태스크를 구성한 다음 독립 실행형 데이터 프로필 뷰어를 사용합니다. 데이터 프로필 뷰어를 열려면 다음 중 하나를 수행합니다.

  • SSIS 디자이너에서 데이터 프로파일링 작업을 마우스 오른쪽 단추로 클릭한 다음 편집을 클릭합니다. 데이터 프로파일링 태스크 편집기일반 페이지에서 프로필 뷰어 열기를 클릭합니다.

  • <드라이브>:\Program Files (x86) | Program Files\Microsoft SQL Server\110\DTS\Binn 폴더에서 DataProfileViewer.exe를 실행합니다.

이 뷰어는 여러 창을 사용하여 선택적 세부 정보 및 드릴다운 기능과 함께 요청한 프로필과 계산된 결과를 표시합니다.

프로필
프로필 창에는 데이터 프로필 작업에서 요청된 프로필이 표시됩니다. 프로필에 대한 계산 결과를 보려면 프로필 창에서 프로필을 선택하면 뷰어의 다른 창에 결과가 표시됩니다.

결과 창
결과 창은 단일 행을 사용하여 프로필의 계산 결과를 요약합니다. 예를 들어 열 길이 분포 프로필을 요청하면 이 행에 최소 및 최대 길이와 행 수가 포함됩니다. 대부분의 프로필의 경우 결과 창에서 이 행을 선택하여 선택적 세부 정보 창에서 추가 세부 정보를 볼 수 있습니다.

세부 정보
대부분의 프로필 유형에 대해 세부 정보 창에는 결과 창에서 선택한 프로필 결과에 대한 추가 정보가 표시됩니다. 예를 들어 열 길이 분포 프로필을 요청하면 세부 정보 창에 발견된 각 열 길이가 표시됩니다. 또한 창에는 열 값의 열 길이가 있는 행의 수와 백분율도 표시됩니다.

둘 이상의 열(후보 키, 기능 종속성 및 값 포함)에 대해 계산되는 세 가지 프로필 형식의 경우 세부 정보 창에 예상 관계 위반이 표시됩니다. 예를 들어 후보 키 프로필을 요청하는 경우 세부 정보 창에는 후보 키의 고유성을 위반하는 중복 값이 표시됩니다.

프로필을 계산하는 데 사용되는 데이터 원본을 사용할 수 있는 경우 세부 정보 창에서 행을 두 번 클릭하여 드릴다운 창에서 일치하는 데이터 행을 볼 수 있습니다.

드릴다운
다음 조건이 충족되면 세부 정보 창에서 행을 두 번 클릭하여 드릴다운 창에서 일치하는 데이터 행을 볼 수 있습니다.

  • 프로필을 컴퓨팅하는 데 사용되는 데이터 원본을 사용할 수 있습니다.

  • 데이터를 볼 수 있는 권한이 있습니다.

드릴다운 요청을 위해 원본 데이터베이스에 연결하려면 데이터 프로필 뷰어에서 Windows 인증 및 현재 사용자의 자격 증명을 사용합니다. 데이터 프로필 뷰어는 데이터 프로파일링 작업을 실행한 패키지에 저장된 연결 정보를 사용하지 않습니다.

Important

데이터 프로필 뷰어에서 사용할 수 있는 드릴다운 기능은 원래 데이터 원본에 라이브 쿼리를 보냅니다. 이러한 쿼리는 서버 성능에 부정적인 영향을 미칠 수 있습니다.

최근에 생성되지 않은 출력 파일에서 드릴다운하는 경우 드릴다운 쿼리는 원래 출력이 계산된 행과 다른 행 집합을 반환할 수 있습니다.

데이터 프로필 뷰어의 사용자 인터페이스에 대한 자세한 내용은 데이터 프로필 뷰어 F1 도움말을 참조하세요.

데이터 프로필 뷰어 F1 도움말

데이터 프로필 뷰어를 사용하여 데이터 프로파일링 태스크의 출력을 볼 수 있습니다.

데이터 프로필 뷰어를 사용하는 방법에 대한 자세한 내용은 데이터 프로필 뷰어를 참조하세요. 데이터 프로파일링 태스크를 사용하여 데이터 프로필 뷰어에서 분석하는 프로필 출력을 만드는 방법에 대한 자세한 내용은 데이터 프로파일링 태스크 설정을 참조하세요.

정적 옵션

시작
데이터 프로파일링 태스크의 출력이 포함된 저장된 파일을 찾으려면 클릭합니다.

프로필
프로필 창에서 트리를 확장하여 출력에 포함된 프로필을 확인합니다. 프로필을 선택하여 해당 프로필의 결과를 봅니다.

메시지
상태 메시지를 표시합니다.

드릴다운
데이터 프로파일링 태스크에서 사용하는 데이터 원본을 사용할 수 있는 경우 출력의 값과 일치하는 데이터 행을 표시합니다.

예를 들어 미국 주 열에 대한 열 값 분포 프로필의 출력을 보는 경우 자세한 값 분포 창에 "WA"에 대한 행이 포함될 수 있습니다. 자세한 값 분포 창에서 행을 두 번 클릭하여 드릴다운 창에서 상태 열의 값이 "WA"인 데이터 행을 확인합니다.

동적 옵션

프로필 유형 = 열 길이 분포 프로필

열 길이 분포 프로필 - <column> 창

최소 길이
이 열의 값에 대한 최소 길이를 표시합니다.

최대 길이
이 열의 값에 대한 최대 길이를 표시합니다.

선행 공백 무시
이 프로필이 True 또는 False인 IgnoreLeadingSpaces 값으로 계산되었는지 여부를 표시합니다. 이 속성은 데이터 프로파일링 태스크 편집기의 프로필 요청 페이지에서 설정되었습니다.

후행 공백 무시
이 프로필이 True 또는 False인 IgnoreTrailingSpaces 값으로 계산되었는지 여부를 표시합니다. 이 속성은 데이터 프로파일링 태스크 편집기의 프로필 요청 페이지에서 설정되었습니다.

행 개수
테이블 또는 뷰의 행 수를 표시합니다.

자세한 길이 분포 창

길이
프로파일링된 열에서 찾은 열 길이를 표시합니다.

Count
프로파일링된 열의 값에 길이 열에 표시된 길이가 지정된 행 수를 표시합니다.

백분율
프로파일링된 열의 값에 길이 열에 표시된 길이가 지정된 행 백분율을 표시합니다.

프로필 형식 = 열 Null 비율 프로필

열 Null 비율 프로필 - <column> 창

Null 개수
프로파일링된 열에 Null 값이 있는 행 수를 표시합니다.

NULL 백분율
프로파일링된 열에 Null 값이 있는 행 백분율을 표시합니다.

행 개수
테이블 또는 뷰의 행 수를 표시합니다.

프로필 형식 = 열 패턴 프로필

열 패턴 프로필 - <column> 창

행 개수
테이블 또는 뷰의 행 수를 표시합니다.

패턴 배포 창

패턴
프로파일된 열에 대해 계산된 패턴을 표시합니다.

백분율
값이 패턴 열에 표시된 패턴과 일치하는 행의 백분율을 표시합니다.

프로필 유형 = 열 통계 프로필

열 통계 프로필 - <column> 창

최소
프로파일링된 열에서 찾은 최소값을 표시합니다.

최댓값
프로파일링된 열에서 찾은 최대값을 표시합니다.

평균
프로파일링된 열에서 찾은 값의 평균을 표시합니다.

표준 편차
프로파일링된 열에서 찾은 값의 표준 편차를 표시합니다.

프로필 유형 = 열 값 분포 프로필

열 값 분포 프로필 - <column> 창

고유 값 수
프로파일링된 열에서 찾은 고유 값의 개수를 표시합니다.

행 개수
테이블 또는 뷰의 행 수를 표시합니다.

자세한 값 분포 창


프로파일링된 열에서 찾은 고유 값을 표시합니다.

Count
프로파일링된 열에 열에 표시된 값이 있는 행의 수를 표시합니다.

백분율
프로파일링된 열에 열에 표시된 값이 있는 행의 백분율을 표시합니다.

프로필 유형 = 후보 키 프로필

후보 키 프로필 - <table> 창

키 열
후보 키로 프로파일링하기 위해 선택한 열을 표시합니다.

키 수준
후보 키 열 또는 열 조합의 수준(비율)을 표시합니다. 100% 미만의 키 수준은 중복 값이 있음을 나타냅니다.

키 위반 창

<column1>, <column2> 등
프로파일된 열에 있는 중복 값을 표시합니다.

Count
지정된 열에 첫 번째 열에 표시된 값이 있는 행 수를 표시합니다.

프로필 형식 = 기능 종속성 프로필

함수 종속성 프로필 창

결정 열
결정 열로 선택된 열을 표시합니다. 동일한 미국 우편 번호가 항상 동일한 상태를 가져야 하는 예제에서 우편 번호는 결정 열입니다.

종속 열
종속 열로 선택된 열을 표시합니다. 동일한 미국 우편 번호가 항상 동일한 상태를 가져야 하는 예제에서 상태는 종속 열입니다.

기능 종속성 수준
열 간의 기능 종속성의 수준(백분율)를 표시합니다. 100% 미만의 키 수준은 결정 값이 종속 값을 결정하지 않는 경우가 있음을 나타냅니다. 동일한 미국 우편 번호가 항상 동일한 상태를 가져야 하는 예제에서는 일부 상태 값이 유효하지 않음을 나타냅니다.

기능 종속성 위반 창

참고 항목

데이터에서 잘못된 값의 백분율이 높으면 함수 종속성 프로필에서 예기치 않은 결과가 발생할 수 있습니다. 예를 들어, 행의 90%는 우편 번호 값 “98052”에 해당하는 주 값 “WI”를 포함합니다. 프로필은 올바른 주 값인 “WA”가 포함된 행을 위반으로 보고합니다.

<determinant column name>
이 함수 종속성 위반 인스턴스에서 결정 열 또는 열 조합의 값을 표시합니다.

<dependent column name>
이 함수 종속성 위반 인스턴스에서 종속 열의 값을 표시합니다.

지지도 개수
결정 열이 종속 열을 결정하는 행의 수를 표시합니다.

위반 횟수
결정 열이 종속 열을 결정하지 않는 행의 수를 표시합니다. (이는 종속 값이 <dependent column name> 열에 표시된 값인 행입니다.)

지지도 백분율
결정 열이 종속 열을 결정하는 행의 비율을 표시합니다.

프로필 유형 = 값 포함 프로필

값 포함 프로필 창

하위 집합측 열
상위 집합 열에 있는지 여부를 확인하기 위해 프로파일링된 열 또는 열 조합을 표시합니다.

상위 집합측 열
하위 집합 열의 값을 포함하는지 여부를 확인하기 위해 프로파일링된 열 또는 열 조합을 표시합니다.

포함 수준
열 간의 중복 수준(백분율)를 표시합니다. 100% 미만의 키 강도는 상위 집합 값 중 하위 집합 값을 찾을 수 없는 경우가 있음을 나타냅니다.

포함 위반 창

<column1>, <column2> 등
상위 집합 열에서 찾지 못한 하위 집합 열의 값을 표시합니다.

Count
지정된 열에 첫 번째 열에 표시된 값이 있는 행 수를 표시합니다.