학습
파워 쿼리의 데이터 형식
파워 쿼리의 데이터 형식은 보다 구조화된 데이터 집합을 갖도록 값을 분류하는 데 사용됩니다. 데이터 형식은 필드 수준에서 정의됩니다. 필드 내의 값은 필드의 데이터 형식을 준수하도록 설정됩니다.
열의 데이터 형식은 데이터 형식을 상징하는 아이콘이 있는 열 머리글의 왼쪽에 표시됩니다.
참고
파워 쿼리는 열의 데이터 형식에 따라 컨텍스트 변환 및 옵션 집합을 제공합니다. 예를 들어 데이터 형식이 Date인 열을 선택하면 해당 특정 데이터 형식에 적용되는 변환 및 옵션이 제공됩니다. 이러한 변환 및 옵션은 변환 및 열 추가 탭 및 스마트 필터 옵션과 같은 파워 쿼리 인터페이스 전체에서 발생합니다.
파워 쿼리에 사용되는 가장 일반적인 데이터 형식은 다음 표에 나와 있습니다. 이 문서의 범위를 벗어나더라도 파워 쿼리 M 수식 언어 형식 문서에서 데이터 형식의 전체 목록을 찾을 수 있습니다.
데이터 형식 | 아이콘 | 설명 |
---|---|---|
Text | 유니코드 문자 데이터 문자열입니다. 텍스트 형식으로 표시되는 문자열, 숫자 또는 날짜일 수 있습니다. 최대 문자열 길이는 268,435,456개의 유니코드 문자(각 유니코드 문자는 2바이트) 또는 536,870,912바이트입니다. | |
True/False | True 또는 False의 부울 값입니다. | |
10진수 | 64비트(8비트) 부동 소수점 숫자를 나타냅니다. 가장 일반적인 숫자 형식이며 일반적으로 생각하는 숫자에 해당합니다. 소수 자릿수 값을 사용하여 숫자를 처리하도록 설계되었지만 정수도 처리합니다. 10진수 형식은 –1.79E +308부터 –2.23E –308, 0까지의 음수 값과 2.23E –308에서 1.79E + 308까지의 양수 값을 처리할 수 있습니다. 예를 들어 34, 34.01 및 34.000367063과 같은 숫자는 유효한 10진수입니다. 10진수 형식으로 나타낼 수 있는 가장 큰 전체 자릿수는 15자리 길이입니다. 소수 구분 기호는 숫자 안의 어디에나 놓일 수 있습니다. 10진수 형식은 Excel에서 해당 숫자를 저장하는 방법에 해당합니다. 이진 부동 소수점 숫자는 100% 정확도로 지원되는 범위 내의 모든 숫자를 나타낼 수 없습니다. 따라서 특정 소수 자릿수를 나타낼 때 정밀도의 사소한 차이가 발생할 수 있습니다. | |
고정 10진수 | 통화 형식이라고도 하는 이 데이터 형식에는 소수 구분 기호에 대한 고정 위치가 있습니다. 소수 구분 기호는 항상 오른쪽에 4자리를 가지며 19자리의 중요도를 허용합니다. 표시할 수 있는 가장 큰 값은 922,337,203,685,477.5807(양수 또는 음수)입니다. 10진수와 달리 고정 10진수 형식은 항상 정확하므로 부동 소수점 표기법의 부정확성으로 인해 오류가 발생할 수 있는 경우에 유용합니다. | |
정수 | 64비트(8 바이트) 정수 값을 나타냅니다. 정수이므로 소수점 오른쪽에 숫자가 없습니다. 19자리 숫자를 허용합니다. -9,223,372,036,854,775,807(–2^63+1)과 9,223,372,036,854,775,806(2^63-2) 사이의 양수 또는 음수 정수입니다. 다양한 숫자 데이터 형식의 가능한 가장 큰 정밀도를 나타낼 수 있습니다. 고정 10진수 형식과 마찬가지로 정수 형식은 반올림을 제어해야 하는 경우에 유용할 수 있습니다. | |
백분율 | 기본적으로 10진수 형식과 동일하지만 열의 값을 Power Query 편집기 창의 백분율로 서식을 지정하는 마스크가 있습니다. | |
날짜/시간 | 날짜 및 시간 값을 모두 나타냅니다. 표지 아래에 날짜/시간 값은 10진수 형식으로 저장되므로 실제로 둘 사이를 변환할 수 있습니다. 날짜의 시간 부분은 1/300초(3.33ms)의 전체 배수에 대한 분수로 저장됩니다. 1900년에서 9999년 사이의 날짜가 지원됩니다. | |
날짜 | 날짜(시간 부분 없음)만 나타냅니다. 모델로 변환된 날짜는 소수 값에 대해 0이 있는 날짜/시간 값과 같습니다. | |
Time | 시간(날짜 부분 없음)을 나타냅니다. 모델로 변환할 때 시간 값은 소수 자릿수 왼쪽에 숫자가 없는 날짜/시간 값과 동일합니다. | |
날짜/시간/표준 시간대 | 표준 시간대 오프셋이 있는 UTC 날짜/시간을 나타냅니다. 모델에 로드될 때 날짜/시간으로 변환됩니다. | |
기간 | 모델에 로드될 때 10진수 형식으로 변환되는 시간의 길이를 나타냅니다. 10진수 형식으로 올바른 결과를 가진 날짜/시간 필드에서 추가하거나 뺄 수 있습니다. 10진수 형식이므로 크기를 표시하는 시각화에서 쉽게 사용할 수 있습니다. | |
이진 | 이진 데이터 형식을 사용하여 다른 모든 데이터를 이진 형식으로 나타낼 수 있습니다. | |
모두 | 모든 데이터 형식은 명시적 데이터 형식 정의가 없는 열에 지정된 상태. 모든 값은 모든 값을 분류하는 데이터 형식입니다. 구조화되지 않은 원본에서 쿼리에 대한 열 데이터 형식을 항상 명시적으로 정의하고 Any 데이터 형식의 열을 쿼리의 출력으로 사용하지 않는 것이 좋습니다. |
데이터 형식 검색은 다음을 연결할 때 자동으로 발생합니다.
데이터베이스와 같은 구조적 데이터 원본인 파워 쿼리는 데이터 원본에서 테이블 스키마를 읽고 각 열에 대해 올바른 데이터 형식을 사용하여 데이터를 자동으로 표시합니다.
Excel, CSV 및 텍스트 파일과 같은 구조화되지 않은 원본인 파워 쿼리는 테이블의 값을 검사하여 데이터 형식을 자동으로 검색합니다. 기본적으로 비정형 원본에 대한 파워 쿼리에서 자동 데이터 형식 검색이 사용됩니다.
변환 탭의 [모든 열] 그룹에서 [데이터 형식 검색] 명령을 사용하여 테이블에 있는 열의 데이터 형식을 자동으로 검색할 수도 있습니다.
다음 4개 위치 중에서 열의 데이터 형식을 정의하거나 변경할 수 있습니다.
[홈] 탭의 [변환] 그룹의 [데이터 형식] 드롭다운 메뉴에서
[변환] 탭의 [모든 열] 그룹의 [데이터 형식] 드롭다운 메뉴에서
열 머리글의 왼쪽에 있는 아이콘을 선택합니다.
열 바로 가기 메뉴의 변경 유형 아래에 있습니다.
이 설정은 특별히 구조화되지 않은 원본을 위한 것입니다. 테이블의 처음 200개 행을 기반으로 열 형식 및 헤더를 자동으로 검사하고 검색하는 데 도움이 됩니다. 이 설정을 사용하도록 설정하면 파워 쿼리가 쿼리에 두 단계를 자동으로 추가합니다.
- 열 머리글 승격: 테이블의 첫 번째 행을 열 머리글로 승격합니다.
- 변경된 형식: 각 열의 값 검사에 따라 모든 데이터 형식의 값을 데이터 형식으로 변환합니다.
기본적으로 이 설정은 활성화되어 있습니다. 이 설정을 사용하지 않거나 사용하도록 설정하려면 파워 쿼리 환경에 적용되는 단계를 따릅니다.
파워 쿼리 Online에서 자동 데이터 형식 검색을 구성하려면
홈 탭에서 옵션을 선택한 다음 프로젝트 옵션을 선택합니다. 프로젝트 옵션 창에서 구조화되지 않은 원본 검사 대해 자동으로 검색 열 형식 및 헤더를 선택합니다.
데스크톱용 파워 쿼리에서 자동 데이터 형식 검색을 구성하려면
옵션 창의 전역 및 파일별 수준에서 이 동작을 정의할 수 있습니다(Power Query 편집기 파일 탭에서 옵션 및 설정>옵션을 선택).
전역: 전역 아래의 왼쪽 창에서 데이터 로드를 선택합니다. 형식 검색 아래의 오른쪽 창에서 애플리케이션에서 만든 모든 새 파일에 적용할 세 가지 형식 검색 구성 중에서 선택할 수 있습니다.
- 구조화되지 않은 원본에 대한 열 형식 및 헤더를 항상 검색합니다.
- 각 파일의 설정에 따라 구조화되지 않은 원본에 대한 열 형식 및 헤더 검색
- 구조화되지 않은 원본에 대한 열 형식 및 헤더를 검색하지 않음
현재 파일: 현재 파일 아래의 왼쪽 창에서 데이터 로드를 선택합니다. 형식 검색 아래의 오른쪽 창에서 현재 파일에 대해 형식 검색을 사용하거나 사용하지 않도록 설정할지 여부를 선택합니다.
파워 쿼리는 사물의 모양과 해석 방식을 관리하는 두 가지 고유한 구성 요소를 처리합니다.
- 지역화: 표시해야 하는 언어로 파워 쿼리를 알려주는 구성 요소입니다.
- 세계화: 텍스트 값의 해석 외에도 값의 서식을 처리하는 구성 요소입니다.
로캘 은 지역화 및 세계화 구성 요소를 모두 포함하는 단일 값입니다. 로캘은 텍스트 값을 해석하고 다른 데이터 형식으로 변환하는 데 사용됩니다. 예를 들어 로캘 영어(미국)는 지역화가 미국 영어이고 값의 세계화 또는 형식은 미국 사용되는 표준을 기반으로 한다는 것을 의미합니다.
파워 쿼리가 열 데이터 형식을 정의하거나 한 데이터 형식에서 다른 데이터 형식으로 변환하는 경우 변환할 값을 해석해야 다른 데이터 형식으로 변환할 수 있습니다.
파워 쿼리 Online에서 이 해석은 로캘 아래의 프로젝트 옵션에 정의됩니다.
데스크톱용 파워 쿼리에서 파워 쿼리는 운영 체제 국가별 형식을 자동으로 인식하고 이를 사용하여 데이터 형식 변환 값을 해석합니다. 이 로캘 구성을 재정의하려면 쿼리 옵션 창을 열고 왼쪽 창의 현재 파일에서 국가별 설정을 선택합니다. 여기에서 로캘을 원하는 설정으로 변경할 수 있습니다.
이 로캘 설정은 텍스트 값을 특정 데이터 형식으로 해석하는 데 중요합니다. 예를 들어 로캘이 영어(미국)로 설정되어 있지만 CSV 파일 중 하나의 열에 날짜가 영국 형식의 일/월/연도로 지정되어 있다고 상상해 보십시오.
날짜 열의 데이터 형식을 날짜로 설정하려고 하면 오류 값이 발생합니다.
이러한 오류는 사용 중인 로캘이 월/일/연도인 영어(미국) 형식으로 날짜를 해석하려고 하기 때문에 발생합니다. 달력에 월 22가 없으므로 오류가 발생합니다.
날짜 데이터 형식을 선택하는 대신 열 머리글을 마우스 오른쪽 단추로 클릭하고 형식 변경을 선택한 다음 로캘 사용을 선택할 수 있습니다.
로캘을 사용하여 열 형식 변경 대화 상자에서 설정할 데이터 형식을 선택하지만 사용할 로캘도 선택합니다. 이 경우 영어(영국)여야 합니다.
이 로캘을 사용하여 파워 쿼리는 값을 올바르게 해석하고 해당 값을 올바른 데이터 형식으로 변환할 수 있습니다.
최종 날짜 값을 확인하려면
값의 서식은 세계화 값에 의해 좌우됩니다. 파워 쿼리에서 표시하는 값에 대한 의구심이 있는 경우 값에서 일, 월 및 연도에 대한 새 열을 추가하여 날짜 값의 변환을 확인할 수 있습니다. 이렇게 하려면 날짜 열을 선택하고 리본 메뉴의 열 추가 탭으로 이동합니다. 날짜 및 시간 열 그룹에 날짜 열에 대한 옵션이 표시됩니다.
여기에서 연도 번호, 월 번호, 일 번호 또는 날짜 열에서 추출된 열과 같은 날짜 값의 일부를 추출할 수 있습니다.
이러한 열을 사용하여 날짜 값이 올바르게 변환되었는지 확인할 수 있습니다.
다음 매트릭스는 한 데이터 형식에서 다른 데이터 형식으로 값의 데이터 형식 변환의 타당성을 빠르게 살펴볼 수 있도록 설계되었습니다.
참고
이 행렬의 변환은 데이터 형식 열의 원래 데이터 형식으로 시작합니다. 새 형식으로 변환된 각 결과는 원래 데이터 형식의 행에 표시됩니다.
데이터 형식 | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
10진수 | — | ||||||||||
통화 | — | ||||||||||
정수 | — | ||||||||||
비율 | — | ||||||||||
날짜/시간 | — | ||||||||||
날짜 | — | ||||||||||
시간 | — | ||||||||||
날짜/시간/표준 시간대 | — | ||||||||||
Duration | — | ||||||||||
Text | — | ||||||||||
True/False | — |
아이콘 | 설명 |
---|---|
가능 | |
가능하지 않음 | |
가능하지만 원래 값에 값을 추가합니다. | |
가능하지만 원래 값은 잘립니다. |