Azure Storage에서 데이터 가져오기
이 문서에서는 Azure Storage(ADLS Gen2 컨테이너, Blob 컨테이너 또는 개별 Blob)에서 새 테이블 또는 기존 테이블로 데이터를 가져오는 방법을 알아봅니다.
필수 조건
- Microsoft Fabric 지원 용량 작업 영역
- 편집 권한이 있는 KQL 데이터베이스
- 스토리지 계정
Source
KQL 데이터베이스의 하단 리본에서 데이터 가져오기를 선택합니다.
데이터 가져오기 창에서 원본 탭이 선택됩니다.
사용 가능한 목록에서 데이터 원본을 선택합니다. 이 예제에서는 Azure Storage에서 데이터를 수집합니다.
구성
대상 테이블을 선택합니다. 새 테이블에 데이터를 수집하려면 + 새 테이블을 선택하고 테이블 이름을 입력합니다.
참고 항목
테이블 이름은 공백, 영숫자, 하이픈 및 밑줄을 포함하여 최대 1,024자일 수 있습니다. 특수 문자는 지원되지 않습니다.
데이터 원본을 추가하려면 스토리지 연결 문자열을 URI 필드에 붙여넣은 다음, + 아이콘을 선택합니다. 다음 표에서는 지원되는 인증 방법 및 Azure Storage에서 데이터를 수집하는 데 필요한 권한을 나열합니다.
인증 방법 개별 Blob 미확인 개체 컨테이너 Azure Data Lake Storage Gen2 공유 액세스(SAS) 토큰 읽기 및 쓰기 읽기 및 목록 읽기 및 목록 스토리지 계정 액세스 키 참고 항목
- 최대 10개의 개별 Blob을 추가하거나 단일 컨테이너에서 최대 5,000개의 Blob을 수집할 수 있습니다. 동시에 모두 수집할 수 없습니다.
- 각 Blob은 압축되지 않은 최대 1GB일 수 있습니다.
다음 선택
검사
데이터 미리 보기가 있는 검사 탭이 열립니다.
수집 프로세스를 완료하려면 종료를 선택합니다.
필요할 경우 다음을 선택합니다.
- 명령 뷰어를 선택하여 입력에서 생성된 자동 명령을 보고 복사합니다.
- 스키마 정의 파일 드롭다운을 사용하여 스키마가 유추되는 파일을 변경합니다.
- 드롭다운에서 원하는 형식을 선택하여 자동으로 유추된 데이터 형식을 변경합니다. 자세한 내용은 실시간 인텔리전스에서 지원하는 데이터 형식을 참조하세요.
- 열을 편집합니다.
- 데이터 형식에 따른 고급 옵션을 탐색합니다.
열 편집
참고 항목
- 테이블 형식(CSV, TSV, PSV)의 경우 열을 두 번 매핑할 수 없습니다. 기존 열에 매핑하려면 먼저 새 열을 삭제합니다.
- 기존 열 유형은 변경할 수 없습니다. 다른 형식의 열에 매핑하려고 하면 빈 열이 생길 수 있습니다.
테이블에서 변경할 수 있는 사항은 다음 매개 변수에 따라 다릅니다.
- 테이블 유형은 신규 또는 기존입니다.
- 매핑 유형은 신규 또는 기존입니다.
테이블 유형입니다. | 매핑 유형 | 사용 가능한 조정 |
---|---|---|
새 테이블 | 새 매핑 | 열 이름 바꾸기, 데이터 형식 변경, 데이터 원본 변경, 매핑 변환, 열 추가, 열 삭제 |
기존 테이블 | 새 매핑 | 열 추가(여기서 데이터 형식 변경, 이름 바꾸기 및 업데이트 가능) |
기존 테이블 | 기존 매핑 | 없음 |
매핑 변환
일부 데이터 형식 매핑(Parquet, JSON 및 Avro)은 간단한 수집 시간 변환을 지원합니다. 매핑 변환을 적용하려면 열 편집 창에서 열을 만들거나 업데이트합니다.
매핑 변환은 형식 문자열 또는 날짜/시간의 열에서 수행할 수 있으며 원본의 데이터 형식이 int 또는 long입니다. 지원되는 매핑 변환은 다음과 같습니다.
- DateTimeFromUnixSeconds
- DateTimeFromUnixMilliseconds
- DateTimeFromUnixMicroseconds
- DateTimeFromUnixNanoseconds
데이터 형식에 따른 고급 옵션
테이블 형식(CSV, TSV, PSV):
기존 테이블에서 테이블 형식을 수집하는 경우 고급>테이블 스키마 유지를 선택할 수 있습니다. 테이블 형식 데이터에는 원본 데이터를 기존 열에 매핑하는 데 사용되는 열 이름이 반드시 포함되지는 않습니다. 이 옵션을 선택하면 매핑은 순서대로 수행되고 테이블 스키마는 동일하게 유지됩니다. 이 옵션을 선택하지 않으면 데이터 구조에 관계없이 수신 데이터에 대해 새 열이 만들어집니다.
첫 번째 행을 열 이름으로 사용하려면 고급>첫 번째 행은 열 머리글로 선택합니다.
JSON:
JSON 데이터의 열 나누기를 확인하려면 1에서 100까지의 고급>중첩 수준을 선택합니다.
고급>오류가 있는 JSON 줄 건너뛰기를 선택하면 데이터가 JSON 형식으로 수집됩니다. 이 확인란을 선택하지 않은 상태로 두면 데이터가 multijson 형식으로 수집됩니다.
요약
데이터 수집이 완료되면 데이터 준비 창에서 세 단계가 모두 녹색 확인 표시로 나타납니다. 쿼리할 카드를 선택하거나, 수집된 데이터를 삭제하거나, 수집 요약의 대시보드를 볼 수 있습니다.
관련 콘텐츠
- 데이터베이스를 관리하려면 데이터 관리를 참조하세요.
- 쿼리를 만들고 저장하고 내보내려면 KQL 쿼리 세트에서 데이터 쿼리를 참조하세요.