Azure Storage에서 데이터 가져오기

이 문서에서는 Azure Storage(ADLS Gen2 컨테이너, Blob 컨테이너 또는 개별 Blob)에서 새 테이블 또는 기존 테이블로 데이터를 가져오는 방법을 알아봅니다.

필수 조건

원본

  1. KQL 데이터베이스의 아래쪽 리본에서 데이터 가져오기를 선택합니다.

    데이터 가져오기 창에서 원본 탭이 선택됩니다.

  2. 사용 가능한 목록에서 데이터 원본을 선택합니다. 이 예제에서는 Azure Storage에서 데이터를 수집합니다.

    Screenshot of get data window with source tab selected.

구성

  1. 대상 테이블을 선택합니다. 새 테이블에 데이터를 수집하려면 + 새 테이블을 선택하고 테이블 이름을 입력합니다.

    참고 항목

    테이블 이름은 공백, 영숫자, 하이픈 및 밑줄을 포함하여 최대 1024자까지 가능합니다. 특수 문자는 지원되지 않습니다.

  2. 데이터 원본을 추가하려면 스토리지 연결 문자열 URI 필드에 붙여넣은 다음 +선택합니다. 다음 표에서는 지원되는 인증 방법 및 Azure Storage에서 데이터를 수집하는 데 필요한 권한을 나열합니다.

    인증 방법 개별 Blob Blob 컨테이너 Azure Data Lake Storage Gen2
    SAS(공유 액세스) 토큰 읽기 및 쓰기 읽기 및 목록 읽기 및 목록
    스토리지 계정 액세스 키

    참고 항목

    • 최대 10개의 개별 Blob을 추가하거나 단일 컨테이너에서 최대 5,000개의 Blob을 수집할 수 있습니다. 둘 다 동시에 수집할 수 없습니다.
    • 각 Blob은 압축되지 않은 최대 1GB일 수 있습니다.
    1. Blob 컨테이너 또는 Azure Data Lake Storage Gen2에 대한 연결 문자열 붙여넣은 경우 다음 선택적 필터를 추가할 수 있습니다.

      Screenshot of configure tab with new table entered and one sample data file selected.

      설정 필드 설명
      파일 필터(선택 사항)
      Folder path 특정 폴더 경로를 사용하여 파일을 수집하도록 데이터를 필터링합니다.
      파일 확장명 특정 파일 확장명만 있는 파일을 수집하도록 데이터를 필터링합니다.
  3. 다음 선택

검사

데이터 미리 보기가 있는 검사 탭이 열립니다.

수집 프로세스를 완료하려면 마침을 선택합니다.

Screenshot of the inspect tab.

필요할 경우 다음을 선택합니다.

  • 명령 뷰어를 선택하여 입력에서 생성된 자동 명령을 보고 복사합니다.
  • 스키마 정의 파일 드롭다운을 사용하여 스키마가 유추되는 파일을 변경합니다.
  • 드롭다운에서 원하는 형식을 선택하여 자동으로 유추된 데이터 형식을 변경합니다. 자세한 내용은 실시간 분석에서 지원하는 데이터 형식을 참조 하세요.
  • 열을 편집합니다.
  • 데이터 형식에 따라 고급 옵션을 탐색 합니다.

열 편집

참고 항목

  • 테이블 형식(CSV, TSV, PSV)의 경우 열을 두 번 매핑할 수 없습니다. 기존 열에 매핑하려면 먼저 새 열을 삭제합니다.
  • 기존 열 유형은 변경할 수 없습니다. 다른 형식의 열에 매핑하려고 하면 빈 열이 생길 수 있습니다.

테이블에서 변경할 수 있는 사항은 다음 매개 변수에 따라 다릅니다.

  • 테이블 유형은 신규 또는 기존입니다.
  • 매핑 유형은 신규 또는 기존입니다.
테이블 유형입니다. 매핑 유형 사용 가능한 조정
새 테이블 새 매핑 열 이름 바꾸기, 데이터 형식 변경, 데이터 원본 변경, 매핑 변환, 열 추가, 열 삭제
기존 테이블 새 매핑 열 추가(데이터 형식 변경, 이름 바꾸기 및 업데이트 가능)
기존 테이블 기존 매핑 없음

Screenshot of columns open for editing.

매핑 변환

일부 데이터 형식 매핑(Parquet, JSON 및 Avro)은 간단한 수집 시간 변환을 지원합니다. 매핑 변환을 적용하려면 열 편집 창에서 열을 만들거나 업데이트합니다 .

데이터 형식이 int 또는 long인 원본을 사용하여 문자열 또는 datetime 형식의 열에서 매핑 변환을 수행할 수 있습니다. 지원되는 매핑 변환은 다음과 같습니다.

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

데이터 형식을 기반으로 하는 고급 옵션

테이블 형식(CSV, TSV, PSV):

  • 기존 테이블에서 테이블 형식을 수집하는 경우 고급>유지 테이블 스키마를 선택할 수 있습니다. 테이블 형식 데이터에는 원본 데이터를 기존 열에 매핑하는 데 사용되는 열 이름이 반드시 포함되지는 않습니다. 이 옵션을 검사 매핑은 순서에 따라 수행되고 테이블 스키마는 동일하게 다시 기본. 이 옵션이 검사 않으면 데이터 구조에 관계없이 들어오는 데이터에 대한 새 열이 만들어집니다.

  • 첫 번째 행을 열 이름으로 사용하려면 고급>첫 번째 행을 열 머리글로 선택합니다.

    Screenshot of advanced CSV options.

JSON:

  • JSON 데이터의 열 나누기를 확인하려면 1에서 100까지의 고급>중첩 수준을 선택합니다.

  • 오류가 있는 고급>건너뛰기 JSON 줄을 선택하면 데이터가 JSON 형식으로 수집됩니다. 이 검사 상자를 선택하지 않은 상태로 두면 데이터가 multijson 형식으로 수집됩니다.

    Screenshot of advanced JSON options.

요약

데이터 준비 창에서 데이터 수집이 성공적으로 완료되면 세 단계 모두 녹색 검사 표시로 표시됩니다. 쿼리할 카드 선택하거나, 수집된 데이터를 삭제하거나, 수집 요약의 대시보드를 볼 수 있습니다.

Screenshot of summary page with successful ingestion completed.

  • 데이터베이스를 관리하려면 데이터 관리를 참조 하세요.
  • 쿼리를 만들고 저장하고 내보내려면 KQL 쿼리 세트의 쿼리 데이터를 참조 하세요.