다음을 통해 공유


OneLake에서 데이터 가져오기

이 문서에서는 OneLake에서 새 테이블 또는 기존 테이블로 데이터를 가져오는 방법을 알아봅니다.

필수 조건

레이크하우스에서 파일 경로 복사

  1. 환경 전환기에서 데이터 엔지니어링을 선택합니다.

  2. 사용하려는 데이터 원본을 포함하는 레이크하우스 환경을 선택합니다.

  3. 원하는 파일 위에 커서를 놓고 추가 메뉴를 선택한 다음, 속성을 선택합니다.

    Important

    • 폴더 경로는 지원되지 않습니다.
    • 와일드카드(*)는 지원되지 않습니다.

    레이크하우스 파일의 드롭다운 메뉴 스크린샷. 속성 옵션이 강조 표시됩니다.

  4. URL에서 클립보드로 복사 아이콘을 선택하고 나중에 검색할 위치에 저장합니다.

    레이크하우스 파일의 속성 창 스크린샷. 파일 URL 오른쪽에 있는 복사 아이콘이 강조 표시됩니다.

  5. 작업 영역으로 돌아가서 KQL 데이터베이스를 선택합니다.

Source

  1. KQL 데이터베이스의 하단 리본에서 데이터 가져오기를 선택합니다.

    데이터 가져오기 창에서 원본 탭이 선택됩니다.

  2. 사용 가능한 목록에서 데이터 원본을 선택합니다. 이 예제에서는 OneLake에서 데이터를 수집합니다.

    원본 탭이 선택된 데이터 가져오기 창의 스크린샷.

구성

  1. 대상 테이블을 선택합니다. 새 테이블에 데이터를 수집하려면 + 새 테이블을 선택하고 테이블 이름을 입력합니다.

    참고 항목

    테이블 이름은 공백, 영숫자, 하이픈 및 밑줄을 포함하여 최대 1,024자일 수 있습니다. 특수 문자는 지원되지 않습니다.

  2. OneLake 파일에서, 레이크하우스에서 파일 경로 복사에 복사한 레이크하우스의 파일 경로를 붙여넣습니다.

    참고 항목

    각각 최대 1GB의 압축되지 않은 크기로 최대 10개의 항목을 추가할 수 있습니다.

    새 테이블이 입력되고 OneLake 파일 경로가 추가된 구성 탭의 스크린샷.

  3. 다음을 선택합니다.

검사

데이터 미리 보기가 있는 검사 탭이 열립니다.

수집 프로세스를 완료하려면 종료를 선택합니다.

삽입 탭의 스크린샷.

필요할 경우 다음을 선택합니다.

열 편집

참고 항목

  • 테이블 형식(CSV, TSV, PSV)의 경우 열을 두 번 매핑할 수 없습니다. 기존 열에 매핑하려면 먼저 새 열을 삭제합니다.
  • 기존 열 유형은 변경할 수 없습니다. 다른 형식의 열에 매핑하려고 하면 빈 열이 생길 수 있습니다.

테이블에서 변경할 수 있는 사항은 다음 매개 변수에 따라 다릅니다.

  • 테이블 유형은 신규 또는 기존입니다.
  • 매핑 유형은 신규 또는 기존입니다.
테이블 유형입니다. 매핑 유형 사용 가능한 조정
새 테이블 새 매핑 열 이름 바꾸기, 데이터 형식 변경, 데이터 원본 변경, 매핑 변환, 열 추가, 열 삭제
기존 테이블 새 매핑 열 추가(여기서 데이터 형식 변경, 이름 바꾸기 및 업데이트 가능)
기존 테이블 기존 매핑 없음

편집을 위해 열려 있는 열의 스크린샷.

매핑 변환

일부 데이터 형식 매핑(Parquet, JSON 및 Avro)은 간단한 수집 시간 변환을 지원합니다. 매핑 변환을 적용하려면 열 편집 창에서 열을 만들거나 업데이트합니다.

매핑 변환은 형식 문자열 또는 날짜/시간의 열에서 수행할 수 있으며 원본의 데이터 형식이 int 또는 long입니다. 지원되는 매핑 변환은 다음과 같습니다.

  • DateTimeFromUnixSeconds
  • DateTimeFromUnixMilliseconds
  • DateTimeFromUnixMicroseconds
  • DateTimeFromUnixNanoseconds

데이터 형식에 따른 고급 옵션

테이블 형식(CSV, TSV, PSV):

  • 기존 테이블에서 테이블 형식을 수집하는 경우 고급>테이블 스키마 유지를 선택할 수 있습니다. 테이블 형식 데이터에는 원본 데이터를 기존 열에 매핑하는 데 사용되는 열 이름이 반드시 포함되지는 않습니다. 이 옵션을 선택하면 매핑은 순서대로 수행되고 테이블 스키마는 동일하게 유지됩니다. 이 옵션을 선택하지 않으면 데이터 구조에 관계없이 수신 데이터에 대해 새 열이 만들어집니다.

  • 첫 번째 행을 열 이름으로 사용하려면 고급>첫 번째 행은 열 머리글로 선택합니다.

    고급 CSV 옵션의 스크린샷.

JSON:

  • JSON 데이터의 열 나누기를 확인하려면 1에서 100까지의 고급>중첩 수준을 선택합니다.

  • 고급>오류가 있는 JSON 줄 건너뛰기를 선택하면 데이터가 JSON 형식으로 수집됩니다. 이 확인란을 선택하지 않은 상태로 두면 데이터가 multijson 형식으로 수집됩니다.

    고급 JSON 옵션의 스크린샷.

요약

데이터 수집이 완료되면 데이터 준비 창에서 세 단계가 모두 녹색 확인 표시로 나타납니다. 쿼리할 카드를 선택하거나, 수집된 데이터를 삭제하거나, 수집 요약의 대시보드를 볼 수 있습니다.

수집이 완료된 요약 페이지의 스크린샷.