패브릭 레이크하우스 탐색기 탐색

Lakehouse 탐색기 페이지는 레이크하우스 환경 내의 모든 상호 작용을 위한 중앙 허브 역할을 합니다. 탐색기는 패브릭 포털에 기본 제공됩니다. Lakehouse 탐색기를 열려면 워크로드 전환기를 구성하는 데이터 엔지니어 환경으로 전환합니다. 레이크하우스 항목을 찾아서 탐색하면 레이크하우스 데이터와 상호 작용할 수 있는 탐색기가 열립니다. 탐색기는 레이크하우스에 데이터를 원활하게 로드하고, 데이터를 탐색하고, 콘텐츠를 미리 보기하고, 다양한 데이터 관련 작업을 수행하는 게이트웨이입니다. 이 페이지는 세 개의 기본 섹션으로 나뉩니다. 즉, Lakehouse 탐색기, 기본 보기 및 리본 메뉴입니다.

Lakehouse 탐색기 환경 내의 컨트롤을 설명하는 Gif입니다.

레이크하우스 탐색기

Lakehouse 탐색기는 전체 Lakehouse의 통합된 그래픽 표현을 제공하여 사용자에게 데이터 탐색, 액세스 및 관리를 위한 직관적인 인터페이스를 제공합니다.

  • 테이블 섹션은 Lakehouse 내에서 관리되는 영역을 사용자에게 친숙한 표현으로 나타냅니다. 이 영역은 일반적으로 효율적인 데이터 처리 및 분석을 용이하게 하기 위해 구성되고 관리됩니다. 여기에서 메타스토어에서 자동으로 생성되거나 명시적으로 생성되고 등록되었는지 여부에 관계없이 모든 테이블을 찾을 수 있습니다. 미리 볼 테이블을 선택하고, 테이블 스키마를 검사하고, 기본 파일에 액세스하고, 데이터와 관련된 다양한 다른 작업을 실행할 수 있습니다.

  • 정체불명의 지역은 레이크하우스의 관리되는 영역 내에서 고유한 공간입니다. SyMS에서 연결된 테이블이 없는 관리되는 영역에 있는 폴더 또는 파일을 표시합니다. 예를 들어 사용자가 이미지 또는 오디오 파일과 같은 지원되지 않는 파일을 관리되는 영역에 업로드하는 경우 자동으로 검색되고 테이블에 연결되지 않습니다. 대신, 그들은이 정체불명의 지역에 나타납니다. 이 섹션의 주요 목적은 사용자에게 관리되는 영역에서 이러한 파일을 제거하거나 추가 처리를 위해 파일 섹션으로 전송하라는 메시지를 표시하는 것입니다.

  • 파일 섹션Lakehouse의 관리되지 않는 영역을 나타내며 다양한 원본에서 수집된 원시 데이터에 대한 "랜딩 존"으로 간주될 수 있습니다. 이 데이터를 분석에 사용하려면 추가 처리가 필요한 경우가 많습니다. 이 섹션에서는 디렉터리를 탐색하고, 미리 볼 디렉터리를 선택하고, 테이블에 폴더를 로드하고, 다양한 다른 작업을 수행할 수 있습니다. 파일 섹션에는 폴더 수준 개체표시됩니다. 파일 수준 개체를 보려면 기본 보기 영역을 활용해야 합니다.

기본 보기 영역

Lakehouse 페이지의 기본 보기 영역은 대부분의 데이터 상호 작용이 발생하는 공간입니다. 보기는 선택한 항목에 따라 변경됩니다. 개체 탐색기에는 레이크의 폴더 수준 계층 구조만 표시되므로 기본 보기 영역은 파일 탐색, 파일 및 테이블 미리 보기 및 기타 다양한 작업에 사용됩니다.

테이블 미리 보기

테이블 미리 보기 Datagrid에는 데이터 조작을 향상하여 데이터 작업을 더욱 원활하게 하는 강력한 기능 제품군이 장착되어 있습니다. 몇 가지 주요 기능은 다음과 같습니다.

  • 간단한 클릭으로 열을 오름차순 또는 내림차순으로 정렬합니다. 이 기능은 대규모 의미 체계 모델을 사용하거나 추세를 신속하게 식별해야 하는 경우 데이터 조직을 완전히 제어할 수 있습니다.

  • 하위 문자열 또는 테이블의 사용 가능한 값 목록에서 선택하여 데이터를 필터링합니다.

  • 기본 설정에 맞게 데이터 뷰를 조정하도록 열 크기를 조정합니다. 이 기능을 사용하면 필수 데이터의 우선 순위를 지정하거나 더 광범위한 정보를 포함하도록 보기 필드를 확장할 수 있습니다.

파일 미리 보기

Lakehouse에서 데이터 파일을 미리 보는 것은 데이터 품질, 이해 및 전반적인 데이터 관리 효율성을 향상시키는 다양한 이점을 제공합니다. 데이터 전문가가 정보에 입각한 의사 결정을 내리고, 리소스 할당을 최적화하고, 분석이 안정적이고 가치 있는 데이터를 기반으로 되도록 할 수 있습니다.

미리 보기는 다음 파일 형식 에 사용할 수 있습니다. bmp, css, csv, gif, html, jpeg, jpg, js, json, md, mjs, png, ps1, py, svg, ts, tsx, txt, xml,yaml

리본

레이크하우스 리본은 레이크하우스 내에서 필수 작업을 수행하는 편리한 방법을 제공하는 빠른 액세스 작업 모음입니다. 여기에서 Lakehouse를 새로 고치고, 설정을 업데이트하고, 데이터를 로드하고, Notebook을 만들거나 열고, 새 사용자 지정 의미 체계 모델을 만들고, OneLake 데이터 액세스를 쉽게 관리할 수 있습니다.

레이크하우스에 데이터를 로드하는 다양한 방법

탐색기 페이지에서 Lakehouse에 데이터를 로드하는 방법에는 여러 가지가 있습니다.

  • 로컬 파일/폴더 업로드: 로컬 컴퓨터에서 Lakehouse의 파일 섹션으로 직접 데이터를 쉽게 업로드합니다. 자세한 내용은 여기**를 참조하세요.

  • Notebook 코드: 사용 가능한 Spark 라이브러리를 활용하여 데이터 원본에 연결하고 데이터를 데이터 프레임에 로드한 다음, Lakehouse에 저장합니다. 여기에서 추가 정보를 찾습니다**.

  • 파이프라인의 복사 도구: 다양한 데이터 원본에 커넥트 원래 형식으로 데이터를 배치하거나 Delta 테이블로 변환합니다. 자세한 내용은 여기**를 참조하세요.

  • 데이터 흐름 Gen 2: 데이터를 가져오고, 변환하고, Lakehouse에 게시하는 데이터 흐름을 만듭니다. 자세한 내용은 여기**를 참조하세요.

  • 바로 가기 바로 가기를 만들어 기존 데이터를 직접 복사하지 않고도 Lakehouse에 연결합니다. 여기에서 추가 정보를 찾습니다**.

  • 샘플: 샘플 데이터를 빠르게 수집하여 의미 체계 모델 및 테이블 탐색을 빠르게 시작합니다.

레이크하우스에서 데이터를 로드하는 가장 좋은 방법을 이해하기 위해 다양한 사용 사례를 검색합니다.

Lakehouse의 SQL 분석 엔드포인트에 액세스

리본의 오른쪽 위 영역에 있는 드롭다운을 사용하여 Lakehouse 환경에서 직접 SQL 분석 엔드포인트에 액세스할 수 있습니다. 이 빠른 액세스 방법을 사용하면 즉시 t-sql 모드로 전환됩니다. 이를 통해 레이크의 Delta 테이블 위에 직접 작업하여 보고 준비를 할 수 있습니다.

이 가이드를 통해 레이크하우스 탐색기와 다양한 기능을 최대한 활용할 수 있기를 바랍니다. 자유롭게 데이터 관리 작업을 탐색하고, 실험하고, 보다 효율적으로 만들 수 있습니다.