데이터 검색

Azure Databricks는 Databricks Data Intelligence 플랫폼을 통해 액세스할 수 있는 데이터 자산의 검색을 간소화하는 도구 및 제품 제품군을 제공합니다. 이 문서에서는 작업 영역에서 액세스하도록 이미 구성된 데이터를 검색하고 미리 보는 방법에 대한 개요를 제공합니다.

  • 데이터 원본에 연결하려면 데이터 원본에 대한 커넥트 참조하세요.
  • Databricks Marketplace에서 데이터에 액세스하는 방법에 대한 자세한 내용은 Databricks Marketplace란?을 참조하세요.

이 섹션의 항목에서는 데이터 개체 및 데이터 파일을 탐색하는 데 중점을 줍니다. Notebook, SQL 쿼리, 라이브러리 및 모델과 같은 자산 작업에 대한 자세한 내용은 작업 영역 탐색을 참조 하세요.

데이터 세트 또는 EDA(예비 데이터 분석)와 관련된 기타 작업에 대한 요약 통계 생성에 대한 지침을 찾는 경우 Azure Databricks: 도구 및 기술에 대한 예비 데이터 분석을 참조 하세요.

데이터 자산을 검색하려면 어떻게 해야 합니까?

Azure Databricks의 데이터 검색 도구는 다음과 같은 일반 범주에 속합니다.

  • AI 지원 인사이트, 요약 및 검색.
  • 키워드 검색
  • UI를 사용한 카탈로그 탐색
  • 프로그래밍 방식 목록 및 메타데이터 탐색

데이터 검색 도구는 Unity 카탈로그가 관리하는 데이터에 최적화되어 있습니다. Unity 카탈로그 개체로 등록되지 않은 데이터 자산은 이러한 방법 중 일부를 사용하여 검색할 수 없습니다.

UI를 사용하여 데이터 찾기

카탈로그 탐색기는 데이터 자산을 탐색하고 관리하기 위한 도구를 제공합니다. 작업 영역 사이드바에서 카탈로그를 Catalog icon사용하여 카탈로그 탐색기에 액세스합니다. 카탈로그 탐색기란?을 참조하세요.

Notebook 및 SQL 쿼리 편집기는 데이터베이스 개체를 탐색하기 위한 카탈로그 탐색기도 제공합니다. 이러한 인터페이스에서 카탈로그 아이콘을 클릭하여 코드 편집기에서 벗어나지 않고 카탈로그 탐색기를 확장하거나 축소합니다.

관심 있는 데이터 세트를 검색한 후에는 Insights 탭을 사용하여 작업 영역에서 데이터가 사용되는 방법을 알아볼 수 있습니다. 테이블의 자주 사용하는 쿼리 및 사용자 보기를 참조하세요.

프로그래밍 방식으로 데이터 탐색

모든 데이터베이스 개체의 SHOW 명령을 사용하여 Unity 카탈로그에 등록된 자산을 검색할 수 있습니다. LIST 명령, %fs 매직 명령 또는 Databricks 유틸리티를 사용하여 파일을 나열합니다.

스토리지 탐색 및 데이터 파일 찾기 및 데이터베이스 개체 탐색을 참조하세요.

데이터 주석 검토

설명을 검토하여 Lakehouse에서 사용할 수 있는 데이터 세트의 내용에 대해 알아볼 수 있습니다. 카탈로그, 스키마, 테이블 및 열을 비롯한 데이터 개체에 주석을 설정할 수 있습니다. 카탈로그 탐색기에서 또는 개체에 대한 명령을 사용하여 주석을 DESCRIBE 볼 수 있습니다.

카탈로그 탐색기는 테이블에 AI 생성 주석을 제공할 수 있으므로 데이터 자산 소유자가 데이터 세트에 대한 다양한 개요를 쉽게 제공할 수 있습니다. 테이블에 AI 생성 주석 추가를 참조 하세요.

사용자는 필요에 따라 카탈로그 탐색기에서 렌더링되는 markdown을 사용하여 테이블 및 기타 데이터베이스 개체에 대한 주석을 제공할 수도 있습니다. markdown 주석을 사용하여 카탈로그 탐색기에서 문서 데이터를 참조 하세요.

레이크하우스에서 테이블 검색

Azure Databricks의 검색 창을 사용하여 Unity 카탈로그에 등록된 테이블을 찾을 수 있습니다. 키워드(keyword) 검색을 수행하거나 의미 체계 검색을 사용하여 검색 쿼리와 관련된 데이터 세트 또는 열을 찾을 수 있습니다. 검색은 볼 수 있는 권한이 있는 테이블에 대한 결과만 반환합니다. 검색은 테이블 이름, 열 이름, 테이블 주석 및 열 주석을 검토합니다. 작업 영역 개체 검색을 참조 하세요.