Databricks Notebook의 시각화

Azure Databricks는 Databricks SQL과 Notebook 모두에서 차트 및 시각화를 기본적으로 지원합니다. 이 페이지에서는 Databricks Notebook에서 시각화를 사용하는 방법을 설명합니다. Databricks SQL에서 시각화를 사용하는 방법에 대한 자세한 내용은 Databricks SQL의 시각화를 참조하세요.

시각화 유형을 보려면 시각화 유형을 참조하세요.

중요

Azure Databricks 차트의 미리 보기 버전에 대한 자세한 내용은 미리 보기 차트 시각화를 참조하세요.

새 시각화 만들기

이 섹션의 예제를 다시 만들려면 다음 코드를 사용합니다.

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

시각화를 만들려면 결과 위 를 클릭하고 +시각화를 선택합니다. 시각화 편집기가 나타납니다.

새 시각화 메뉴

  1. 시각화 유형 드롭다운에서 형식을 선택합니다.

    시각화 편집기

  2. 시각화에 표시할 데이터를 선택합니다. 사용 가능한 필드는 선택한 형식에 따라 달라집니다.

  3. 저장을 클릭합니다.

시각화 도구

시각화 편집기에서 차트의 오른쪽 위에 마우스를 가져가면 선택, 확대/축소 및 이동과 같은 작업을 수행할 수 있는 플롯 도구 모음이 나타납니다.

Notebook 시각화 편집기 도구 모음

시각화 편집기 외부의 차트 오른쪽 위에 마우스를 가져가면 더 작은 도구 하위 집합이 나타납니다.

Notebook 차트 도구 모음

새 데이터 프로필 만들기

참고

Databricks Runtime 9.1 LTS 이상에서 사용할 수 있습니다.

데이터 프로필은 Apache Spark DataFrame, pandas DataFrame 또는 SQL 테이블의 요약 통계를 테이블 형식 및 그래픽 형식으로 표시합니다. 결과 셀에서 데이터 프로필을 만들려면 데이터 프로필을 클릭하고 + 선택합니다.

Azure Databricks는 요약 통계를 계산하고 표시합니다.

데이터 프로필

  • 숫자 및 범주 기능은 별도의 테이블에 표시됩니다.
  • 탭 위쪽에서 기능을 정렬하거나 검색할 수 있습니다.
  • 차트 열의 맨 위에서 히스토그램(표준) 또는 분위수 표시를 선택할 수 있습니다.
  • 확장을 선택하여 차트를 확대합니다.
  • 로그를 확인하여 로그 눈금에 차트를 표시합니다.
  • 히스토그램 열의 경계, 행 수 또는 분위수 값과 같은 자세한 정보를 보려면 차트 위에 커서를 놓을 수 있습니다.

프로그래밍 방식으로 데이터 프로필을 생성할 수도 있습니다. summarize 명령(dbutils.data.summarize)을 참조하세요.

시각화 및 데이터 프로필 작업

참고

데이터 프로필은 Databricks Runtime 9.1 LTS 이상에서 사용할 수 있습니다.

시각화 또는 데이터 프로필 이름 바꾸기, 복제 또는 제거

시각화 또는 데이터 프로필의 이름을 바꾸거나 복제하거나 제거하려면 탭 이름 오른쪽에 있는 아래쪽 화살표를 클릭합니다.

Notebook 시각화 드롭다운 메뉴

이름을 직접 클릭하고 이름을 바로 편집하여 이름을 변경할 수도 있습니다.

시각화 편집

시각화 아래의 시각화 편집 단추를 클릭하여 시각화 편집기를 엽니다. 변경이 완료되면 저장을 클릭합니다.

색 편집

시각화를 만들거나 편집하여 시각화의 색을 사용자 지정할 수 있습니다.

  1. 시각화를 만들거나 편집합니다.
  2. 을 클릭합니다.
  3. 색을 수정하려면 사각형을 클릭하고 다음 중 하나를 수행하여 새 색을 선택합니다.
    • 색 선택기에서 클릭합니다.
    • 16진수 값을 입력합니다.
  4. 색 선택기 외부의 아무 곳이나 클릭하여 닫고 변경 내용을 저장합니다.

계열을 일시적으로 숨기거나 표시

시각화에서 계열을 숨기려면 범례에서 계열을 클릭합니다. 계열을 다시 표시하려면 범례에서 다시 클릭합니다.

하나의 계열만 표시하려면 범례에서 계열을 두 번 클릭합니다. 다른 계열을 표시하려면 각 계열을 클릭합니다.

시각화 다운로드

.png 형식으로 시각화를 다운로드하려면 Notebook 셀 또는 시각화 편집기에서 카메라 아이콘 카메라 아이콘을 클릭합니다.

  • 결과 셀에서 커서를 셀 위로 이동하면 카메라 아이콘이 오른쪽 위에 나타납니다.

    Notebook 셀의 카메라

  • 시각화 편집기에서 차트 위로 커서를 이동할 때 카메라 아이콘이 나타납니다. 시각화 도구를 참조하세요.

dashboard 시각화 또는 데이터 프로필 추가

  1. 탭 이름 오른쪽에서 아래쪽 화살표를 클릭합니다.
  2. 추가를 선택하여 dashboard. 메뉴 옵션 새 dashboard 추가와 함께 사용 가능한 dashboard 보기 목록이 나타납니다.
  3. dashboard 선택하거나 새 dashboard 추가를 선택합니다. 새로 추가된 시각화 또는 데이터 프로필을 포함하여 dashboard 나타납니다.