다음을 통해 공유


Databricks 노트북의 시각화

Azure Databricks는 Databricks SQL 및 Notebook 모두에서 차트 및 시각화를 기본적으로 지원합니다. 이 페이지에서는 Databricks Notebook에서 시각화를 사용하는 방법을 설명합니다. Databricks SQL에서 시각화를 사용하는 방법에 대한 자세한 내용은 Databricks SQL의 시각화를 참조하세요.

시각화 유형을 보려면 시각화 형식을 참조 하세요.

새 시각화 만들기

이 섹션의 예제를 다시 만들려면 다음 코드를 사용합니다.

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

시각화를 만들려면 결과 위의 클릭하고 시각화선택합니다. 시각화 편집기가 나타납니다.

새 시각화 메뉴

  1. Visualization Type(시각화 형식) 드롭다운에서 형식을 선택합니다.

    시각화 편집기

  2. 시각화에 표시할 데이터를 선택합니다. 사용 가능한 필드는 선택한 형식에 따라 달라집니다.

  3. 저장을 클릭합니다.

새 데이터 프로필 만들기

참고 항목

Databricks Runtime 9.1 LTS 이상에서 지원됩니다.

데이터 프로필은 Apache Spark DataFrame, pandas DataFrame 또는 SQL 테이블의 요약 통계를 테이블 형식과 그래픽 형식으로 표시합니다. 결과 셀에서 데이터 프로필을 만들려면 클릭하고 데이터 프로필선택합니다.

Azure Databricks는 요약 통계를 계산하고 표시합니다.

데이터 프로필

  • 숫자 및 범주 기능은 별도의 테이블에 표시됩니다.
  • 탭 위쪽에서 기능을 정렬하거나 검색할 수 있습니다.
  • 차트 열의 맨 위에서 히스토그램(Standard) 또는 분위수로 표시하도록 선택할 수 있습니다.
  • 차트를 확대하려면 확장을 선택합니다.
  • 로그를 확인하여 로그 눈금에 차트를 표시합니다.
  • 히스토그램 열의 경계와 그 안에 있는 행 수 또는 분위수 값과 같은 자세한 정보를 보려면 차트 위에 커서를 놓을 수 있습니다.

프로그래밍 방식으로 데이터 프로필을 생성할 수도 있습니다.요약 명령(dbutils.data.summarize)을 참조하세요.

시각화 및 데이터 프로필 작업

참고 항목

데이터 프로필은 Databricks Runtime 9.1 LTS 이상에서 사용할 수 있습니다.

시각화 또는 데이터 프로필 이름 바꾸기, 복제 또는 제거

시각화 또는 데이터 프로필의 이름을 바꾸거나 복제하거나 제거하려면 탭 이름 오른쪽에 있는 아래쪽 화살표를 클릭합니다. 메뉴에서 대시보드를 만들 수도 있습니다.

참고 항목

셀에 데이터 프로필이 포함된 경우 연결된 시각화 및 데이터 프로필은 Notebook 대시보드에만 추가할 수 있습니다. 시각화만 포함된 셀의 경우, 드롭다운에 대시보드에 추가 메뉴 항목이 추가로 표시됩니다. 을(를) 참조하여 대시보드에 시각화를 추가하세요.

노트북 데이터 프로필 드롭다운 메뉴

이름을 직접 클릭하고 바로 편집하여 이름을 변경할 수도 있습니다.

시각화 편집

시각화 아래를 클릭하여 시각화 편집 단추 시각화 편집기를 엽니다. 변경을 마쳤으면 저장을 클릭합니다.

색 편집

시각화를 만들거나 편집할 때 시각화의 색을 사용자 지정할 수 있습니다.

  1. 시각화를 만들거나 편집합니다.
  2. 을 클릭합니다.
  3. 색을 수정하려면 사각형을 클릭하고 다음 중 하나를 수행하여 새 색을 선택합니다.
    • 색 선택기에서 색을 클릭합니다.
    • 16진수 값을 입력합니다.
  4. 색 선택기 외부의 아무 곳이나 클릭하여 닫습니다.
  5. 저장시각화 편집기에서 클릭하여 변경 내용을 저장합니다.

계열 선택

차트에서 분석할 특정 계열을 선택하려면 다음 명령을 사용합니다.

  • 범례 항목 하나를 클릭하여 해당 계열을 선택하세요.
  • Cmd/Ctrl 키를 누르고 범례 항목을 클릭하여 여러 계열을 선택하거나 선택 취소하세요.

계열 선택

정렬된 툴팁

보다 쉽게 분석할 수 있도록, 크기순으로 정렬된 꺾은선형 차트와 정렬되지 않은 세로 막대형 차트에 도구 설명을 사용합니다.

정렬된 도구 설명

데이터 밀도가 높은 차트의 경우 개별 데이터 요소를 확대하면 세부 정보를 조사하고 이상값을 자르는 데 도움이 될 수 있습니다. 차트를 확대하려면 캔버스를 클릭하고 끌어옵니다. 확대/축소를 지우려면 캔버스를 마우스로 가리키고 시각화의 오른쪽 위 모서리에 있는 확대/축소 지우기 단추를 클릭합니다.

확대하여 세부 정보 확인

PNG 파일로 시각화 다운로드

시각화를 PNG 파일로 다우로드하려면 캔버스를 마우스로 가리키고 오른쪽 위 모서리에 있는 다운로드 아이콘을 클릭합니다.

시각화를 PNG 파일로 내보내려면 다운로드를 클릭하세요

png 파일이 디바이스에 다운로드됩니다.

대시보드에 시각화 추가

  1. 탭 이름 오른쪽에 있는 아래쪽 화살표를 클릭합니다.
  2. 대시보드에 추가을 선택합니다. 사용 가능한 대시보드 보기 목록과 함께 새 대시보드에 추가 메뉴 옵션이 표시됩니다.
  3. 대시보드를 선택하거나 새 대시보드에 추가을 선택합니다. 새로 추가된 시각화를 포함하여 대시보드가 나타납니다.

전통적인 시각화

최신 버전의 차트 시각화는 기본적으로 설정됩니다. 이 섹션의 설정에서는 이전 차트로 작업하거나 최신 버전이 꺼져 있는 경우 발생할 수 있는 레거시 시각화에 대해 설명합니다.

시각화 도구

차트의 오른쪽 위에 마우스를 가져가면 선택, 확대/축소 및 이동과 같은 작업을 수행할 수 있는 그림 도구 모음이 나타납니다.

Notebook 시각화 편집기 도구 모음

시각화 다운로드

.png 형식으로 시각화를 다운로드하려면 Notebook 셀 또는 시각화 편집기에서 카메라 아이콘 카메라 아이콘을 클릭합니다.

  • 결과 셀에서 커서를 셀 위로 이동하면 카메라 아이콘이 오른쪽 위에 나타납니다.

    Notebook 셀의 카메라

  • 시각화 편집기에서 차트 위로 커서를 이동할 때 카메라 아이콘이 나타납니다. 시각화 도구를 참조하세요.

시리즈를 일시적으로 숨기거나 표시

시각화에서 계열을 숨기려면 범례에서 계열을 클릭합니다. 계열을 다시 표시하려면 범례에서 다시 클릭합니다.

하나의 계열만 표시하려면 범례에서 계열을 두 번 클릭합니다. 다른 계열을 표시하려면 각 계열을 클릭합니다.