Notebook을 클러스터에 연결하고 하나 이상의 셀을 실행했다면 Notebook이 상태를 가지며 출력을 표시합니다. 이 섹션에서는 Notebook 상태 및 출력을 관리하는 방법을 설명합니다.
노트북의 상태 및 출력 지우기
Notebook 상태 및 출력을 지우려면 실행 메뉴 아래쪽에 있는 지우기 옵션 중 하나를 선택합니다.
메뉴 옵션 | 설명 |
---|---|
모든 셀 출력 지우기 | 셀 출력을 지웁니다. 이 기능은 Notebook을 공유하면서 결과를 포함하지 않으려는 경우에 유용합니다. |
상태 초기화 | 함수 및 변수 정의, 데이터 및 가져온 라이브러리를 포함하여 Notebook 상태를 지웁니다. |
상태 및 출력을 초기화 | 셀 출력과 노트북 상태를 지웁니다. |
상태 지우기 및 모두 실행 | Notebook 상태를 지우고 새 실행을 시작합니다. |
결과 테이블
셀을 실행하면 결과가 결과 테이블에 표시됩니다. 결과 테이블을 사용하여 다음을 수행할 수 있습니다.
- 테이블 형식 결과 데이터의 열 또는 기타 하위 집합을 클립보드에 복사합니다.
- 결과 테이블에 대한 텍스트 검색을 수행합니다.
- 데이터 정렬 및 필터링
- 키보드 화살표 키를 사용하여 표 셀 사이를 이동합니다.
- 원하는 텍스트를 두 번 클릭하고 끌어 열 이름 또는 셀 값의 일부를 선택합니다.
- 열 탐색기를 사용하여 열을 검색, 표시 또는 숨기기, 고정 및 다시 정렬할 수 있습니다.
결과 테이블에 대한 제한을 보려면 Notebook 결과 테이블 제한참조하세요.
데이터 선택
결과 테이블에서 데이터를 선택하려면 다음 중 원하는 작업을 수행합니다.
- 데이터 또는 데이터의 하위 집합을 클립보드에 복사합니다.
- 열 또는 행 머리글을 클릭하세요.
- 표의 왼쪽 위 셀을 클릭하여 전체 표를 선택합니다.
- 커서를 한 세트의 셀 위로 드래그하여 선택합니다.
측면 패널을 열어 선택 정보를 보려면 오른쪽 위 모서리에 있는 아이콘을 클릭하세요. 이 아이콘은 검색 상자 옆에 있습니다.
클립보드에 데이터 복사
결과 테이블을 CSV 형식으로 클립보드에 복사하려면 테이블 제목 탭 옆의 아래쪽 화살표를 클릭한 다음 결과 복사를 클릭하여 클립보드로 이동합니다.
또는 테이블의 왼쪽 위에 있는 상자를 클릭하여 전체 테이블을 선택한 다음 마우스 오른쪽 단추를 클릭하고 드롭다운 메뉴에서 복사 를 선택합니다.
선택한 데이터를 복사하는 방법에는 여러 가지가 있습니다.
- MacOS에서는
Cmd + C
을(를), Windows에서는Ctrl + C
을(를) 눌러 결과를 CSV 형식으로 클립보드에 복사합니다. - 마우스 오른쪽 단추를 클릭하고 복사 를 선택하여 결과를 CSV 형식으로 클립보드에 복사합니다.
- 마우스 오른쪽 단추를 클릭하고 복사를 선택하여 선택한 데이터를 CSV, TSV 또는 Markdown 형식으로 복사합니다.
결과 정렬
결과 테이블을 열의 값으로 정렬하려면 커서를 열 이름 위로 가리킵니다. 열 이름을 포함하는 아이콘이 셀 오른쪽에 나타납니다. 화살표를 클릭하여 열을 정렬합니다.
정렬하는 방법
여러 열을 기준으로 정렬하려면 Shift 키를 누른 채 열의 정렬 화살표를 클릭합니다.
정렬은 기본적으로 자연 정렬 순서를 따릅니다. 어휘 정렬 순서를 적용하려면 SQL 또는 사용자 환경에서 사용할 수 있는 해당 ORDER BY
함수를 사용합니다SORT
.
결과 필터링
결과 테이블의 필터를 사용하여 데이터를 자세히 살펴봅니다. 결과 테이블에 적용된 필터는 시각화에도 영향을 줍니다. 기본 쿼리 또는 데이터 세트를 수정하지 않고 대화형 탐색을 사용할 수 있습니다. 시각화를 필터링하는 방법을 참조하세요
필터를 만드는 방법에는 여러 가지가 있습니다.
Databricks 어시스턴트
도우미와 함께 자연어 프롬프트 사용
Databricks Assistant를 사용하도록 설정한 경우 자연어 프롬프트를 사용하여 필터를 만들 수 있습니다.
-
을 클릭합니다. 셀 결과의 오른쪽 위에 있습니다.
- 표시되는 대화 상자에서 원하는 필터를 설명하는 텍스트를 입력합니다.
-
을 클릭합니다. 도우미가 필터를 생성하고 적용합니다.
Assistant를 사용하여 추가 필터를 만들려면 필터 옆에 있는 을 클릭하여 다른 프롬프트를 입력하세요.
자연어 프롬프트를 사용하여 데이터 필터링을 참조하세요.
필터 대화 상자
기본 제공 필터 대화 상자 사용
- Databricks Assistant를 사용하도록 설정하지 않은 경우
을 클릭합니다. 셀 결과의 오른쪽 위에 있는 필터 대화 상자를 엽니다.
클릭하여 이 대화 상자에 액세스할 수도 있습니다.
- 필터링할 열을 선택합니다.
- 적용할 필터 규칙을 선택합니다.
- 필터링할 값을 선택합니다.
값별
특정 값으로 필터링
- 결과 테이블에서 해당 값이 있는 셀을 마우스 오른쪽 단추로 클릭합니다.
- 드롭다운 메뉴에서 이 값으로 필터링 을 선택합니다.
열 단위로
특정 열을 필터링하기
- 필터링할 열 위로 마우스를 가져다 놓습니다.
-
을 클릭합니다.
- 필터를 클릭합니다.
- 필터링할 값을 선택합니다.
필터를 일시적으로 사용하거나 사용하지 않도록 설정하려면 대화 상자에서 사용/사용 안함 단추를 전환합니다.
필터를 삭제하려면 을 클릭합니다. 필터 이름 옆에 있는
.
전체 데이터 세트에 필터 적용
기본적으로 필터는 결과 테이블에 표시된 결과에만 적용됩니다. 반환된 데이터가 잘리는 경우(예: 쿼리가 10,000개 이상의 행을 반환하거나 데이터 세트가 2MB보다 큰 경우) 필터는 반환된 행에만 적용됩니다. 표의 오른쪽 위에 있는 메모는 필터가 잘린 데이터에 적용되었음을 나타냅니다.
대신 전체 데이터 세트를 필터링하도록 선택할 수 있습니다. 잘린 데이터 클릭한 다음 전체 데이터 세트 선택합니다. 데이터 세트의 크기에 따라 필터를 적용하는 데 시간이 오래 걸릴 수 있습니다.
필터링된 결과에서 쿼리 만들기
SQL을 기본 언어로 사용하는 Notebook의 필터링된 결과 테이블 또는 시각화에서 필터가 적용된 새 쿼리를 만들 수 있습니다. 테이블 또는 시각화의 오른쪽 위에서 쿼리 만들기를 클릭합니다. 쿼리는 Notebook의 다음 셀로 추가됩니다.
만든 쿼리는 원래 쿼리 위에 필터를 적용합니다. 이를 통해 더 작고 관련성이 높은 데이터 세트를 사용하여 보다 효율적인 데이터 탐색 및 분석을 수행할 수 있습니다.
열 탐색
열이 많은 테이블 작업을 용이하게 하려면 열 탐색기를 사용할 수 있습니다. 열 탐색기를 열려면 결과 테이블의 오른쪽 위에 있는 )을 클릭합니다.
열 탐색기를 사용하면 다음을 수행할 수 있습니다.
- 열 검색: 검색 창에 입력하여 열 목록을 필터링합니다. 탐색기에서 열을 클릭하여 결과 테이블 내에서 탐색합니다.
- 열 표시 또는 숨기기: 확인란을 사용하여 열 표시 유형을 제어합니다. 위쪽의 확인란은 모든 열의 표시 여부를 한 번에 전환합니다. 이름 옆에 있는 확인란을 사용하여 개별 열을 표시하거나 숨길 수 있습니다.
- 열 고정: 열 이름을 마우스로 가리켜 고정 아이콘을 표시합니다. 핀 아이콘을 클릭하여 열을 고정합니다. 결과 테이블을 가로로 스크롤할 때에도 고정된 열은 계속 표시됩니다.
-
열 다시 정렬: 열 이름 오른쪽에 있는 끌기 아이콘(
)을 클릭하고 누른 다음 열을 원하는 새 위치로 끌어서 놓습니다. 그러면 결과 테이블의 열이 다시 정렬됩니다.
열 형식 지정
열 머리글은 열의 데이터 타입을 나타냅니다. 예를 들어 정수 형식 열 대한
결과 테이블의 열을 통화, 백분율, URL 등의 형식으로 서식을 지정하고, 소수점 자리수를 조절하여 보다 명확한 테이블을 만들 수 있습니다.
열 이름에 있는 케밥 메뉴의 열 서식을 지정합니다.
다운로드 결과
기본적으로 결과 다운로드는 사용 설정되어 있습니다. 이 설정을 전환하려면 Notebook에서 결과를 다운로드하는 기능 관리를 참조하세요.
테이블 형식 출력이 포함된 셀 결과를 로컬 컴퓨터에 다운로드할 수 있습니다. 탭 제목 옆에 있는 아래쪽 화살표를 클릭합니다. 메뉴 옵션은 결과의 행 수와 Databricks 런타임 버전에 따라 달라집니다. 다운로드한 결과는 로컬 컴퓨터에 전자 필기장 이름에 해당하는 이름을 가진 CSV 파일로 저장됩니다.
SQL 웨어하우스 또는 서버리스 컴퓨팅에 연결된 Notebook의 경우 결과를 Excel 파일로 다운로드할 수도 있습니다.
SQL 셀 결과 탐색
Databricks Notebook에서 SQL 언어 셀의 결과는 변수 _sqldf
에 할당된 DataFrame으로 자동으로 사용할 수 있습니다. 변수를 _sqldf
사용하여 후속 Python 및 SQL 셀에서 이전 SQL 출력을 참조할 수 있습니다. 자세한 내용은 SQL 셀 결과 탐색을 참조하세요.
셀당 여러 출력 보기
Python 노트북 및 비 Python 노트북의 %python
셀은 셀당 여러 출력을 지원합니다. 예를 들어 다음 코드의 출력에는 플롯과 테이블이 모두 포함됩니다.
import pandas as pd
from sklearn.datasets import load_iris
data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)
출력 크기 조정
표 또는 시각화의 오른쪽 아래 모서리를 끌어 셀 출력의 크기를 조정합니다.
오른쪽 아래 모서리를 끌어 출력 테이블 크기를 조정하는
Databricks Git 폴더에서 노트북 출력물을 커밋하기
.ipynb Notebook 출력 커밋에 대한 자세한 내용은 .ipynb Notebook 출력 커밋 허용을 참조하세요.
- 노트북은 .ipynb 확장자로 끝나는 파일이어야 합니다.
- 작업 영역 관리자 설정은 Notebook 출력을 커밋할 수 있도록 허용해야 합니다.