시작: Notebook에서 데이터 쿼리 및 시각화

이 시작 문서에서는 Azure Databricks Notebook을 사용하여 SQL, Python, Scala 및 R을 사용하여 Unity 카탈로그에 저장된 샘플 데이터를 쿼리한 다음 Notebook에서 쿼리 결과를 시각화하는 방법을 안내합니다.

요구 사항

이 문서의 작업을 완료하려면 다음 요구 사항을 충족해야 합니다.

작업 영역에 Unity 카탈로그 사용하도록 설정되어 있어야 합니다. Unity 카탈로그를 시작하는 방법에 대한 자세한 내용은 Unity 카탈로그설정 및 관리를 참조하세요.
기존 컴퓨팅 리소스를 사용하거나 새 컴퓨팅 리소스를 만들 수 있는 권한이 있어야 합니다. Azure Databricks를 시작하는 방법을 확인하거나 Databricks 관리자에게 문의하세요.

작업 영역에서 Notebook을 생성하려면 사이드바의 새로 만들기를 클릭한 다음 Notebook을 클릭합니다. 작업 영역에서 빈 전자 필기장이 열립니다.

Notebook 만들기 및 관리에 대한 자세한 내용은 Notebook 관리를 참조하세요.

선택한 언어를 사용하여 Unity 카탈로그의 samples.nyctaxi.trips 테이블을 쿼리합니다.

다음 코드를 복사하고 새로운 빈 Notebook 셀에 붙여넣습니다. 이 코드는 Unity 카탈로그에서 samples.nyctaxi.trips 테이블을 쿼리한 결과를 표시합니다.

SELECT * FROM samples.nyctaxi.trips

display(spark.read.table("samples.nyctaxi.trips"))

display(spark.read.table("samples.nyctaxi.trips"))

library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))

여정 거리별 평균 요금 금액을 픽업 우편 번호로 그룹화하여 표시합니다.

CSV 파일의 데이터를 Unity 카탈로그에 추가하고 데이터를 시각화하는 방법에 대한 자세한 내용은 시작: NotebookCSV 데이터 가져오기 및 시각화를 참조하세요.
Apache Spark를 사용하여 Databricks에 데이터를 로드하는 방법을 알아보려면 자습서: Apache Spark DataFrames를 사용하여 데이터 로드 및 변환을 참조 하세요.
Databricks로 데이터를 수집하는 방법에 대한 자세한 내용은 Databricks 레이크하우스로 데이터 수집을 참조 하세요.
Databricks를 사용하여 데이터를 쿼리하는 방법에 대한 자세한 내용은 쿼리 데이터를 참조하세요.
시각화에 대한 자세한 내용은 Databricks Notebook의 시각화를 참조 하세요.