Azure Databricks와 DBeaver 통합
참고 항목
이 문서에서는 Databricks에서 제공하거나 지원하지 않는 DBeaver에 대해 설명합니다. 공급자에게 문의하려면 GitHub에서 dbeaver/dbeaver 리포지토리의 문제 페이지 사용을 참조하세요.
DBeaver는 개발자, 데이터베이스 관리자, 데이터 분석가, 데이터 엔지니어 및 데이터베이스 관련 작업이 필요한 기타 사용자를 위한 로컬 다중 플랫폼 데이터베이스 도구입니다. DBeaver는 Azure Databricks 및 기타 인기 있는 데이터베이스를 지원합니다.
이 문서에서는 로컬 개발 컴퓨터를 사용하여 무료 오픈 소스 DBeaver CE(Community Edition)를 설치, 구성 및 사용하여 Azure Databricks에서 데이터베이스 작업을 수행하는 방법을 설명합니다.
참고 항목
이 문서는 macOS, Databricks JDBC Driver 버전 2.6.36 및 DBeaver CE 버전 23.3.0으로 테스트되었습니다.
요구 사항
DBeaver를 설치하기 전에 로컬 개발 컴퓨터가 다음 요구 사항을 충족해야 합니다.
- Linux 64비트, macOS 또는 Windows 64비트 운영 체제. (Linux 32비트는 지원되지만 권장되지는 않습니다.)
- 로컬 개발 컴퓨터에 Databricks JDBC 드라이버를 다운로드하고 다운로드한
DatabricksJDBC42-<version>.zip
파일에서DatabricksJDBC42.jar
파일을 추출합니다.
또한 DBeaver를 연결할 Azure Databricks 클러스터 또는 SQL 웨어하우스가 있어야 합니다.
1단계: DBeaver 설치
다음과 같이 DBeaver CE를 다운로드하여 설치합니다.
- Linux: DBeaver 웹 사이트의 다운로드 페이지에서 Linux 설치 프로그램 중 하나를 다운로드하여 실행합니다.
snap
및flatpak
설치 옵션도 이 페이지에 제공됩니다. - macOS: Homebrew를 사용하여
brew install --cask dbeaver-community
를 실행하거나 MacPorts를 사용하여sudo port install dbeaver-community
를 실행합니다. DBeaver 웹 사이트의 다운로드 페이지에서도 macOS 설치 프로그램을 사용할 수 있습니다. - Windows: Chocolatey를 사용하여
choco install dbeaver
를 실행합니다. DBeaver 웹 사이트의 다운로드 페이지에서도 Windows Installer를 사용할 수 있습니다.
2단계: DBeaver용 Azure Databricks JDBC 드라이버 구성
이전에 다운로드한 Databricks JDBC Driver에 대한 정보를 사용하여 DBeaver를 설정합니다.
- DBeaver를 시작합니다.
- 새 데이터베이스를 만들 것인지 묻는 메시지가 표시되면 아니요를 클릭합니다.
- 데이터베이스에 연결하거나 선택하라는 메시지가 표시되면 취소를 클릭합니다.
- 데이터베이스 > 드라이버 관리자를 클릭합니다.
- 드라이버 관리자 대화 상자에서 새로 만들기를 클릭합니다.
- 새 드라이버 만들기 대화 상자에서 라이브러리 탭을 클릭합니다.
- 파일 추가를 클릭합니다.
- Azure Databricks JDBC 드라이버를 추출한 폴더로 이동합니다.
- 한 수준 더 낮게 이동하여 파일을 찾습니다
.jar
. .jar
파일을 강조 표시하고 열기를 클릭합니다.- 설정 탭에서 드라이버 이름에
Databricks
를 입력합니다. - 설정 탭에서 클래스 이름에
com.databricks.client.jdbc.Driver
를 입력합니다. - 확인을 클릭합니다.
- 드라이버 관리자 대화 상자에서 닫기를 클릭합니다.
3단계: DBeaver를 Azure Databricks 데이터베이스에 연결
DBeaver를 사용하여 클러스터 또는 SQL 웨어하우스에 연결하여 Azure Databricks 작업 영역의 데이터베이스에 액세스합니다.
DBeaver에서 데이터베이스 > 새 데이터베이스 연결을 클릭합니다.
데이터베이스에 연결 대화 상자의 모두 탭에서 Databricks를 클릭한 다음, 다음을 클릭합니다.
기본 탭을 클릭하고 Azure Databricks 리소스에 대한 JDBC URL 필드에 값을 입력합니다. JDBC URL 필드 구문은 Databricks JDBC 드라이버에 대한 인증 설정을 참조하세요.
연결 테스트를 클릭합니다.
팁
연결을 테스트하기 전에 Azure Databricks 리소스를 시작해야 합니다. 그렇지 않으면 리소스가 시작되는 동안 테스트를 완료하는 데 몇 분이 걸릴 수 있습니다.
연결에 성공하면 연결 테스트 대화 상자에서 확인을 클릭합니다.
데이터베이스에 연결 대화 상자에서 마침을 클릭합니다.
데이터베이스 탐색기 창에 Databricks 항목이 표시됩니다. 쉽게 식별할 수 있도록 연결 이름을 변경하려면 다음을 수행합니다.
- Databricks를 마우스 오른쪽 단추로 클릭한 다음, 연결 편집을 클릭합니다.
- 연결 구성 대화 상자에서 일반을 클릭합니다.
- 연결 이름의 경우
Databricks
을 연결의 다른 이름으로 바꿉니다. - 확인을 클릭합니다.
DBeaver에서 액세스하려는 각 리소스에 대해 이 단계의 지침을 반복합니다.
4단계: DBeaver를 사용하여 데이터베이스 개체 찾아보기
DBeaver를 사용하여 테이블 및 테이블 속성, 뷰, 인덱스, 데이터 형식 및 기타 데이터 개체 형식과 같은 Azure Databricks 작업 영역의 데이터베이스 개체에 액세스합니다.
DBeaver의 데이터베이스 탐색기 창에서 사용하려는 연결을 마우스 오른쪽 단추로 클릭합니다.
연결이 사용하도록 설정된 경우 클릭합니다. (연결이 사용하지 않도록 설정된 경우 이미 연결된 것입니다.)
팁
리소스를 연결하기 전에 리소스를 시작해야 합니다. 그렇지 않으면 리소스가 시작되는 동안 연결을 완료하는 데 몇 분이 걸릴 수 있습니다.
방금 연결한 연결을 확장합니다.
사용 가능한 데이터 개체를 펼치고 찾아봅니다. 데이터 개체를 두 번 클릭하여 자세한 정보를 가져옵니다.
추가 데이터 개체에 액세스하려면 이 단계의 지침을 반복합니다.
5단계: DBeaver를 사용하여 SQL 문 실행
DBeaver를 사용하여 카탈로그의 nyctaxi
스키마에서 samples
샘플 trips
테이블을 로드합니다.
DBeaver의 데이터베이스 탐색기 창에서 사용하려는 연결을 마우스 오른쪽 단추로 클릭합니다.
연결이 사용하도록 설정된 경우 클릭합니다. (연결이 사용하지 않도록 설정된 경우 이미 연결된 것입니다.)
팁
리소스를 연결하기 전에 리소스를 시작해야 합니다. 그렇지 않으면 리소스가 시작되는 동안 연결을 완료하는 데 몇 분이 걸릴 수 있습니다.
SQL 편집기 > 새 SQL 스크립트를 클릭합니다.
(연결 이름) 스크립트-1 탭에서 다음 SQL 문을 입력합니다.
SELECT * FROM samples.nyctaxi.trips;
SQL 편집기 > SQL 스크립트 실행을 클릭합니다.
다음 단계
- 데이터베이스 개체 편집기를 사용하여 데이터베이스 개체 속성, 데이터 및 엔터티 관계 다이어그램으로 작업합니다.
- 데이터 편집기를 사용하여 데이터베이스 테이블 또는 뷰의 데이터를 보고 편집합니다.
- SQL 편집기를 사용하여 SQL 스크립트로 작업합니다.
- DBeaver에서 ERD(엔터티 관계 다이어그램)로 작업합니다.
- DBeaver에서 데이터를 가져오고 내보냅니다.
- DBeaver를 사용하여 데이터를 마이그레이션합니다.
- DBeaver에서 JDBC 드라이버 문제를 해결합니다.