Databricks JDBC 드라이버에 대한 드라이버 기능 설정(Simba)

비고

이 페이지는 버전 3 이하의 Simba JDBC 드라이버(레거시) 버전에 적용됩니다. Databricks는 JDBC용 Databricks JDBC 드라이버 로 마이그레이션하는 것이 좋습니다. 여기에는 Unity 카탈로그 메트릭 뷰 지원, 여러 SQL 문에 걸친 트랜잭션, 저장 프로시저, 빠른 대규모 검색 및 기본 제공 클라이언트 원격 분석과 같은 개선 사항이 포함됩니다.

이 페이지에서는 Databricks JDBC 드라이버에 대한 특수 및 고급 드라이버 기능 설정을 구성하는 방법을 설명합니다.

Databricks JDBC 드라이버는 다음과 같은 특수 및 고급 드라이버 기능 설정을 제공합니다.

JDBC의 ANSI SQL-92 쿼리 지원

레거시 Spark JDBC 드라이버는 ANSI SQL-92 언어로 SQL 쿼리를 수락하고 Databricks SQL로 변환한 후 서버로 보냅니다.

애플리케이션이 Databricks SQL을 직접 생성하거나 Azure Databricks 관련된 비 ANSI SQL-92 구문을 사용하는 경우 연결 구성에서 UseNativeQuery=1 설정합니다. 이 설정은 SQL 쿼리를 번역 없이 Azure Databricks 전달합니다.

기본 카탈로그 및 스키마

기본 카탈로그 및 스키마를 지정하려면 JDBC 연결 URL에 ConnCatalog=<catalog-name>;ConnSchema=<schema-name> 추가합니다.

추적을 위한 쿼리 태그

중요합니다

이 기능은 비공개 프리뷰. 액세스를 요청하려면 계정 팀에 문의하세요.

추적 및 분석을 위해 SQL 쿼리에 키-값 태그를 연결합니다. 쿼리 태그는 쿼리 식별 및 분석을 위해 테이블에 표시됩니다 system.query.history .

연결에 쿼리 태그를 추가하려면 JDBC 연결 URL에 매개 변수를 포함합니다 ssp_query_tags .

jdbc:databricks://<server-hostname>:443;httpPath=<http-path>;ssp_query_tags=key1:value1,key2:value2

쿼리 태그를 쉼표로 구분된 키-값 쌍으로 정의합니다. 여기서 각 키와 값은 콜론으로 구분됩니다. 예: key1:value1,key2:value2.

JDBC에서 큰 쿼리 결과 추출

큰 쿼리 결과를 추출할 때 최상의 성능을 얻으려면 다음 최적화가 포함된 최신 버전의 JDBC 드라이버를 사용합니다.

JDBC의 화살표 직렬화

JDBC 드라이버 버전 2.6.16 이상은 Apache Arrow를 사용하는 최적화된 쿼리 결과 직렬화 형식을 지원합니다.

JDBC의 Cloud Fetch

JDBC 드라이버 버전 2.6.19 이상에서는 Azure Databricks 배포에 구성된 클라우드 스토리지를 통해 쿼리 결과를 가져오는 기능인 Cloud Fetch를 지원합니다.

쿼리를 실행할 때 Azure Databricks 결과를 작업 영역의 클라우드 스토리지에 최대 20MB의 화살표 직렬화된 파일로 저장합니다. 쿼리가 완료되면 드라이버는 페치 요청을 보내고 Azure Databricks 결과 파일에 Shared Access Signature( SAS) URL을 반환합니다. 그런 다음 드라이버는 이러한 URL을 사용하여 Azure 스토리지에서 직접 결과를 다운로드합니다.

Cloud Fetch는 1MB보다 큰 쿼리 결과에만 적용됩니다. 드라이버는 Azure Databricks 직접 더 작은 결과를 검색합니다.

Azure Databricks 24시간 후에 삭제를 위해 표시하고 24시간 후에 영구적으로 제거하여 누적된 파일을 자동으로 수집합니다.

네트워크 필수 구성 요소

네트워크가 프라이빗인 경우 Cloud Fetch가 작동하려면 다음 설정을 구성해야 합니다.

네트워크 환경에서 허용 *.blob.core.windows.net 합니다 *.store.core.windows.net .
필요한 인증서 다운로드 및 해지를 허용 목록에 추가합니다.
Azure Databricks 작업 영역 스토리지 계정에서 방화벽 지원을 사용하도록 설정한 경우 가상 네트워크 데이터 게이트웨이 또는 on-premises 데이터 게이트웨이 구성하여 스토리지 계정에 대한 프라이빗 액세스를 허용합니다.

Cloud Fetch를 사용하지 않도록 설정하려면 연결 구성에서 설정합니다 EnableQueryResultDownload=0 .

느린 다운로드 진단

LogLevel Cloud Fetch 다운로드 속도 메트릭을 보려면 (INFO) 및 4 로그 폴더의 전체 경로로 설정합니다LogPath. 드라이버 로그는 청크당 다운로드 속도를 기록하므로 큰 결과 집합은 여러 로그 줄을 생성합니다. 또한 드라이버는 속도가 약 1MB/s 이하로 떨어지면 경고를 기록합니다. 이 기능은 2025년 12월 이후에 릴리스된 JDBC(Simba) 드라이버 버전에서 사용할 수 있습니다.

다운로드 속도가 느리거나 중단된 경우 드라이버가 모든 결과 파일 다운로드를 완료하기 전에 SAS 토큰이 만료될 수 있습니다. 클라이언트와 Azure Blob Storage 간의 대역폭 제한 또는 네트워크 정체를 확인합니다.

로그 기록 활성화

JDBC 드라이버에서 로깅을 활성화하려면 LogLevel 속성을 1 (심각한 이벤트만)과 6 (모든 드라이버 작업) 사이의 값으로 설정합니다. LogPath 로그 파일을 저장할 폴더의 전체 경로로 속성을 설정합니다.

자세한 내용은 Databricks JDBC 드라이버 가이드에서 로깅 구성 을 참조하세요.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-05-03