레이크하우스 페더레이션은 Databricks에 대한 쿼리 페더레이션 플랫폼입니다. 쿼리 페더레이션이라는 용어는 모든 데이터를 통합 시스템으로 마이그레이션할 필요 없이 사용자와 시스템이 여러 데이터 원본에 대해 쿼리를 실행할 수 있도록 하는 기능 컬렉션을 설명합니다.
페더레이션에는 쿼리 페더레이션과 카탈로그 페더레이션의 두 가지 유형이 있습니다. 이 페이지에서는 형식 간의 차이점을 다룹니다.
카탈로그 페더레이션과 비교한 쿼리 페더레이션
다음 표에서는 쿼리 페더레이션과 카탈로그 페더레이션 간의 주요 차이점을 요약합니다.
| Attribute | 쿼리 페더레이션 | 카탈로그 페더레이션 |
|---|---|---|
| 쿼리 경로 | Unity 카탈로그 쿼리는 JDBC를 사용하여 외부 데이터베이스로 푸시다운됩니다. 쿼리는 Databricks에서 실행되고 원격 컴퓨팅을 사용합니다. | Unity 카탈로그 쿼리는 개체 스토리지의 외세 테이블에 직접 액세스합니다. 카탈로그 페더레이션은 카탈로그 및 스토리지 서비스에 대한 직접 액세스를 지원하는 플랫폼에 사용할 수 있습니다. 쿼리는 Databricks 컴퓨팅에서만 실행되므로 카탈로그 페더레이션이 쿼리 페더레이션보다 비용 효율적이고 성능 최적화가 더 효율적입니다. |
| 사용 사례 |
원본이 레이크하우스 페더레이션 및 Lakeflow Connect를 모두 지원하는 경우 Databricks는 더 높은 데이터 볼륨과 낮은 대기 시간에 대한 성능이 우선 순위인 경우 Lakeflow Connect를 권장합니다. |
|
| 단계 개요 |
|
|
지원되는 데이터 원본
쿼리 페더레이션을 사용하여 다음 원본에 연결합니다.
- MySQL
- PostgreSQL
- Teradata
- Oracle
- Amazon Redshift
- Salesforce Data 360
- Snowflake
- 마이크로소프트 SQL 서버
- Azure Synapse(SQL Data Warehouse)
- 구글 빅쿼리
- Databricks
카탈로그 페더레이션을 사용하여 다음 원본에 연결합니다.