여기에 나열된 문서에서는 Azure Databricks에서 사용할 수 있는 다양한 데이터 원본, BI 도구 및 개발자 도구에 연결하는 방법에 대한 정보를 제공합니다. 이들 중 대부분은 파트너 시스템과 파트너 연결 허브를 통해 사용할 수 있습니다.
파트너 연결
파트너 연결은 유효성이 검사된 솔루션이 Databricks 클러스터 및 SQL 웨어하우스와 보다 빠르고 쉽게 통합할 수 있도록 하는 사용자 인터페이스입니다.
자세한 내용은 Databricks 파트너 연결이란?을 참조하세요.
데이터 원본
Databricks는 데이터를 읽고 CSV, Delta Lake, JSON, Parquet, XML 및 기타 형식과 같은 다양한 데이터 형식뿐만 아니라 Amazon S3, Google BigQuery 및 Cloud Storage, Snowflake 및 기타 공급자와 같은 데이터 스토리지 공급자에 데이터를 쓸 수 있습니다.
데이터 수집, 데이터 원본 및 외부 서비스에 연결 및데이터 형식 옵션을 참조하세요.
BI 도구
Databricks는 Power BI, Tableau 등 원하는 BI 도구와의 통합을 검증하여 Databricks 클러스터 및 SQL 웨어하우스를 통해 데이터를 작업할 수 있도록 했으며, 대부분의 경우 코드가 낮고 코드가 없는 환경이 있습니다.
연결 지침이 포함된 포괄적인 목록은 BI 및 시각화를 참조하세요.
기타 ETL 도구
Databricks는 모든 종류의 데이터 원본에 액세스하는 것 외에도 dbt, Prophecy 및 Azure Data Factory와 같은 ETL/ELT 도구뿐만 아니라 Airflow 및 DataGrip, DBeaver 및 SQL Workbench/J와 같은 SQL 데이터베이스 도구와 같은 데이터 파이프라인 오케스트레이션 도구와 통합을 제공합니다.
연결 지침은 다음을 참조하세요.
- ETL 도구: 데이터 준비 및 변환
- Airflow: Apache Airflow를 사용하여 Lakeflow 작업 오케스트레이션
- SQL 데이터베이스 도구: SQL 커넥터, 라이브러리, 드라이버, API 및 도구.
IDE 및 기타 개발자 도구
Databricks는 SQL 웨어하우스를 포함하여 프로그래밍 방식으로 Azure Databricks 컴퓨팅에 액세스할 수 있는 DataGrip, IntelliJ, PyCharm, Visual Studio Code 등의 개발자 도구를 지원 합니다.
개발자를 지원하는 포괄적인 도구 목록은 Databricks에서 개발을 참조하세요.
Git (기트 - 버전 관리 도구)
Databricks Git 폴더는 즐겨 찾는 Git 공급자와 리포지토리 수준 통합을 제공하므로 Databricks Notebook에서 코드를 개발하고 원격 Git 리포지토리와 동기화할 수 있습니다. Azure Databricks Git 폴더를 참조하세요.