Azure Databricks 集成概述

此处列出的文章提供有关如何连接到可与 Azure Databricks 配合使用的大型数据源、BI 工具和开发人员工具。 其中许多通过合作伙伴系统和合作伙伴连接中心提供。

合作伙伴连接

合作伙伴连接是一个用户界面,它允许经过验证的解决方案更快地轻松地与 Databricks 群集和 SQL 仓库集成。

有关详细信息,请参阅 什么是 Databricks 合作伙伴连接?

数据源

Databricks 可以读取数据并将其写入各种数据格式,例如 CSV、 Delta Lake、JSON、Parquet、XML 和其他格式,以及 Amazon S3、Google BigQuery 和云存储、Snowflake 和其他提供程序等数据存储提供程序。

请参阅 数据引入连接到数据源和外部服务以及 数据格式选项

BI 工具

Databricks 已验证了与你喜欢的 BI 工具(包括 Power BI、Tableau 和其他工具)的集成,使你能够通过 Databricks 群集和 SQL 仓库处理数据,在许多情况下具有低代码和无代码体验。

有关包含连接说明的综合列表,请参阅 BI 和可视化

其他 ETL 工具

除了访问各种 数据源外,Databricks 还提供与 Dbt、Prophecy 和 Azure 数据工厂等 ETL/ELT 工具的集成,以及 Airflow 和 SQL 数据库工具(如 DataGrip、DBeaver 和 SQL Workbench/J)等数据管道业务流程工具。

有关连接说明,请参阅:

IDE 和其他开发人员工具

Databricks 支持 DataGrip、IntelliJ、PyCharm、Visual Studio Code 等开发人员工具,使你能够以编程方式访问 Azure Databricks 计算,包括 SQL 仓库

有关支持开发人员的工具的综合列表,请参阅 Databricks 上的开发

Git

Databricks Git 文件夹提供与偏好的 Git 提供程序的存储库级集成,以便可以在 Databricks 笔记本中开发代码并将其与远程 Git 存储库同步。 请参阅 Databricks Git 文件夹的 Git 集成