データソースと外部サービスに接続する

2025-05-20

このページでは、Azure Databricks と外部データソースとサービスの間の接続を構成している管理者とパワーユーザー向けの推奨事項を示します。

Azure Databricks アカウントをデータソース (たとえば、クラウドオブジェクトストレージ、リレーショナルデータベース管理システム、ストリーミングデータサービス、CRM などのエンタープライズプラットフォーム) に接続できます。 Azure Databricks アカウントをストレージ以外の外部サービスに接続することもできます。

オブジェクトストレージへの接続を構成する

Azure Databricks ワークロードで使用されるほとんどのデータは、Azure Data Lake Storage や AWS S3 などのクラウドオブジェクトストレージに格納されます。クラウドオブジェクトストレージへのアクセスは、次のいずれかを使用して管理できます。

Unity カタログ (推奨)。クラウドオブジェクトストレージ内の構造化データと非構造化データの両方のデータガバナンスを提供します。 Unity カタログを使用したクラウドオブジェクトストレージへの接続を参照してください。
従来のコネクタと接続パターン。レガシパターンを使用した Azure Databricks のクラウドオブジェクトストレージへのアクセスの構成に関するページを参照してください。

外部データシステムへの接続を構成する

Databricks には、外部データシステムへの接続を構成するためのオプションがいくつか用意されています。次の表は、これらのオプションの概要を示しています。

オプション	説明
フェデレーションコネクタのクエリ	Lakehouse Federation は、エンタープライズデータシステム内のデータへの読み取り専用アクセスを提供します。接続は、Unity Catalog を介してカタログまたはスキーマレベルで構成され、複数のテーブルが 1 つの構成と同期されます。「Lakehouse フェデレーションとは」をご覧ください。
マネージドインジェストコネクタ	Lakeflow Connect を使用すると、管理者ユーザーはデータインジェスト UI で接続とマネージドインジェストパイプラインを同時に作成できます。 Lakeflow Connect のマネージドコネクタに関する記事を参照してください。パイプラインを作成するユーザーが管理者以外のユーザーであるか、Databricks API、Databricks SDK、Databricks CLI、または Databricks アセットバンドルを使用する予定の場合、管理者は最初にカタログエクスプローラーで接続を作成する必要があります。これらのインターフェイスでは、ユーザーがパイプラインを作成するときに既存の接続を指定する必要があります。「マネージドインジェストソースへの接続」を参照してください。
ストリーミングコネクタ	Azure Databricks には、多くのストリーミングデータシステム用に最適化されたコネクタが用意されています。すべてのストリーミングデータソースに対し、アクセスを提供する資格情報を生成し、これらの資格情報を Azure Databricks に読み込む必要があります。 Databricks では、シークレットを使用して資格情報を保存することをお勧めしています。シークレットはすべての構成オプションとすべてのアクセスモードで使用できるためです。ストリーミングソースのすべてのデータコネクタでは、ストリーミングクエリを定義するときにオプションを使用して資格情報を渡すことができます。 Lakeflow Connect の標準コネクタを参照してください。
サードパーティによる統合	サードパーティのツールを使用して外部データソースに接続し、Lakehouse へのデータの取り込みを自動化します。一部のソリューションには、外部システムからレイクハウスデータへのリバース ETL と直接アクセスも含まれています。「Databricks Partner Connect とは」を参照してください。
ドライバー	Azure Databricks には、各 Databricks Runtime の外部データシステム用のドライバーが含まれています。必要に応じて、サードパーティ製ドライバーをインストールして、他のシステムのデータにアクセスすることもできます。接続はテーブルごとに構成する必要があります。一部のドライバーには書き込みアクセスが含まれています。「外部システムに接続する」を参照してください。読み取り専用クエリフェデレーションの場合、Lakehouse フェデレーションは常にこれらのドライバーよりも優先されます。
JDBC	外部システム用に含まれているいくつかのドライバーは、JDBC のネイティブサポートに基づいて構築され、JDBC のオプションには、他のシステムへの接続を構成するための拡張可能なオプションが用意されています。接続はテーブルごとに構成する必要があります。「JDBC を使用したデータベースのクエリ」を参照してください。読み取り専用クエリフェデレーションの場合、Lakehouse フェデレーションは常にこれらのドライバーよりも優先されます。

外部サービスへの接続を構成する

Unity カタログは、 サービス資格情報と呼ばれるセキュリティ保護可能なオブジェクトを使用して、ストレージ以外のサービスへのアクセスを制御します。サービス資格情報は、ユーザーが Azure Databricks から接続する必要がある外部サービスへのアクセスを提供する長期的なクラウド資格情報をカプセル化します。 Unity カタログを使用した外部クラウドサービスへの接続に関するページを参照してください

データソースと外部サービスへのアクセスの管理と要求

ほとんどの接続方法では、外部データソースまたはサービスと Azure Databricks ワークスペースの両方に対する昇格された特権が必要です。一般的な組織では、Azure Databricks または外部データおよびストレージプロバイダーでデータ接続を構成するための十分な特権を持つユーザーはほとんどいません。

組織では、このページからリンクされている記事で説明されているパターンのいずれかを使用して、データソースまたはサービスへのアクセスを既に構成している可能性があります。組織がデータとサードパーティのサービスへのアクセスを要求するための明確に定義されたプロセスを持っている場合、Databricks はそのプロセスに従うことをお勧めします。データソースにアクセスする方法がわからない場合は、次の手順に役立つ可能性があります。

カタログエクスプローラーを使用して、自分がアクセスできるテーブルとボリュームを表示します。「カタログエクスプローラーとは」を参照してください。
チームメイトやマネージャーに、アクセスできるデータソースについて尋ねます。
- ほとんどの組織では、ID プロバイダー (Okta や Microsoft Entra ID など) から同期されたグループを使用して、ワークスペースユーザーのアクセス許可を管理します。チームの他のメンバーがアクセスが必要なデータソースにアクセスできる場合は、ワークスペース管理者に正しいグループに追加してアクセス権を付与してもらう必要があります。
- 特定のテーブル、ボリューム、またはデータソースが同僚によって構成されている場合、その個人はデータへのアクセスを許可できる必要があります。

一部の組織では、特定のコンピューティングクラスターと SQL ウェアハウスにデータアクセス許可をアタッチします。これは従来のガバナンスモデルですが、組織で使用していて、特定のコンピューティングリソースで使用できるデータソースを知りたい場合は、[ コンピューティング] タブ に表示されているコンピューティング作成者に問い合わせてください。

次の方法で共有

データ ソースと外部サービスに接続する

オブジェクト ストレージへの接続を構成する

外部データ システムへの接続を構成する

外部サービスへの接続を構成する

データ ソースと外部サービスへのアクセスの管理と要求

フィードバック

その他のリソース

データソースと外部サービスに接続する

オブジェクトストレージへの接続を構成する

外部データシステムへの接続を構成する

データソースと外部サービスへのアクセスの管理と要求