Fivetran に接続する
Fivetran の自動データ統合は、スキーマと API の変化に応じて適応し、すぐにクエリできるスキーマを使用して信頼性の高いデータ アクセスと簡素化された分析を行えるようにします。
Databricks SQL ウェアハウス (旧称 Databricks SQL エンドポイント) と Azure Databricks クラスターを、Fivetran と統合できます。 Fivetran の Azure Databricks との統合により、さまざまなデータ ソースのデータを Delta Lake に集約できます。
Partner Connect を使用して Fivetran に接続する
このセクションでは、Partner Connect を使用して Fivetran に接続する方法について説明します。 各ユーザーは、それぞれ独自の接続を作成します。
注意
ユーザーごとの接続エクスペリエンスはパブリック プレビュー段階です。 ユーザーごとの接続を作成できないようにするには、Azure Databricks のアカウント チームにお問い合わせください。
Partner Connect を使用して接続する前に
Partner Connect を使用して Fivetran に接続する前に、以下があることを確認してください。
- ワークスペース管理者ユーザー ロールまたは次のアクセス許可。
- Unity Catalog によって管理されるデータの場合、Fivetran で書き込むカタログに対する次のメタストア オブジェクト特権。
- カタログの
USE CATALOG
とCREATE SCHEMA
。 - (省略可能) 宛先の場所を指定する場合は、外部の場所での CREATE EXTERNAL TABLE、およびクラウド オブジェクト ストレージ内のデータへのアクセス権。
- カタログの
- レガシ Hive メタストアによって管理されるデータの場合、Fivetran で書き込むカタログに対する次のメタストア オブジェクト特権。
- カタログの
USAGE
とCREATE
- (省略可能) 宛先の場所を指定する場合は、クラウド オブジェクト ストレージ内のデータへのアクセス権。
- カタログの
Unity Catalog メタストア オブジェクトの特権は、メタストア管理者、オブジェクトの所有者、またはオブジェクトを含むカタログやスキーマの所有者が付与できます。 詳細については、「Unity Catalog の権限とセキュリティ保護可能なオブジェクト」を参照してください。
レガシ Hive メタストア オブジェクトの特権は、ワークスペース管理者またはオブジェクトの所有者が付与できます。 詳細については、「Hive メタストアの特権とセキュリティ保護可能なオブジェクト (レガシ)」を参照してください。
クラウド オブジェクト ストレージ内のデータへのアクセスは、クラウド オブジェクト ストレージ アカウントで十分なアクセス許可を持つワークスペース管理者が構成する必要があります。 詳細については、「データ アクセス構成を有効にする」を参照してください。
Partner Connect の手順
Partner Connect を使用して Azure Databricks ワークスペースを Fivetran に接続するには、次の操作を行います:
サイドバーで、[Partner Connect] をクリックします。
[Fivetran] タイルをクリックします。
このセクションの手順では、ユーザーレベルの Fivetran 試用版アカウントを作成します。 既存のワークスペースレベルの Fivetran 試用版アカウントにサインインするには、[Use existing connection] (既存の接続を使用する) をクリックし、画面の指示に従って Fivetran にサインインし、この記事の残りの手順をスキップします。
SQL ウェアハウスを選択します。 SQL ウェアハウスが停止している場合は、[開始する] をクリックします。
ワークスペースが Unity Catalog に対応している場合は、Fivetran で書き込むカタログを選択し、[次へ] をクリックします。
Partner Connect では、ユーザーに関連付けられている Azure Databricks の個人用アクセス トークンを生成します。
[Connect to Fivetran] (Fivetran に接続する) をクリックします。
Web ブラウザーに新しいタブが開き、Fivetran Web サイトが表示されます。
Fivetran Web サイトの画面の指示に従って、試用版パートナー アカウントを作成します。
Fivetran に手動で接続する
手動接続手順の概要については、以下の YouTube 動画 (2 分) をご覧ください。
注意
Fivetran を使用して SQL ウェアハウスをより高速に接続するには、Partner Connect を使用します。
手動で接続する前に
Fivetran に手動で接続する前に、次のものが必要です。
Azure Databricks ワークスペース内のクラスターまたは SQL ウェアハウス。
クラスターまたは SQL ウェアハウスの接続の詳細。具体的には、[サーバーのホスト名]、[ポート]、および [HTTP パス] の値です。
Azure Databricks 個人用アクセス トークンまたは Microsoft Entra ID (旧称 Azure Active Directory) トークン。 個人用アクセス トークンを作成するには、次の操作を行います。
- Azure Databricks ワークスペースの上部バーで、目的の Azure Databricks ユーザー名をクリックし、次にドロップダウンから [設定] を選択します。
- [開発者] をクリックします。
- [アクセス トークン] の横にある [管理] をクリックします。
- [新しいトークンの生成] をクリックします。
- (省略可能) 将来このトークンを識別するのに役立つコメントを入力し、トークンの既定の有効期間 90 日を変更します。 有効期間のないトークンを作成するには (推奨されません)、[有効期間 (日)] ボックスを空のままにします。
- [Generate](生成) をクリックします。
- 表示されたトークンを安全な場所にコピーし、[完了] をクリックします。
Note
コピーしたトークンは必ず安全な場所に保存してください。 コピーしたトークンは他人に見せないでください。 コピーしたトークンを失った場合、それとまったく同じトークンは再生成できません。 代わりに、この手順を繰り返して新しいトークンを作成する必要があります。 コピーしたトークンを紛失した場合や、トークンが侵害されていると思われる場合、Databricks では、[アクセス トークン] ページのトークンの横にあるごみ箱 ([取り消し]) アイコンをクリックして、ワークスペースからそのトークンをすぐに削除することを強くお勧めします。
ワークスペースでトークンを作成することや使用することができない場合は、ワークスペース管理者によってトークンが無効にされているか、トークンを作成または使用する権限が作業者に付与されていない可能性があります。 ワークスペース管理者に連絡するか、以下のトピックを参照してください。
Note
セキュリティのベスト プラクティスとして、自動化ツール、システム、スクリプト、アプリを使用して認証する場合、Databricks では、ワークスペース ユーザーではなくサービス プリンシパルに属する個人用アクセス トークンを使用することを推奨しています。 サービス プリンシパルのトークンを作成するには、「サービス プリンシパルのトークンを管理する」をご覧ください。
ヒント
ワークスペースの Partner Connect の Fivetran タイルの内部にチェック マーク アイコンがある場合は、タイルをクリックして [接続の詳細] を展開すると、接続されている SQL ウェアハウスの接続の詳細を取得できます。 個人用アクセス トークンが非表示になっています。代替の個人用アクセス トークンを作成し、Fivetran から要求された場合は、代わりにその新しいトークンを入力する必要があります。
手動の手順
Fivetran に手動で接続するには、次の操作を行います。
Fivetran アカウントにサインインするか、https://fivetran.com/login で新しい Fivetran アカウントを作成します。
重要
組織の Fivetran アカウントにサインインすると、[接続先を選択] ページが表示される場合があります。ここには、1 つ以上の既存の接続先エントリが Databricks ロゴとともに一覧表示されます。 これらのエントリには、自身のものとは異なる、ワークスペース内のコンピューティング リソースの接続詳細が含まれている場合があります。 これらの接続のいずれかを再利用する場合で、コンピューティング リソースを信頼し、それに対するアクセス権を持っているときには、その接続先を選択し、次の手順に進みます。 それ以外の場合は、使用可能な接続先を選択してこのページの手順にお従いください。
Fivetran 内の [Dashboard] ページ内で、[Destinations] タブをクリックします。
[接続先を追加] をクリックします。
接続先名を入力して [追加] をクリックします。
[Fivetran は最新の ELT です] ページで、[コネクターを設定] をクリックします。
データ ソースをクリックし、[次へ] を クリックします。
Fivetran でセットアップ ガイドの画面の指示に従って、コネクタの設定を完了します。
[Save & Test] をクリックします。
テストが成功したら、[続行] をクリックします。
[データの接続先を選択] ページで、[Azure 上の Databricks] をクリックします。
[セットアップの続行] をクリックします。
Fivetran の画面の指示に従って、既存の Azure Databricks コンピューティング リソースの接続の詳細、特に [サーバーのホスト名] フィールドと [HTTP パス] フィールドの値、および前に生成したトークンを入力します。
[Save & Test] をクリックします。
テストが成功したら、[続行] をクリックします。
次の手順に進みます。
その他のリソース
Fivetran Web サイトで、次のリソースの 1 つ以上を探索します。