次の方法で共有


チュートリアル: Google BigQuery のミラーリングを設定する (プレビュー)

このチュートリアルでは、Google BigQuery から Fabric ミラー化データベースを構成します。

この例は BigQuery に固有のものですが、Azure SQL Database や Azure Cosmos DB などの他のデータ ソースのミラーリングを構成する詳細な手順を確認できます。 詳細については、「Fabric のミラーリングとは」を参照してください。

[前提条件]

  • 新しい BigQuery ウェアハウスを作成するか、既存のものを使用します。 Microsoft Azure を含め、任意のクラウド内の任意のバージョンの BigQuery インスタンスに接続できます。
  • 既存の Fabric 容量が必要です。 そうでない場合は、Fabric 試用版を開始します

権限の要件

次のアクセス許可を含む BigQuery データベースのユーザーアクセス許可が必要です。

  • bigquery.datasets.create
  • bigquery.tables.list
  • bigquery.tables.create
  • bigquery.tables.export
  • bigquery.tables.get
  • bigquery.tables.getData
  • bigquery.tables.updateData
  • bigquery.routines.get
  • bigquery.routines.list
  • bigquery.jobs.create
  • storage.buckets.create
  • storage.buckets.list
  • storage.objects.create
  • storage.objects.delete
  • storage.objects.list
  • iam.serviceAccounts.signBlob

BigQueryAdmin ロールと StorageAdmin ロールには、これらのアクセス許可が含まれている必要があります。

ユーザーには、BigQuery インスタンスへのアクセスを許可するロールが少なくとも 1 つ割り当てられている必要があります。 BigQuery データ ソースにアクセスするためのネットワーク要件を確認します。 Google BigQuery for On-Premises Data Gateway (OPDG) のミラーリングを使用している場合、ミラーリングを成功させるには OPDG バージョン 3000.286.6 以上が必要です。

バケットを手動で確立し、storage.buckets.create アクセス許可を付与する必要がないようにする場合は、次の手順を実行します。

  1. Google コンソール内の Cloud Storage に移動し、バケットを選択します。
  2. [ 作成] を選択し、バケットにこの形式で名前を付けます (大文字と小文字が区別されます): <projectid>_fabric_staging_bucket
  3. バケットの場所/リージョンが、ミラーリングを計画している GCP プロジェクトと同じであることを確認します。
  4. を選択してを作成します。 ミラーリング システムはバケットを自動的に検出します。

ユース ケースによっては、さらに多くのアクセス許可が必要になる場合があります。 最低限必要なアクセス許可は、変更履歴を操作し、さまざまなサイズのテーブル (10 GB を超えるテーブル) を処理するために必要です。 10 GB を超えるテーブルを操作していない場合でも、これらの最小限のアクセス許可をすべて有効にして、ミラーリングの使用を成功させます。

アクセス許可の詳細については、ストリーミング データに必要な権限変更履歴アクセスに必要なアクセス許可クエリ結果を書き込むための必要なアクセス許可に関する Google BigQuery ドキュメントを参照してください。

Important

ソース BigQuery ウェアハウスで確立された詳細なセキュリティは、Microsoft Fabric のミラー化されたデータベースで再構成する必要があります。 詳細については、 Microsoft Fabric での SQL の詳細なアクセス許可に関するセクションを参照してください。

ミラー化されたデータベースを作成する

このセクションでは、ミラー化された BigQuery データ ソースから新しいミラー化されたデータベースを作成します。

(マイ ワークスペースではなく) 既存のワークスペースを使用することも、新しいワークスペースを作成することもできます。

  1. ワークスペースから、 作成 ハブに移動します。
  2. 使用するワークスペースを選択したら、[ 作成] を選択します。
  3. ミラー化された Google BigQuery カードを選択します。
  4. 新しいデータベースの名前を入力します。
  5. を選択してを作成します。

任意のクラウド内の BigQuery インスタンスに接続する

ミラーリングが BigQuery インスタンスに接続できるように、クラウド ファイアウォールを変更することが必要になる場合があります。 Google BigQuery for OPDG バージョン 3000.286.6 以降のミラーリングをサポートしています。 VNET もサポートしています。

  1. [新しい接続] で [BigQuery] を選択するか、既存の接続を選択します。

  2. [新しい接続] を選択した場合は、BigQuery データベースへの接続の詳細を入力します。

    接続設定 Description
    サービス アカウントの電子メール 既存のサービス アカウントがある場合: Google BigQuery コンソールでサービス アカウントに移動して、サービス アカウント のメールアドレスと既存のキーを見つけることができます。 既存のサービス アカウントがない場合: Google BigQuery コンソールで [サービス アカウント] に移動し、[ サービス アカウントの作成] を選択します。 サービス アカウント名 (入力したサービス アカウント名に基づいてサービス アカウント ID が自動的に生成されます) とサービス アカウントの説明を入力します。 完了を選択します。 サービス アカウントの電子メールをコピーし、Fabric の指定された接続資格情報セクションに貼り付けます。
    サービス アカウントの JSON キー ファイルの内容 [サービス アカウント] ダッシュボードで、新しく作成したサービス アカウントの アクション を選択します。 [ キーの管理] を選択します。 サービス アカウントごとにキーが既にある場合は、その JSON キー ファイルの内容をダウンロードします。

    サービス アカウントごとにキーがまだない場合は、[ キーの追加] と [ 新しいキーの作成] を選択します。 次に、[JSON] を選択 します。 JSON キー ファイルが自動的にダウンロードされます。 JSON キーをコピーし、Fabric ポータルの指定された接続資格情報セクションに貼り付けます。
    接続 新しい接続を作成します。
    接続名 自動的に入力する必要があります。使用する名前に変更します。
  3. ドロップダウン リストからデータベースを選択します。

ミラーリング プロセスの開始

  1. [ミラーの構成] 画面では、データベース内のすべてのデータをデフォルトでミラーできます。

    • すべてのデータをミラー化すると、ミラーリングの開始後に作成された新規テーブルがミラー化されます。

    • 必要に応じて、ミラーリングする特定のオブジェクトのみを選択します。 [すべてのデータをミラー化] オプションを無効にし、データベースから個々のテーブルを選択します。

    この例では、[ すべてのデータをミラー化 ] オプションを使用します。

  2. [ミラー データベース] を選択します。 ミラーリングが開始されます。

  3. 2 分から 5 分間待機します。 次に、[レプリケーションの監視] を選択して、状態を確認します。

  4. 数分後に、状態が [実行中] に変わります。これは、テーブルの同期が進行中であることを示します。

    テーブルとそれに対応するレプリケーションの状態が見つからない場合は、数秒待ってからパネルを更新します。

  5. テーブルの初期コピーが完了すると、[最終更新] 列に日付が表示されます。

  6. これでデータが稼働し、Fabric 全体でさまざまな分析シナリオが利用できるようになりました。

Important

  • Google BigQuery のミラーリングでは、変更リフレクションに最大 15 分の遅延があります。 これは、Google BigQuery の変更履歴機能の制限です。
  • ソース データベースで確立された詳細なセキュリティはすべて、Microsoft Fabric のミラー化データベースで再構成する必要があります。

ファブリック ミラーリングの監視

ミラーを構成すると、[ミラーリングの状態] ページに移動します。 ここでは、レプリケーションの現在の状態を監視できます。

レプリケーションの状態に関する詳細については、「ファブリック ミラーリング データベース レプリケーションの監視」を参照してください。

Important

BigQuery データベース内のソース テーブルに更新がない場合、レプリケーター エンジン (BigQuery ミラーリングの変更データを実行するエンジン) は速度が低下し、1 時間ごとにテーブルのみがレプリケートされます。 最初の読み込み後にデータが予想以上に長くかかる場合は、特にソース テーブルに新しい更新プログラムがない場合は、驚かないでください。 スナップショットの後、ミラー エンジンは変更をフェッチする前に最大 15 分間待機します。これは、Google BigQuery の制限により、新しい変更を反映するのに 10 分の遅延が適用されます。 BigQuery の変更リフレクション遅延の詳細