このページでは、 Databricks Connector for Google Sheets でデータの自動更新をスケジュールして、インポートしたデータを最新の状態に保つ方法について説明します。 スケジュールされた更新では、保存されたクエリが定期的に実行され、対応するシートが更新されます。
必要条件
- Databricks Connector for Google Sheets を設定し、Azure Databricks からデータをインポートしました。
Unity カタログ接続を作成する
スケジュールされた更新には、次のものが必要です。
- Google スプレッドシートのメタストア管理者によって作成された、
databricks_google_connectionという Unity カタログ接続。 - スケジュールされた更新を作成または管理する必要があるユーザーに付与される、接続に対する
USE CONNECTION特権。
- Azure Databricksメタストア管理者として、Google スプレッドシートで Databricks Connector for Google Sheets サイドバーを開きます。
- [ 保存されたインポート ] タブをクリックします。
- 右上にある予定表をクリックします。
- 接続のセットアップをクリックします。
Azure Databricks で接続を共有する
接続が作成されたら、スケジュールされた更新を作成または管理する必要があるユーザーに USE CONNECTION 特権を付与します。 メタストア管理者、または接続に対する MANAGE 特権を持つユーザーは、この特権を付与できます。 接続の管理の詳細については、 Lakehouse フェデレーションの接続の管理を参照してください。
スケジュールを作成する
各インポートは、1 つのスケジュールにのみ割り当てることができます。 既存のインポートの新しいスケジュールを作成するには:
Google スプレッドシートの [Azure Databricks コネクタ] サイドバーで、[Saved imports タブをクリックします。
予定表アイコンをクリックし、[ 新しいスケジュール] をクリックします。
どのインポートのスケジュールを作成するか選択してください。
スケジュールの名前を入力します。
スケジュールの 頻度 を選択します。
- [時間単位] で、更新を実行する時間の分を選択します。
- [ 毎日] で、更新を実行する時刻を選択します。
- [ 毎週] で、曜日と更新を実行する時間を選択します。
スケジュールでは、ローカル タイム ゾーンが使用されます。
スケジュールされたクエリに使用する SQL ウェアハウスを選択します。
[ スケジュールの作成] をクリックします。
スケジュールの管理
スケジュールされた更新を表示または削除するには、次の操作を行います。
- Google スプレッドシートの [Azure Databricks コネクタ] サイドバーで、[Saved imports タブをクリックします。
- 予定表アイコンをクリックし、[ スケジュールの管理] をクリックします。
- スケジュールを選択すると、含まれるクエリやスケジュールの構成など、スケジュールの詳細が表示されます。
- 他のユーザーによって作成されたスケジュールを表示している場合、表示される時刻は作成者のローカル タイム ゾーンの時刻です。
- スケジュールを削除するには、[削除] をクリック します。
制限事項
- スケジュールされた更新を編集することはできません。 表示または削除できるのは、既存のスケジュールのみです。 スケジュールを変更するには、スケジュールを削除して新しいスケジュールを作成します。
- スケジュールに含まれるクエリを編集する場合は、スケジュールを削除し、更新されたクエリで再作成して、更新されたクエリ テキストをスケジュールで使用する必要があります。
- ピボット テーブルの更新をスケジュールすることはできません。 Google API は生のクエリ データのみを更新し、クエリ結果スキーマが変更された場合にピボット構成を変更することはできません。
- 1 つのスケジュールに最大 20 個のインポートを含めることができます。
- スケジュールされた更新で使用されるインポートのクエリ テキストは、4,096 文字に制限されています。