データと移動時間を復元する

Important

Lakebase Provisioned は、手動でスケーリングするプロビジョニング済みコンピューティングを使用する元の Lakebase オファリングです。サポートされているリージョンについては、「リージョンの可用性」を参照してください。自動スケールコンピューティング、ゼロへのスケール、分岐、インスタントリストアを使用した最新バージョンの Lakebase については、 Lakebase の自動スケールに関するドキュメントを参照してください。

新しい Lakebase インスタンスは、自動スケールプロジェクトとして作成されます。ロールアウトは 2026 年 3 月 12 日に開始されます。詳細については、既定での自動スケールに関するページを参照してください。

このページでは、子インスタンスを使用してデータを復元し、Lakebase データベースインスタンスで時間移動を実行する方法について説明します。

子インスタンスを作成する必要がある場合

子インスタンスの作成は、次のシナリオで役立ちます。

偶発的なデータ損失の回復: 昨日午前 10 時 23 分にクリティカルテーブルが削除された場合は、午前 10 時 22 分に設定された子インスタンスを生成して、不足しているデータのみを抽出してマージすることができます。
テスト環境と QA 環境: 過去 X 日間の任意の時点から (復元ウィンドウで定義されている) 運用環境に似た環境を複製して、スキーマの変更を検証するか、統合テストを実行します。
コンプライアンスと監査: 内部監査、財務調整、またはフォレンジック分析のために、過去の日付のデータベースの状態を反映する子インスタンスをプロビジョニングします。

子インスタンスとは

子インスタンスは、元のデータベースインスタンスの書き込み時のコピークローンです。これは、現在の時点から作成することも、 復元ウィンドウ内の過去の特定の時点から作成することもできます。復元ウィンドウでは、ポイントインタイムリカバリーを実行できる時間範囲 (2 ~ 35 日) を指定します。復元ウィンドウは、データベースインスタンスの作成時に定義されます。この復元ウィンドウ内の任意の時点で、手動スナップショットや完全なデータベースエクスポートを待たずに、子インスタンスを作成できます。

子インスタンスを作成した後は、削除されるまでクエリに使用できます。親の復元ウィンドウに関連付けられている自動有効期限はありません。これにより、親の復元ウィンドウの有効期限が切れた場合でも、子インスタンスが作成されたポイントインタイムデータに常にアクセスできます。

子インスタンスは親から分離されます。子インスタンスに対して実行する読み取りまたは書き込みはすべて、ソースインスタンスには影響しません。子インスタンスに対して行われた変更では、書き込み時のコピーが使用されるため、変更は "デルタ" として格納されます。これにより、変更されていないデータが共有され、追加のストレージが最小限に抑えられます。

移動時間を指定してデータを復元する子インスタンスを作成する

子インスタンスの作成は、次のシナリオで役立ちます。

偶発的なデータ損失の回復: 昨日午前 10 時 23 分にクリティカルテーブルが削除された場合は、午前 10 時 22 分に設定された子インスタンスを生成して、不足しているデータのみを抽出してマージすることができます。
テスト環境と QA 環境: 過去 X 日間の任意の時点から (復元ウィンドウで定義されている) 運用環境に似た環境を複製して、スキーマの変更を検証するか、統合テストを実行します。
コンプライアンスと監査: 内部監査、財務調整、またはフォレンジック分析のために、過去の日付のデータベースの状態を反映する子インスタンスをプロビジョニングします。

ステップバイステップの手順

手順 1: (省略可能) 親データベースインスタンスで復元ウィンドウを構成する

復元ウィンドウの有効な値は、2 日から 35 日までの範囲です。既定のウィンドウは 7 日間です。データベースインスタンスの復元ウィンドウは、インスタンスの作成時に指定できます。データベースインスタンスの作成を参照してください。

UI または API を使用して、データベースインスタンスの復元ウィンドウを変更します。

UI

[右上隅にあるアプリを選択し、Lakebase Postgres を選択します。
[ プロビジョニング済み ] をクリックして、[ プロビジョニングされたインスタンス ] ページを開きます。
更新するデータベースインスタンスを選択します。
右上隅にある [ 編集] をクリックします。
[ 詳細設定] で、復元ウィンドウの日数を設定します。
[保存] をクリックします。

curl

curl -s -X PATCH --header "Authorization: Bearer ${DATABRICKS_TOKEN}" $DBR_URL/database/instances/my-instance -d '{"retention_window_in_days": 14}'

手順 2: 子インスタンスを作成する

子インスタンスのロールとアクセス許可は、選択した復元ポイントの親インスタンスと同じです。これにより、親インスタンスに対して現在付与されている特権と一致しない特権を持つユーザーが発生する可能性があります。 Azure Databricks アイデンティティロールを確認し、子インスタンスに対する古い特権を適切に取り消します。

通常のデータベースインスタンスの作成時に [ 親から作成 ] を有効にして、子インスタンスを作成します。データベースインスタンスの作成と管理に関するページを参照してください。

UI

[右上隅にあるアプリを選択し、Lakebase Postgres を選択します。
[ プロビジョニング済み ] をクリックして、[ プロビジョニングされたインスタンス ] ページを開きます。
[ データベースインスタンスの作成] をクリックします。
インスタンスを構成します。
- 名前: データベースインスタンス名を入力します (1 ~ 63 文字、文字、ハイフンのみ)。
- 容量: コンピューティングサイズ (既定値: 2 CU) を選択します。「インスタンスサイズ」を参照してください。
- サーバーレス使用ポリシー: サーバーレスの使用状況と課金を属性付けする予算ポリシーを選択します (省略可能)。サーバーレス使用ポリシーを参照してください。
[ 詳細設定] を展開します。
親から作成を有効にします。
子インスタンスの設定を構成します。
- 親インスタンス名: 子データベースを作成する親インスタンスの名前を入力します。
- 親から次までのデータを含める: データを取得する特定の時点を選択します。
  - 現在の時点: データベースインスタンスの最新のデータを含む子インスタンスを作成します。
  - 特定の日付と時刻: データベースインスタンスの復元ウィンドウ内の特定の時点に子インスタンスを作成します。子インスタンスには、その特定の時点のすべてのデータが含まれます。
  - 特定のログシーケンス番号: 復元ウィンドウの特定の先書きログ (WAL) ログシーケンス番号 (LSN) から子インスタンスを作成します。 PostgreSQL は WAL を使用して復旧をサポートし、各 WAL レコードに LSN を割り当てます。子インスタンスには、その WAL LSN のすべてのデータが含まれています。 WAL の詳細については、 WAL の内部を参照してください。現在の LSN 値を取得するには、バックアップ制御機能を参照してください。
Create をクリックしてください。

curl

データベースインスタンスの最新のデータを使用して子インスタンスを作成します。

curl -s -X POST --header "Authorization: Bearer ${DATABRICKS_TOKEN}" $DBR_URL/database/instances -d '{"name": "test", "capacity": "CU_2", "parent_instance_ref": {"name": "test-child"}}'

UTC で指定された特定の日時のデータを含む子インスタンスを作成します。

curl -s -X POST --header "Authorization: Bearer ${DATABRICKS_TOKEN}" $DBR_URL/database/instances -d '{"name": "test", "capacity": "CU_2", "parent_instance_ref": {"name": "test-child", "branch_timestamp":"2025-05-23T17:21:00Z"}}'

データベースインスタンスの特定の WAL LSN からのデータを含む子インスタンスを作成します。

curl -s -X POST --header "Authorization: Bearer ${DATABRICKS_TOKEN}" $DBR_URL/database/instances -d '{"name": "test", "capacity": "CU_2", "parent_instance_ref": {"name": "test-child", "lsn":"0/2A156E"}}'

Python SDK

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.database import DatabaseInstance

# Initialize the Workspace client
w = WorkspaceClient()

parent_instance_name = "test-child"
instance_name = "test"

# Create a child instance using the most recent data from a database instance.
instance = w.database.create_database_instance(
    DatabaseInstance(
        name="my-database-instance",
        capacity="CU_1",
        parent_instance_ref={
            "name": parent_instance_name
        }
    )
)

# Create a child instance with data from a specific date and time, specified in UTC.
instance = w.database.create_database_instance(
    DatabaseInstance(
        name=instance_name,
        capacity="CU_1",
        parent_instance_ref={
            "name": parent_instance_name,
            "branch_timestamp": "2025-05-23T17:21:00Z"
        }
    )
)

# Create a child instance with data from a specific WAL LSN of a database instance.
instance = w.database.create_database_instance(
    DatabaseInstance(
        name=instance_name,
        capacity="CU_1",
        parent_instance_ref={
            "name": parent_instance_name,
            "lsn": "0/2A156E"
        }
    )
)

CLI

# Create a database instance from the most recent data of a parent instance
databricks database create-database-instance my-database-instance \
  --capacity CU_1 \
  --parent-instance-ref '{"name": "my-parent-instance"}'

# Create a database instance from a specific date and time, specified in UTC
databricks database create-database-instance \
  --json '{
    "name": "my-database-instance",
    "capacity": "CU_2",
    "parent_instance_ref": {
      "name": "my-parent-instance",
      "branch_timestamp": "2025-05-23T17:21:00Z"
    }
  }'

# Create a database instance from a specific WAL LSN of a parent instance
databricks database create-database-instance \
  --json '{
    "name": "my-database-instance",
    "capacity": "CU_2",
    "parent_instance_ref": {
      "name": "my-parent-instance",
      "lsn": "0/2A156E"
    }
  }'

手順 3 (省略可能): データを復元する

特定の時点で子インスタンスを作成した後、子インスタンスから実稼働インスタンスにデータを復元できます。これは、偶発的なデータ損失や破損からの回復に役立ちます。

データを復元するには:

お好みの PostgreSQL クライアントまたは接続方法を使用して、子インスタンスに接続します。接続とクエリを参照してください。
必要なデータを子インスタンスから実稼働インスタンスにコピーするスクリプトを記述します。スクリプトでは、次の操作を行う必要があります。
- 子インスタンスから必要な特定のテーブルまたはデータに対してクエリを実行する
- 実稼働インスタンスにデータを挿入または更新する
- 必要に応じて競合またはデータ変換を処理する
データの小さなサブセットに対する復元操作を最初にテストして、正確性を確認します。
完全復元スクリプトを実行して、必要なすべてのデータを運用環境にコピーします。
データを正常に復元し、運用インスタンスが正しいことを確認した後、子インスタンスを削除します。インスタンスを削除するには、「インスタンスの削除」を参照してください。

制限事項

1 つのデータベースインスタンスに対して一度に作成できる子インスタンスは 1 つだけです。
子インスタンスが削除されない限り、親インスタンスは削除できません。
子インスタンスは、短期的なテストまたは復旧用に設計されています。子または親を大幅に変更すると、システムがデータ共有を減らし、子の完全なコピーを維持する可能性があります。ストレージの使用量とコストは、スタンドアロンデータベースインスタンスに合わせて増加する可能性があります。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-15

データと移動時間を復元する

子インスタンスを作成する必要がある場合

子インスタンスとは

移動時間を指定してデータを復元する子インスタンスを作成する

ステップ バイ ステップの手順

手順 1: (省略可能) 親データベース インスタンスで復元ウィンドウを構成する

UI

curl

手順 2: 子インスタンスを作成する

UI

curl

Python SDK

CLI

手順 3 (省略可能): データを復元する

制限事項

フィードバック

その他のリソース

ステップバイステップの手順

手順 1: (省略可能) 親データベースインスタンスで復元ウィンドウを構成する