Hyperscale の分散機能のアーキテクチャ

[アーティクル]
12/11/2023

Hyperscale サービスレベルでは、拡張性の高い別のストレージとコンピューティングレベルを備えたアーキテクチャが利用されます。この記事では、お客様がほぼ瞬時のバックアップと非常にスケーラブルなトランザクションログのメリットを活用しながら、Hyperscale データベースをすばやくスケーリングできるようにするコンポーネントについて説明します。

ヒント

SQL Database Hyperscale の簡略化された価格は近日公開予定です。詳細については、Hyperscale の価格に関するブログを参照してください。

Hyperscale のアーキテクチャの概要

従来のデータベースエンジンでは、データ管理機能が 1 つのプロセスに一元化されています。今日の運用環境でディストリビューションデータベースと呼ばれているものでも、モノリシックなデータエンジンの複数のコピーが使用されています。

Hyperscale データベースのアプローチは異なります。 Hyperscale では、さまざまなデータエンジンのセマンティクスが枝分かれしているクエリ処理エンジンと、データの長期的なストレージと持続性を提供するコンポーネントが分かれています。これにより、ストレージ容量をスムーズに必要なだけスケールアウトできます。最初にサポートされるストレージの制限は 100 TB です。

Hyperscale コンポーネント間のすべてのネットワーク通信では、冗長性が組み込まれた Azure ネットワークインフラストラクチャが使用されます。

高可用性セカンダリレプリカと名前付きレプリカは、オンデマンドで追加できるオプションの計算ノードです。どちらも同じストレージコンポーネントを共有しているので、新しいレプリカを起動するためにデータのコピーは必要ありません。同じ Azure リージョンまたは別の Azure リージョンに、オンデマンドで geo セカンダリレプリカを追加できます。データ保護と冗長性のために、geo セカンダリレプリカには、プライマリレプリカで使用されるものとは別のストレージコンポーネントが備わっています。

次は、機能するハイパースケールアーキテクチャの図です。

Hyperscale データベースには、コンピューティングノード、ページサーバー、ログサービス、Azure Storage の各コンポーネントの種類が含まれています。

Compute

コンピューティングノードは、リレーショナルエンジンが存在する場所です。コンピューティングノードでは、言語、クエリ、トランザクションの処理が行われます。 Hyperscale データベースとユーザーのすべてのやり取りは、コンピューティングノードを通して行われます。コンピューティングノードは、サーバーレスまたはプロビジョニングコンピューティングを使うように構成できます。

計算ノードには、弾性バッファープール拡張機能 (RBPEX データキャッシュ) と呼ばれる SSD ベースのキャッシュがあります。 RBPEX データキャッシュは、リモートページサーバーからデータをフェッチする必要性を最小限に抑えるインテリジェントな低遅延の短いデータキャッシュです。

Hyperscale データベースには、読み取り/書き込みワークロードとトランザクションが処理されるプライマリコンピューティングノードが 1 つあります。最大 4 つの高可用性セカンダリ計算ノードをオンデマンドで追加できます。それらはフェールオーバー用のホットスタンバイノードとして機能し、必要に応じて、読み取りワークロードをオフロードするための読み取り専用計算ノードとして使用できます。名前付きレプリカは、さまざまな追加 OLTP 読み取りスケールアウトシナリオを可能にし、Hybrid Transactional and Analytical Processing (HTAP) ワークロードのサポートを強化するように設計されているセカンダリ計算ノードです。 geo セカンダリ計算ノードをディザスターリカバリー用に追加し、別の Azure リージョンの読み取りワークロードをオフロードするための読み取り専用計算ノードとして使用することができます。

サーバーレスの場合、プライマリレプリカと任意の高可用性レプリカまたは名前付きレプリカが、使用状況に応じて、それぞれ独立して自動スケーリングされます。プライマリレプリカと任意の名前付きレプリカのコンピューティングの自動スケーリング範囲は、独立して構成されます。高可用性レプリカの自動スケーリング範囲は、関連付けられたプライマリレプリカまたは名前付きレプリカで指定された自動スケーリング構成から継承されます。

ハイパースケールコンピューティングノード上で実行されるデータベースエンジンは、他の Azure SQL Database サービスレベルと同じです。ユーザーがハイパースケールコンピューティングノード上のデータベースエンジンを操作する場合、サポートされる外部からのアクセスとエンジンの動作は、既知の制限事項を除き、他のサービスレベルと同じです。

ページサーバー

ページサーバーは、スケールアウトされたストレージエンジンを表すシステムです。各ページサーバーは、データベース内のページのサブセットを受け持ちます。各ページサーバーにも、冗長性と可用性のために保持されるレプリカがあります。

ページサーバーの役割は、必要に応じてコンピューティングノードにデータベースページを提供し、トランザクションでデータが更新されたらページを更新することです。ページサーバーは、ログサービスからのトランザクションログレコードを再生することによって最新の状態に維持されます。

また、パフォーマンスを強化するために、ページサーバーによっては SSD ベースのキャッシュへの対応も維持されます。持続性のため、データページの長期的なストレージが Azure Storage に保持されます。

ログサービス

ログサービスは、プライマリコンピューティングレプリカから、データ変更に対応するトランザクションログレコードを受け取ります。その後、ページサーバーはログサービスからログレコードを受け取り、それぞれのデータスライスに変更を適用します。さらに、コンピューティングセカンダリレプリカはログサービスからログレコードを受け取り、バッファープールまたはローカル RBPEX キャッシュに既に存在するページへの変更のみを再生します。プライマリコンピューティングレプリカからのすべてのデータ変更は、ログサービスを介して、すべてのセカンダリコンピューティングレプリカとページサーバーに伝達されます。

最後に、トランザクションログレコードは、実質的に無制限のストレージリポジトリである Azure Storage の長期ストレージにプッシュされます。このメカニズムにより、頻繁にログを切り捨てる必要がなくなります。ログバックアップの欠落、セカンダリレプリカへの低速なデータレプリケーションなど、ログが増加する一般的な理由は、Hyperscale には適用されません。ログサービスは、ログレコードへのアクセスを高速化するためのローカルメモリと SSD キャッシュを備えています。

Azure Storage

Azure Storage には、データベース内のすべてのデータファイルが格納されています。ページサーバーは Azure Storage 内のデータファイルを最新の状態に保ちます。このストレージはバックアップのためにも使われ、ストレージ冗長性の選択に基づいてリージョン間でレプリケートされる場合があります。

バックアップはデータファイルのストレージスナップショットを使用して実行されます。スナップショットを使用した復元操作は、データサイズに関係なく高速です。データベースは、バックアップ保有期間内の任意の時点に復元できます。

Hyperscale では、ストレージの冗長性を構成できます。 Hyperscale データベースを作成する場合、以下の種類の Azure Standard Storage から選択できます。

ローカル冗長ストレージ (LRS)
ゾーン冗長ストレージ (ZRS)
読み取りアクセス geo 冗長ストレージ (RA-GRS)
読み取りアクセス geo ゾーン冗長ストレージ (RA-GZRS)

ゾーン冗長ストレージオプションは、可用性ゾーンがある Azure リージョンで使用できます。

選択したストレージ冗長オプションは、データベースの有効期間中、データストレージの冗長性とバックアップストレージの冗長性の両方に使われます。

Hyperscale の分散機能のアーキテクチャ

Hyperscale のアーキテクチャの概要

Compute

ページサーバー

ログサービス

Azure Storage

フィードバック

フィードバック

その他のリソース

Hyperscale の分散機能のアーキテクチャ

Hyperscale のアーキテクチャの概要

Compute

ページ サーバー

ログ サービス

Azure Storage

関連するコンテンツ

フィードバック

フィードバック

その他のリソース

ページサーバー

ログサービス