高性能で拡張性の高いテーブルの設計

[アーティクル]
06/01/2023

ヒント

この記事の内容は、従来の Azure Table Storage を対象としています。ただし、同じ概念が新しい Azure Cosmos DB for Table にも適用されます。これは、より高いパフォーマンスと可用性、グローバル分散、自動セカンダリインデックスを提供します。また、使用量ベースのサーバーレス　モードで使用することもできます。 Azure Cosmos DB の Table API と Azure Table Storage との間には機能の相違がいくつか存在します。詳細については、「Azure Cosmos DB for Table」を参照してください。開発を容易にするために、Azure Table Storage と Azure Cosmos DB for Table の両方を対象として使用できる、統合された Azure Tables SDK が提供されています。

スケーラビリティとパフォーマンスに優れたテーブルを設計する場合、パフォーマンス、スケーラビリティ、コストなどの要素を考慮する必要があります。過去にリレーショナルデータベースのスキーマを設計した経験がある方なら、こうした考慮事項はご存じでしょうが、Azure Table service ストレージモデルとリレーショナルモデルには類似点もあれば、重要な違いもあります。こうした相違点は、リレーショナルデータベースの扱いに慣れた方には直感的にわかりづらかったり、扱いづらかったりする設計につながりがちですが、Azure Table service などの NoSQL キー/値ストアを設計する場合には好都合です。設計の相違点の多くは、Table service が何十億ものデータエンティティ (リレーショナルデータベース用語では行) を含むクラウドアプリケーションをサポートするためのデータや、大量のデータトランザクションをサポートするよう設計されている点を考慮します。そのため、データの格納方法や Table service の動作方法について違った考え方が必要になります。 NoSQL データストアを適切に設計すれば、リレーショナルデータベースを使うソリューションよりも、ソリューションのスケーラビリティが大幅に高まり、コストも抑えられます。このガイドでは、これらのトピックについて説明します。

Azure Table service

このセクションでは、パフォーマンスとスケーラビリティを重視した設計に関連する Table service の主要機能を取り上げます。 Azure Storage と Table サービスを初めて利用する場合は、この記事の残りを読む前にまず、「.NET を使用して Azure Table Storage を使用する」をお読みください。このガイドで主に取り上げるのは Table service についてですが、Azure のキューや Blob service と、それらのサービスを Table service と共に使用する方法についても触れます。

Table service とはどのようなものでしょうか。名前が示すとおり、Table service ではデータの格納にテーブル形式が使用されます。各エンティティは、それ自体を一意に識別するためのキーのペアと、Table サービスがエンティティの最終更新日時をトラッキングするためのタイムスタンプ列を持ちます (エンティティの更新は自動的に行われます。すべてのエンティティには、エンティティを一意に識別するキーと、エンティティの最終更新時を追跡するために Table service が使用するタイムスタンプ列のペアがあります。タイムスタンプは自動的に適用されます。タイムスタンプを手動で任意の値に上書きすることはできません。 Table service では、この最終更新日時のタイムスタンプ (LMT) を使ってオプティミスティックコンカレンシーを管理します。

注意

Table service REST API 操作により、LMT から派生する ETag 値も返されます。このドキュメントでは、ETag と LMT という用語を区別なく使います。基となる同じデータを表しているためです。

次の例は、従業員と部署のエンティティを格納する、シンプルなテーブル設計を示しています。このガイドで後述する例の多くは、このシンプルな設計が基になっています。

パーティションキー

RowKey

Timestamp

マーケティング

00001

2014-08-22T00:50:32Z

FirstName	LastName	Age	Email
Don	Hall	34	donh@contoso.com

マーケティング

00002

2014-08-22T00:50:34Z

FirstName	LastName	Age	Email
6 月	Cao	47	junc@contoso.com

マーケティング

部署

2014-08-22T00:50:30Z

DepartmentName	EmployeeCount
マーケティング	153

売上

00010

2014-08-22T00:50:44Z

FirstName	LastName	Age	Email
Ken	Kwok	23	kenk@contoso.com

今のところ、データはリレーショナルデータベースのテーブルと似ており、異なるキーが必須の列となっていて、同じテーブルに複数の種類のエンティティを格納できます。また、FirstName や Age などのユーザー定義プロパティには、リレーショナルデータベース内の列のように、整数や文字列などのデータ型があります。ただし、リレーショナルデータベースとは違って、Table service にはスキーマがないため、エンティティごとにプロパティのデータ型は同じである必要はありません。 1 つのプロパティに複雑なデータ型を格納するには、JSON や XML などのシリアル化された形式を使う必要があります。サポート対象のデータ型と日付の範囲、名付け規則、サイズ制限などの Table サービスの詳細については、「 Table サービスデータモデルについて」を参照してください。

テーブルデザインの基盤には、PartitionKey と RowKey の選択が適しています。テーブルに格納されている各エンティティは、PartitionKey と RowKey の一意の組み合わせである必要があります。リレーショナルデータベーステーブル内のキーと同様に、PartitionKey と RowKey の値には、高速検索を可能にするクラスター化インデックスを作成するためのインデックスが作成されています。ただし、Table service はセカンダリインデックスを作成しないため、PartitionKey と RowKey のみがインデックス付きプロパティになります。「テーブルの設計パターン」で説明されているいくつかのパターンから、この明確な制限を回避する方法がわかります。

テーブルは 1 つ以上のパーティションから構成されており、設計に関する決定事項の多くは、ソリューションを最適化するために適切な PartitionKey と RowKey を選択することになります。ソリューションによっては、すべてのエンティティがパーティションを使って整理された 1 つのテーブルで構成されるものもありますが、通常は複数のテーブルが含まれます。テーブルを使えばエンティティを論理的に整理できるほか、アクセス制御リストを使ってデータへのアクセスを管理できます。また、1 回のストレージ操作でテーブル全体を削除できます。

テーブルのパーティション

アカウント名、テーブル名、PartitionKey を組み合わせ、テーブルサービスがエンティティを格納する場所をストレージサービス内のパーティションに特定します。エンティティのアドレス指定スキームの一部であると同時に、パーティションはトランザクションのスコープが定義し(下記のエンティティグループトランザクションを参照してください)、テーブルサービスのスケーラビリティを形成します。詳細については、「Table Storage のパフォーマンスとスケーラビリティのチェックリスト」を参照してください。

Table service では、個々のノードが 1 つ以上の完全なパーティションを提供し、サービスのスケーリングはノード間でパーティションの負荷を動的に分散させることで行われます。ノードに負荷がかかる場合は、テーブルサービスのパーティション範囲を別のノードと分割し、トラフィックが少ないときにサービスをマージして、パーティション範囲を複数のトラフィックの少ないノードから 1 つのノードに戻すことができます。

Table service の内部詳細、特に、サービスのパーティション管理方法については、ホワイトペーパー Microsoft Azure のストレージ: 強力な一貫性を備えた高使用可能なクラウドストレージサービスを参照してください。

エンティティグループトランザクション

エンティティグループトランザクション (EGT) は、Table service で複数のエンティティ間でアトミックな更新を行うための唯一の組み込みのメカニズムです。 EGT は、バッチトランザクションとも呼ばれています。 EGT では、同じパーティションに格納されたエンティティしか処理できません (つまり、特定のテーブルで同じパーティションキーを共有しています)。そのため、複数のエンティティにまたがるアトミックなトランザクションが必要な場合は、それらのエンティティを同じパーティションに格納する必要があります。これが、異なる種類のエンティティに複数のテーブルを使わずに、異なる種類のエンティティを同じテーブル (とパーティション) に格納する主な理由です。単一の EGT で最大 100 個のエンティティを処理できます。複数の並行処理 EGT を送信する場合は、それらの EGT が EGT 間の共通であるエンティティには動作しないことを確認することが重要です。さもないと、処理が遅くなる可能性があります。

また、EGT によって、設計で評価が必要なトレードオフが生じる可能性があります。つまり、使用するパーティションが増えると、ノード間で要求を負荷分散しやすくなるため、アプリケーションのスケーラビリティが向上します。一方、使用するパーティションが増えると、アプリケーションでアトミックなトランザクションを実行し、データの強力な一貫性を維持する能力が制限される可能性があります。さらに、1 つのノードの予想されるトランザクションのスループットを制限する可能性がある、パーティションレベルの特定のスケーラビリティターゲットがあります。 Azure Standard Storage アカウントのスケーラビリティターゲットの詳細については、Standard Storage アカウントのスケーラビリティターゲットに関するページを参照してください。 Table service のスケーラビリティターゲットの詳細については、「Table Storage のスケーラビリティとパフォーマンスのターゲット」を参照してください。

容量に関する考慮事項

次の表では、Table Storage の容量、スケーラビリティ、パフォーマンスについて説明しています。

リソース	移行先
Azure のストレージアカウントのテーブルの数	ストレージアカウントの容量のみによる制限
テーブルのパーティションの数	ストレージアカウントの容量のみによる制限
パーティション内のエンティティの数	ストレージアカウントの容量のみによる制限
1 つのテーブルの最大サイズ	500 TiB
単一のエンティティの最大サイズ (すべてのプロパティを含む)	1 MiB
テーブルエンティティの最大プロパティ数	255 (PartitionKey、RowKey、および Timestamp の 3 つのシステムプロパティも含む)
エンティティ内の個々のプロパティの最大合計サイズ	プロパティの型によって異なります。詳細については、「Table サービスデータモデルについて」の「プロパティの型」を参照してください。
PartitionKey のサイズ	1024 文字までのサイズの文字列
RowKeyのサイズ	1024 文字までのサイズの文字列
エンティティグループトランザクションのサイズ	トランザクションには最大で 100 個のエンティティを含めることができ、ペイロードは 4 MiB 未満にする必要があります。エンティティグループのトランザクションには、エンティティへの更新を 1 回だけ含めることができます。
テーブルあたりの保存されるアクセスポリシーの最大数	5
ストレージアカウントあたりの最大要求レート	毎秒 20,000 トランザクション (エンティティサイズは 1 KiB を想定)
1 つのテーブルパーティションのターゲットスループット (1 KiB のエンティティ)	毎秒最大 2,000 エンティティ

コストに関する考慮事項

テーブルストレージは比較的安価ですが、Table service ソリューションの評価の一環として、容量の使用とトランザクションの量を踏まえてコストを見積もる必要があります。ただし、多くのシナリオでは、ソリューションのパフォーマンスとスケーラビリティを向上させるために、非正規化されたデータまたは重複するデータを格納するのも有効です。価格の詳細については、「 Azure Storage 料金」を参照してください。

次の方法で共有

高性能で拡張性の高いテーブルの設計

Azure Table service

テーブルのパーティション

エンティティグループトランザクション

容量に関する考慮事項

コストに関する考慮事項

次のステップ

フィードバック

その他のリソース

次の方法で共有

高性能で拡張性の高いテーブルの設計

Azure Table service

テーブルのパーティション

エンティティ グループ トランザクション

容量に関する考慮事項

コストに関する考慮事項

次のステップ

フィードバック

その他のリソース

エンティティグループトランザクション