次の方法で共有


Analytics プラットフォーム システムでの処理とストレージの容量

ビジネス要件によって、データ スケール ユニットの数と、Analytics Platform System (APS) アプライアンスで必要なコンピューティング ノード ディスクのサイズが決まります。 これらの処理とストレージの計算を使用して、容量の購入と計画の決定を導きます。

処理能力の計画

SQL Server Parallel Data Warehouse (PDW) のクエリ パフォーマンスは、データで並行して動作する CPU コアの数によって大きく異なります。 制限内では、並列処理を増やすと、超並列処理 (MPP) クエリのパフォーマンスが向上します。 データ サイズが比較的小さい場合でも、並列処理が大きくなると、MPP クエリ エンジンの能力は向上します。

たとえば、12 個の計算ノードを持つアプライアンスには、データを並列で処理する 192 個の CPU コアがあります。 これは 192 方向の並列処理です。 56 個のコンピューティング ノードを持つアプライアンスでは、896 コアがすべて並列に動作します。 この並列処理の大きさは、MPP コンピューティングがないと実現できません。

計算ノードの数が増えるにつれて、アプライアンスをスケールアウトするには、顕著な利点を得るために、一度に複数の計算ノードを追加する必要があります。 ハードウェア ベンダーは、アプライアンスをスケーリングする利点が、より多くの計算ノード間でデータを再配布するコストを上回るように、データ スケール ユニットの特定の構成のみをサポートしています。

データ スケール ユニットの構成例 - HPE

データ スケール ユニットでサポートされている HPE 構成の例を次に示します。 これらは、サポートされている最新の構成とは異なる場合がありますが、容量を約 20% 増やす方法の例として提供されています。

Uplift は、データ スケール Uunit を 1 行から次の行に増やすことによって、容量の増加率をパーセントで計算します。 たとえば、データ スケール ユニットを 6 から 8 に増やすと、CPU コアとメモリが 33% 上昇します。 また、この表に示されていないディスク領域も増えます。

データ スケール ユニット コンピューティング ノード CPU コア数 メモリ (GB) アップリフト
1 2 32 512 -
2 4 64 1024 100%
3 6 96 1536 50%
4 8 128 2048 33%
5 10 160 2560 25%
6 12 192 3072 20%
8 16 256 4096 33%
10 20 320 5120 25%
12 24 384 6144 20%
16 32 512 8192 33%
20 40 640 10240 25%
24 48 768 12288 20%
28 56 896 14336 17%

説明:

  • アプライアンスごとのデータ スケール ユニット。 データ スケール ユニットの詳細については、「Analytics プラットフォーム システムハードウェア コンポーネント」を参照してください。

  • アプライアンスごとの計算ノード

  • アプライアンスごとの CPU コア。 コンピューティング ノードごとに 16 個のコアがあり、ミラー化されたディスク ペアごとに 1 つのコアがあります。 コンピューティング ノードのディスク構造については、「Analytics Platform System のハードウェア コンポーネント」を参照してください。

  • アプライアンスごとのメモリ。 各コアには 256 GB のメモリがあります。

データ スケール ユニットの構成例 - Dell、Quanta

データ スケール ユニットでサポートされている Dell 構成と Quanta 構成の例を次に示します。 これらは、サポートされている最新の構成とは異なる場合がありますが、容量を約 20% 増やす方法の例として提供されています。

Uplift は、データ スケール Uunit を 1 行から次の行に増やすことによって、容量の増加率をパーセントで計算します。 たとえば、データ スケール ユニットを 6 から 8 に増やすと、CPU コアとメモリが 33% 上昇します。 また、この表に示されていないディスク領域も増えます。

データ スケール ユニット コンピューティング ノード CPU コア メモリ (GB) アップリフト
1 3 48 768 -
2 6 96 1536 100%
3 9 144 2,304 50%
4 12 192 3,072 33%
5 15 240 3,840 25%
6 18 288 4,608 20%
7 21 336 5,376 17%
8 24 384 6,144 14%
9 27 432 6,912 13%
12 36 576 9,216 33%
15 45 720 11,520 25%
18 54 864 13,824 20%

ストレージ容量の計画

次の表は、完全に構築された Analytics Platform System アプライアンスに最大 6 ペタバイトの非圧縮データを読み込んで格納できることを示しています。

ベンダー ドライブ サイズ 計算ノードごとの物理データ ストレージ ラックごとの最大コンピューティング ノード数 ラックごとの物理最大データ ストレージ ラックごとの推定最大ユーザー データ ストレージ数 最大ラック数 アプライアンスごとの推定最大ユーザー データ ストレージ数
HPE 1 TB (テラバイト) 16 TB 8 128 TB 320 TB 7 2,240 TB
HPE 2 TB 32 TB 8 256 TB 640 TB 7 4,480 TB
HPE 4 TB 64 TB 8 512 TB 1280 TB 7 8,960 TB
DELL 1 TB (テラバイト) 16 TB 9 144 TB 360 TB 6 2,160 TB
DELL 2 TB 32 TB 9 288 TB 720 TB 6 4,320 TB
DELL 4 TB 64 TB 9 576 TB 1440 TB 6 8,640 TB

説明:

  • 各ハードウェア ベンダーのドライブ サイズ は 1、2、または 4 TB です。

  • 計算ノードごとの物理データ ストレージ = (ドライブ サイズ) * (コンピューティング ノードあたり 16 個のディスク)。 ミラー化されたディスクは冗長性のため、含まれません。

  • ラックごとの最大コンピューティング ノード数は、ハードウェア ベンダーに固有です。

  • ラックごとの物理最大データ ストレージ = (コンピューティング ノードごとの物理データ ストレージ) * (ラックあたりの最大コンピューティング ノード数)。

  • ラックごとの推定最大ユーザー データ ストレージ数 = (ラックあたりの物理最大データ ストレージ数) * (5:1 圧縮率の場合は 5) * (ログと tempDB の場合は 50%)。 これは、アプライアンスにロードおよび保存できる非圧縮ユーザー データの控えめな見積もりです。 これは見積もりであり、ソフトウェアによって適用されません。 実際のユーザー データ ストレージは、データと構成によって異なります。

  • 最大ラック数 は、ハードウェア ベンダーごとに固有です。

  • アプライアンスあたりの推定最大データ ストレージ数 = (ラックあたりの推定最大データ ストレージ数) * (最大ラック数)。 これは、完全に構築されたアプライアンスに読み込んで格納できるユーザー データの総計サイズの控えめな見積もりです。