改善 HBase 叢集的寫入和讀取效能

已完成

您可以使用加速型寫入來改善 HDInsight HBase 的讀取和寫入效能。 現在,我們來看看使用和未使用加速型寫入時對效能的影響。

未啟用加速型寫入

Azure HDInsight 中的加速型寫入會在叢集部署期間將進階 SSD 受控磁碟連結至每個 HBase 區域伺服器 (背景工作節點)。 預寫記錄檔 (WAL) 會寫入至裝載於進階 SSD 受控磁碟 (而不是 Azure 分頁 Blob) 上的 Hadoop 分散式檔案系統 (HDFS)。

SSD 上的進接受控磁碟提供更優異的寫入效能,並透過容錯改善了叢集 I/O 效能。

Accelerated Writes feature within HBase.

客戶對低延遲寫入和讀取的需求會隨著時間不斷演進。 雖然在 HDInsight HBase 中對計算和儲存的區隔可為客戶提供靈活性、擴充性、可靠性和規模效益,但這也同時增加了寫入和讀取作業的網路延遲。 大部分的客戶都可接受這樣的延遲,但若有客戶需要超低延遲的寫入和讀取,可以利用 HDInsight HBase 的加速寫入功能。

已啟用加速型寫入

讀取效能

HDInsight HBase 依預設會佈建儲存體類型 (一般用途 v1) 的儲存體帳戶。 若要改善讀取效能,您可以設定進階區塊 Blob 儲存體以改善讀取的效能,而非設定儲存體 (一般用途 V1)。

進行叢集建立程序之前,請先建立進階區塊 Blob 儲存體帳戶。

Create a storage account.

在叢集建立期間,將進階區塊 Blob 指派為叢集的主要儲存體帳戶,如下所示。 只有在選取 [啟用加速型寫入] 時,才會開始顯示進階區塊 Blob。

Mapping the storage account in a HDInsight Cluster.

若要了解有關 HDInsight HBase 效能管理的最佳做法,請移至 [對 HBase 效能問題進行疑難排解] 頁面。

寫入效能

在標準 HDInsight HBase 供應項目中,HBase 預寫記錄檔 (WAL) 會儲存在 Azure 分頁 Blob 中。 雖然這符合大部分的商務需求,但對於某些需要持續性低延遲和高輸送量 I/O 的任務關鍵應用程式來說,分頁 Blob 所支援的 WAL 記錄會出現不一致的延遲,這可能會成為 HBase 寫入效能的瓶頸。

HBase Write Ahead Logs (WAL) stored in Azure Page Blobs.