Migliorare le prestazioni di scrittura e lettura dei cluster HBase

Completato

È possibile migliorare le prestazioni di lettura e scrittura di HDInsight HBase usando le scritture accelerate. Si vedrà ora qual è l'impatto in termini di prestazioni con e senza le scritture accelerate.

Senza scritture accelerate abilitate

La funzionalità di scrittura accelerata in Azure HDInsight collega un disco gestito SSD Premium a ogni server di area HBase (nodo di lavoro) durante la distribuzione del cluster. I log write-ahead (WAL) vengono scritti nel file system DFS Hadoop montato nei dischi gestiti SSD Premium anziché nei BLOB di pagine di Azure.

I dischi gestiti Premium sulle unità SSD offrono prestazioni di scrittura molto superiori e migliorano le prestazioni di I/O del cluster con tolleranza di errore.

Accelerated Writes feature within HBase.

I requisiti dei clienti per le scritture e le letture a bassa latenza sono in continua evoluzione nel tempo. Sebbene la separazione tra calcolo e archiviazione in HDInsight HBase offra agilità, scalabilità, affidabilità ed economie di scala per i clienti, aggiunge anche la latenza di rete per le operazioni di scrittura e lettura. Benché questa latenza possa essere adatta per la maggior parte dei clienti, i clienti che necessitano di scritture e letture a bassissima latenza possono usufruire della funzionalità Scritture HBase accelerate di HDInsight.

Con scritture accelerate abilitate

Prestazioni di lettura

Per impostazione predefinita, HDInsight HBase effettua il provisioning di un account di archiviazione di tipo Archiviazione (utilizzo generico v1). Per migliorare le prestazioni di lettura, è possibile impostare l'archiviazione BLOB in blocchi Premium anziché Archiviazione (utilizzo generico v1) per ottimizzare le prestazioni delle letture.

Creare un account di archiviazione BLOB in blocchi Premium prima del processo di creazione del cluster.

Create a storage account.

Durante la creazione del cluster, assegnare il BLOB in blocchi Premium come account di archiviazione primario per il cluster, come illustrato di seguito. I blocchi del BLOB in blocchi Premium verranno visualizzati solo se è selezionata l'opzione che abilita le scritture accelerate.

Mapping the storage account in a HDInsight Cluster.

Per informazioni sulle procedure consigliate per la gestione delle prestazioni di HDInsight HBase, vedere la pagina relativa alla risoluzione dei problemi di prestazioni di HBase.

Prestazioni di scrittura

Nell'offerta standard di HDInsight HBase, i log write-ahead di HBase vengono archiviati nei BLOB di pagine di Azure. Sebbene questo funzioni bene per la maggior parte dei requisiti aziendali, per alcune applicazioni mission critical che richiedono una latenza costantemente bassa e un livello elevato di I/O, le latenze incoerenti nei log write-ahead supportati dai BLOB di pagine possono diventare un collo di bottiglia per le prestazioni di scrittura di HBase.

HBase Write Ahead Logs (WAL) stored in Azure Page Blobs.