Určení strategií migrace a vysoké dostupnosti v HDInsight HBase

Dokončeno

Častým problémem, kterým zákazníci čelí, je migrace clusterů HBase z místního prostředí nebo mezi verzemi během upgradů clusteru. HDInsight HBase nabízí následující možnosti migrace, upgradu a ochrany před ztrátou dat.

Zkopírování složky hbase

Strategie kopírování složky /hbase se obvykle používá pro pravidelné zálohování nebo migrace. HDInsight HBase ukládá všechna data a soubory metadat, které byly vyprázdněné na disk ve složce /hbase .

Poznámka:

Tento proces nenabízí replikaci v reálném čase mezi clustery a nenabízí členitost migrace konkrétních tabulek.

Spuštěním následujících kroků postupně zálohujte nebo migrujte cluster HDInsight. HDInsight /hbase je uložen v následujícím umístění: wasbs://<containername>@<accountname>.blob.core.windows.net/hbase

  1. Zjištění cesty, kde je složka /hbase umístěná ve zdrojovém clusteru
  2. Zastavte všechny zápisy do zdrojového clusteru a vynuťte vyprázdnění na disk, aby se zajistilo, že není v paměti nic.
  3. Zkopírujte data v /hbase do cílového cíle služby Azure Storage pomocí nástroje AzCopy pro Blob Storage nebo AdlCopy pro Data Lake Storage.
  4. Pokud se jedná o scénář zotavení po havárii, mohou být data pravidelně uložena v jiné oblasti pro budoucí použití v případě havárie.
  5. Pokud se jedná o migraci HBase, je možné data zkopírovat do složky /hbase nově vytvořený cluster HDInsight HBase.

Další informace o procesu kopírování složky HBase hbase najdete v dokumentaci ke složce HDInsight hbase Copy.

Export a import

Export a import nabízí lepší kontrolu nad procesem zálohování a můžete zvolit zálohování konkrétních tabulek místo celé složky. Tento proces používá nástroj exportu clusteru HBase k exportu vybraných tabulek do místního úložiště připojeného ke clusteru. Po exportu tabulek, které je pak možné importovat z cílového clusteru. Další informace o práci s exportem a importem najdete v dokumentaci k exportu a importu hdInsight HBase.

Kopírování tabulek

Kopírování tabulek je efektivní mechanismus kopírování a umožňuje jemně odstupňovanou kontrolu nad úplným nebo částečným procesem kopírování tabulek a používá cesty ke čtení a zápisu HBase ke kopírování části nebo celého řádku tabulky po řádku ze zdroje do cíle. Zdrojové a cílové clustery můžou být stejné nebo různé clustery. Další informace o práci s kopírovat tabulky najdete v dokumentaci ke kopírování tabulek HDInsight HBase.

Snapshots

Snímky můžou povolit zálohování k určitému bodu v čase a umožnit tak požadavky na vrácení tabulky zpět. Snímek není kopií skutečných dat tabulky, ale jsou to informace o metadatech, které můžou správcům pomoct vrátit se k předchozímu stavu tabulek. Snímky fungují na úrovni HDFS a nezahrnují servery Master a Region pro optimalizaci prostředků clusteru. Další informace o práci se snímky najdete v dokumentaci ke snímkům HDInsight HBase.

Replikace

Funkci replikace HBase je možné použít k zajištění vysoké dostupnosti a provozní kontinuity během havárie. Data se kopírují mezi clustery asynchronním způsobem a replikace můžou fungovat v rámci oblastí a mezi oblastmi Azure, které zajišťují globální modely HADR. Další informace o práci s replikací HBase najdete v dokumentaci k replikaci HBase služby HDInsight.