Určení strategií migrace a vysoké dostupnosti v HDInsight HBase
Častým problémem, kterým zákazníci čelí, je migrace clusterů HBase z místního prostředí nebo mezi verzemi během upgradů clusteru. HDInsight HBase nabízí následující možnosti migrace, upgradu a ochrany před ztrátou dat.
Zkopírování složky hbase
Strategie kopírování složky /hbase se obvykle používá pro pravidelné zálohování nebo migrace. HDInsight HBase ukládá všechna data a soubory metadat, které byly vyprázdněné na disk ve složce /hbase .
Poznámka:
Tento proces nenabízí replikaci v reálném čase mezi clustery a nenabízí členitost migrace konkrétních tabulek.
Spuštěním následujících kroků postupně zálohujte nebo migrujte cluster HDInsight. HDInsight /hbase je uložen v následujícím umístění: wasbs://<containername>@<accountname>.blob.core.windows.net/hbase
- Zjištění cesty, kde je složka /hbase umístěná ve zdrojovém clusteru
- Zastavte všechny zápisy do zdrojového clusteru a vynuťte vyprázdnění na disk, aby se zajistilo, že není v paměti nic.
- Zkopírujte data v /hbase do cílového cíle služby Azure Storage pomocí nástroje AzCopy pro Blob Storage nebo AdlCopy pro Data Lake Storage.
- Pokud se jedná o scénář zotavení po havárii, mohou být data pravidelně uložena v jiné oblasti pro budoucí použití v případě havárie.
- Pokud se jedná o migraci HBase, je možné data zkopírovat do složky /hbase nově vytvořený cluster HDInsight HBase.
Další informace o procesu kopírování složky HBase hbase najdete v dokumentaci ke složce HDInsight hbase Copy.
Export a import
Export a import nabízí lepší kontrolu nad procesem zálohování a můžete zvolit zálohování konkrétních tabulek místo celé složky. Tento proces používá nástroj exportu clusteru HBase k exportu vybraných tabulek do místního úložiště připojeného ke clusteru. Po exportu tabulek, které je pak možné importovat z cílového clusteru. Další informace o práci s exportem a importem najdete v dokumentaci k exportu a importu hdInsight HBase.
Kopírování tabulek
Kopírování tabulek je efektivní mechanismus kopírování a umožňuje jemně odstupňovanou kontrolu nad úplným nebo částečným procesem kopírování tabulek a používá cesty ke čtení a zápisu HBase ke kopírování části nebo celého řádku tabulky po řádku ze zdroje do cíle. Zdrojové a cílové clustery můžou být stejné nebo různé clustery. Další informace o práci s kopírovat tabulky najdete v dokumentaci ke kopírování tabulek HDInsight HBase.
Snapshots
Snímky můžou povolit zálohování k určitému bodu v čase a umožnit tak požadavky na vrácení tabulky zpět. Snímek není kopií skutečných dat tabulky, ale jsou to informace o metadatech, které můžou správcům pomoct vrátit se k předchozímu stavu tabulek. Snímky fungují na úrovni HDFS a nezahrnují servery Master a Region pro optimalizaci prostředků clusteru. Další informace o práci se snímky najdete v dokumentaci ke snímkům HDInsight HBase.
Replikace
Funkci replikace HBase je možné použít k zajištění vysoké dostupnosti a provozní kontinuity během havárie. Data se kopírují mezi clustery asynchronním způsobem a replikace můžou fungovat v rámci oblastí a mezi oblastmi Azure, které zajišťují globální modely HADR. Další informace o práci s replikací HBase najdete v dokumentaci k replikaci HBase služby HDInsight.