Mi az az Apache HBase az Azure HDInsightban?

Cikk
12/11/2023

Az Apache HBase egy nyílt forráskódú NoSQL-adatbázis, amely az Apache Hadoopra épül, és a Google BigTable után modellezhető. A HBase véletlenszerű hozzáférést és erős konzisztenciát biztosít nagy mennyiségű adathoz egy séma nélküli adatbázisban. Az adatbázis oszlopcsaládok szerint van rendszerezve.

Felhasználói szempontból a HBase hasonló az adatbázisokhoz. Az adatokat egy tábla soraiban és oszlopaiban tárolja a rendszer, a soron belüli adatokat pedig oszlopcsaládok szerint csoportosítja. A HBase egy séma nélküli adatbázis. Az oszlopok és az adattípusok a használatuk előtt meghatározatlanok. A nyílt forráskód lineáris módon méreteződik át a több ezer csomópontnyi adat petabájtjainak kezelése érdekében. Támaszkodhat az adatredundanciára, a kötegelt feldolgozásra és az elosztott alkalmazások által a Hadoop-környezetben biztosított egyéb funkciókra.

Hogyan történik az Apache HBase implementálása az Azure HDInsightban?

A HDInsight HBase az Azure környezetbe integrált felügyelt fürtként érhető el. A fürtök úgy vannak konfigurálva, hogy közvetlenül az Azure Storage-ban tárolják az adatokat, ami alacsony késést és nagyobb rugalmasságot biztosít a teljesítmény és a költséglehetőségek terén. Ez a tulajdonság lehetővé teszi az ügyfelek számára, hogy nagy adathalmazokkal működő interaktív webhelyeket építsenek. Olyan szolgáltatások létrehozása, amelyek érzékelő- és telemetriai adatokat tárolnak több millió végpontból. És elemezni ezeket az adatokat Hadoop-feladatokkal. A HBase és a Hadoop jó kiindulási pont a big data-projektekhez az Azure-ban. A szolgáltatások lehetővé teszik, hogy a valós idejű alkalmazások nagy adathalmazokkal működjenek.

A HDInsight-implementáció a HBase horizontális felskálázási architektúráját használja a táblák automatikus horizontális skálázásának biztosításához. Erős konzisztenciát biztosít az olvasásokhoz és írásokhoz, valamint az automatikus feladatátvételhez. A teljesítményt a memóriába való gyorsítótárazás növeli az olvasáshoz, és a nagy streaming-kapacitás az írásokhoz. A HBase-fürt a virtuális hálózaton belül hozható létre. További részletekért lásd: HDInsight-fürtök létrehozása az Azure Virtual Network.

Hogyan történik az adatok kezelése a HDInsight HBase-ben?

Az adatok a HBase-ben a(z) create, get, put és scan parancsokkal kezelhetők a HBase rendszerhéjból. Az adatok a(z) put paranccsal írhatók, és a(z) get paranccsal olvashatók az adatbázisban. A(z) scan paranccsal szerezhetők be adatok a táblák több sorából. Az adatok a HBase C# API-val is kezelhetők, amely egy ügyfélkönyvtárat biztosít a HBase REST API-n felül. A HBase-adatbázisok az Apache Hive használatával is lekérdezhetők. Ezeknek a programozási modelleknek a bemutatása: Az Apache HBase használatának első lépései az Apache Hadooppal a HDInsightban. A koprocesszorok is elérhetők, amelyek lehetővé teszik az adatfeldolgozást az adatbázist üzemeltető csomópontokon.

Megjegyzés

A HBase nem támogatja a Thriftet a HDInsightban.

Használati esetek az Apache HBase-hez

Az a canonical használati eset, amelyhez a BigTable (és bővítményként a HBase) webes keresésből lett létrehozva. A keresőmotorok indexeket építenek, amelyek kifejezéseket képeznek le az azokat tartalmazó weblapokra. A HBase azonban sok más használati esethez megfelelő – amelyek közül több ebben a szakaszban van felsorolva.

Forgatókönyv	Leírás
Kulcs-érték tároló	A HBase kulcs-érték tárolóként használható, és alkalmas üzenetrendszerek kezelésére. A Facebook a HBase-t használja az üzenetkezelő rendszerükhöz, és ideális az internetes kommunikáció tárolásához és kezeléséhez. A WebTable a HBase eszközt használja a weblapokról kinyert táblázatok keresésére és kezelésére.
Érzékelői adatok	A HBase hasznos a növekményesen, különböző forrásokból gyűjtött adatok rögzítéséhez. Ezek az adatok közösségi elemzéseket és idősorokat is tartalmaznak. Az interaktív irányítópultok naprakészen tartása trendekkel és számlálókkal, valamint auditnapló-rendszerek kezelése. Ilyen például a Bloomberg kereskedő terminálja és az Open Time Series Database (OpenTSDB). Az OpenTSDB tárolja és hozzáférést biztosít a kiszolgálórendszerek állapotáról gyűjtött metrikákhoz.
Valós idejű lekérdezés	Az Apache Phoenix az Apache HBase SQL-lekérdezési motorja. JDBC-illesztőként érhető el, és lehetővé teszi a HBase-táblák sql használatával történő lekérdezését és kezelését.
A HBase platformként	Az alkalmazások a HBase felett futhatnak adattárolóként. Ilyen például a Phoenix, az OpenTSDB és `Kiji`a Titan. Az alkalmazások integrálhatók is a HBase eszközzel. Ilyen például az Apache Hive, az Apache Pig, a Solr, az Apache Flume, az Apache Impala, az Apache Spark és `Ganglia`az Apache Drill.

Megosztás a következőn keresztül:

Mi az az Apache HBase az Azure HDInsightban?

Hogyan történik az Apache HBase implementálása az Azure HDInsightban?

Hogyan történik az adatok kezelése a HDInsight HBase-ben?

Használati esetek az Apache HBase-hez

Következő lépések

Visszajelzés

Visszajelzés

További források