Mi az az Apache HBase az Azure HDInsightban?
Az Apache HBase egy nyílt forráskódú NoSQL-adatbázis, amely az Apache Hadoopra épül, és a Google BigTable után modellezhető. A HBase véletlenszerű hozzáférést és erős konzisztenciát biztosít nagy mennyiségű adathoz egy séma nélküli adatbázisban. Az adatbázis oszlopcsaládok szerint van rendszerezve.
Felhasználói szempontból a HBase hasonló az adatbázisokhoz. Az adatokat egy tábla soraiban és oszlopaiban tárolja a rendszer, a soron belüli adatokat pedig oszlopcsaládok szerint csoportosítja. A HBase egy séma nélküli adatbázis. Az oszlopok és az adattípusok a használatuk előtt meghatározatlanok. A nyílt forráskód lineáris módon méreteződik át a több ezer csomópontnyi adat petabájtjainak kezelése érdekében. Támaszkodhat az adatredundanciára, a kötegelt feldolgozásra és az elosztott alkalmazások által a Hadoop-környezetben biztosított egyéb funkciókra.
Hogyan történik az Apache HBase implementálása az Azure HDInsightban?
A HDInsight HBase az Azure környezetbe integrált felügyelt fürtként érhető el. A fürtök úgy vannak konfigurálva, hogy közvetlenül az Azure Storage-ban tárolják az adatokat, ami alacsony késést és nagyobb rugalmasságot biztosít a teljesítmény és a költséglehetőségek terén. Ez a tulajdonság lehetővé teszi az ügyfelek számára, hogy nagy adathalmazokkal működő interaktív webhelyeket építsenek. Olyan szolgáltatások létrehozása, amelyek érzékelő- és telemetriai adatokat tárolnak több millió végpontból. És elemezni ezeket az adatokat Hadoop-feladatokkal. A HBase és a Hadoop jó kiindulási pont a big data-projektekhez az Azure-ban. A szolgáltatások lehetővé teszik, hogy a valós idejű alkalmazások nagy adathalmazokkal működjenek.
A HDInsight-implementáció a HBase horizontális felskálázási architektúráját használja a táblák automatikus horizontális skálázásának biztosításához. Erős konzisztenciát biztosít az olvasásokhoz és írásokhoz, valamint az automatikus feladatátvételhez. A teljesítményt a memóriába való gyorsítótárazás növeli az olvasáshoz, és a nagy streaming-kapacitás az írásokhoz. A HBase-fürt a virtuális hálózaton belül hozható létre. További részletekért lásd: HDInsight-fürtök létrehozása az Azure Virtual Network.
Hogyan történik az adatok kezelése a HDInsight HBase-ben?
Az adatok a HBase-ben a(z) create
, get
, put
és scan
parancsokkal kezelhetők a HBase rendszerhéjból. Az adatok a(z) put
paranccsal írhatók, és a(z) get
paranccsal olvashatók az adatbázisban. A(z) scan
paranccsal szerezhetők be adatok a táblák több sorából. Az adatok a HBase C# API-val is kezelhetők, amely egy ügyfélkönyvtárat biztosít a HBase REST API-n felül. A HBase-adatbázisok az Apache Hive használatával is lekérdezhetők. Ezeknek a programozási modelleknek a bemutatása: Az Apache HBase használatának első lépései az Apache Hadooppal a HDInsightban. A koprocesszorok is elérhetők, amelyek lehetővé teszik az adatfeldolgozást az adatbázist üzemeltető csomópontokon.
Megjegyzés
A HBase nem támogatja a Thriftet a HDInsightban.
Használati esetek az Apache HBase-hez
Az a canonical használati eset, amelyhez a BigTable (és bővítményként a HBase) webes keresésből lett létrehozva. A keresőmotorok indexeket építenek, amelyek kifejezéseket képeznek le az azokat tartalmazó weblapokra. A HBase azonban sok más használati esethez megfelelő – amelyek közül több ebben a szakaszban van felsorolva.
Forgatókönyv | Leírás |
---|---|
Kulcs-érték tároló | A HBase kulcs-érték tárolóként használható, és alkalmas üzenetrendszerek kezelésére. A Facebook a HBase-t használja az üzenetkezelő rendszerükhöz, és ideális az internetes kommunikáció tárolásához és kezeléséhez. A WebTable a HBase eszközt használja a weblapokról kinyert táblázatok keresésére és kezelésére. |
Érzékelői adatok | A HBase hasznos a növekményesen, különböző forrásokból gyűjtött adatok rögzítéséhez. Ezek az adatok közösségi elemzéseket és idősorokat is tartalmaznak. Az interaktív irányítópultok naprakészen tartása trendekkel és számlálókkal, valamint auditnapló-rendszerek kezelése. Ilyen például a Bloomberg kereskedő terminálja és az Open Time Series Database (OpenTSDB). Az OpenTSDB tárolja és hozzáférést biztosít a kiszolgálórendszerek állapotáról gyűjtött metrikákhoz. |
Valós idejű lekérdezés | Az Apache Phoenix az Apache HBase SQL-lekérdezési motorja. JDBC-illesztőként érhető el, és lehetővé teszi a HBase-táblák sql használatával történő lekérdezését és kezelését. |
A HBase platformként | Az alkalmazások a HBase felett futhatnak adattárolóként. Ilyen például a Phoenix, az OpenTSDB és Kiji a Titan. Az alkalmazások integrálhatók is a HBase eszközzel. Ilyen például az Apache Hive, az Apache Pig, a Solr, az Apache Flume, az Apache Impala, az Apache Spark és Ganglia az Apache Drill. |