Rövid útmutató: Apache Hive-lekérdezések végrehajtása az Azure HDInsightban az Apache Zeppelinnel
Ebben a rövid útmutatóban megtudhatja, hogyan futtathat Apache Hive-lekérdezéseket az Azure HDInsightban az Apache Zeppelin használatával. A HDInsight Interaktív lekérdezésfürtök olyan Apache Zeppelin-jegyzetfüzeteket tartalmaznak, amelyekkel interaktív Hive-lekérdezéseket futtathat.
Ha még nincs Azure-előfizetése, kezdés előtt hozzon létre egy ingyenes fiókot.
Előfeltételek
EGY HDInsight interaktív lekérdezési fürt. HdInsight-fürt létrehozásához lásd a fürt létrehozása című témakört. Győződjön meg arról, hogy az Interaktív lekérdezés fürttípust választja.
Apache Zeppelin-megjegyzés létrehozása
Cserélje le
CLUSTERNAME
a fürt nevét a következő URL-címenhttps://CLUSTERNAME.azurehdinsight.net/zeppelin
. Ezután adja meg az URL-címet egy webböngészőben.Adja meg a fürt bejelentkezési felhasználónevét és jelszavát. A Zeppelin lapon létrehozhat egy új jegyzetet, vagy megnyithatja a meglévő jegyzeteket. A HiveSample tartalmaz néhány hive-mintalekérdezéseket.
Válassza az Új jegyzet létrehozása lehetőséget.
Az Új jegyzet létrehozása párbeszédpanelen írja be vagy válassza ki a következő értékeket:
- Megjegyzés neve: Adja meg a jegyzet nevét.
- Alapértelmezett értelmező: Válassza ki a jdbc-t a legördülő listából.
Válassza a Jegyzet létrehozása lehetőséget.
Írja be a következő Hive-lekérdezést a kódszakaszba, majd nyomja le a Shift + Enter billentyűkombinációt:
%jdbc(hive) show tables
Az
%jdbc(hive)
első sorban szereplő utasítás arra utasítja a jegyzetfüzetet, hogy használja a Hive JDBC-értelmezőt.A lekérdezésnek egy hivesampletable nevű Hive-táblát kell visszaadni.
A következő két további Hive-lekérdezést futtathat a hivesampletable használatával:
%jdbc(hive) select * from hivesampletable limit 10 %jdbc(hive) select ${group_name}, count(*) as total_count from hivesampletable group by ${group_name=market,market|deviceplatform|devicemake} limit ${total_count=10}
A hagyományos Hive-hez képest a lekérdezési eredmények sokkal gyorsabban térnek vissza.
További példák
Tábla létrehozása. Hajtsa végre a kódot a Zeppelin-jegyzetfüzetben:
%jdbc(hive) CREATE EXTERNAL TABLE log4jLogs ( t1 string, t2 string, t3 string, t4 string, t5 string, t6 string, t7 string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' STORED AS TEXTFILE;
Adatok betöltése az új táblába. Hajtsa végre a kódot a Zeppelin-jegyzetfüzetben:
%jdbc(hive) LOAD DATA INPATH 'wasbs:///example/data/sample.log' INTO TABLE log4jLogs;
Egyetlen rekord beszúrása. Hajtsa végre a kódot a Zeppelin-jegyzetfüzetben:
%jdbc(hive) INSERT INTO TABLE log4jLogs2 VALUES ('A', 'B', 'C', 'D', 'E', 'F', 'G');
További szintaxisért tekintse át a Hive nyelvi kézikönyvét .
Az erőforrások eltávolítása
A rövid útmutató elvégzése után érdemes lehet törölni a fürtöt. A HDInsight használatával az adatok az Azure Storage-ban lesznek tárolva, így biztonságosan törölheti a fürtöt, ha nincs használatban. A HDInsight-fürtökért is díjat számítunk fel, még akkor is, ha nincs használatban. Mivel a fürt díjai sokszor nagyobbak, mint a tárolási díjak, érdemes törölni a fürtöket, ha nincsenek használatban.
A fürtök törléséről a HDInsight-fürt törlése a böngésző, a PowerShell vagy az Azure CLI használatával című témakörben olvashat.
Következő lépések
Ebben a rövid útmutatóban megtanulta, hogyan futtathat Apache Hive-lekérdezéseket az Azure HDInsightban az Apache Zeppelin használatával. Ha többet szeretne megtudni a Hive-lekérdezésekről, a következő cikk bemutatja, hogyan hajthat végre lekérdezéseket a Visual Studióval.