在 HDInsight 中使用直接查詢,以可視化方式使用 Microsoft Power BI 的互動式查詢 Apache Hive 數據
本文說明如何將 Microsoft Power BI 連線至 Azure HDInsight 互動式查詢叢集,並使用直接查詢將 Apache Hive 數據可視化。 提供的範例會將Hive數據表的數據 hivesampletable
載入Power BI。 hivesampletable
Hive 數據表包含一些行動電話使用量數據。 然後,您會繪製世界地圖上的使用量數據:
您可以使用 Apache Hive ODBC驅動程式 ,透過Power BI Desktop中的一般 ODBC 連接器進行匯入。 不過,基於Hive查詢引擎的非互動式本質,不建議使用BI工作負載。 HDInsight 互動式查詢連接器 和 HDInsight Apache Spark 連接器 是較佳的效能選擇。
必要條件
在完成本文之前,您必須具有下列專案:
- HDInsight 叢集。 叢集可以是具有 Apache Hive 的 HDInsight 叢集或新發行的互動式查詢叢集。 如需建立叢集,請參閱 建立叢集。
- Microsoft Power BI Desktop。 您可以從 Microsoft 下載中心下載複本。
從 HDInsight 載入數據
hivesampletable
Hive 數據表隨附所有 HDInsight 叢集。
啟動 Power BI Desktop。
從功能表欄,流覽至 [首頁>取得數據>...]。
從 [ 取得數據] 視窗,在搜尋方塊中輸入 hdinsight 。
從搜尋結果中,選取 [HDInsight 互動式查詢],然後選取 [連線]。 如果您沒有看到 HDInsight 互動式查詢,您需要將 Power BI Desktop 更新為最新版本。
選取 [繼續] 以關閉 連線 至第三方服務對話框。
在 [ HDInsight 互動式查詢 ] 視窗中,輸入下列資訊,然後選取 [ 確定]:
屬性 值 伺服器 輸入叢集名稱,例如 myiqcluster.azurehdinsight.net。 Database 為此文章輸入 預設值 。 資料連線模式 選取 本文的 DirectQuery 。 輸入 HTTP 認證,然後選取 [連線]。 默認使用者名稱為 admin。
從左窗格中的 [導覽器 ] 視窗中,選取 [hivesampletale]。
從主視窗選取 [載入 ]。
在地圖上將數據可視化
從最後一個程式繼續進行。
從 [視覺效果] 窗格中,選取 [地圖],即地球圖示。 然後,泛型對應會出現在主視窗中。
從 [欄位] 窗格中,選取 國家/地區 和 devicemake。 數據點的世界地圖會在幾分鐘后出現在主視窗中。
展開地圖。
下一步
在本文中,您已瞭解如何使用 Microsoft Power BI 將數據從 HDInsight 可視化。 如需數據視覺效果的詳細資訊,請參閱下列文章:
- 在 Azure HDInsight 中使用 ODBC 將 Apache Hive 數據與 Microsoft Power BI 可視化。
- 使用 Apache Zeppelin 在 Azure HDInsight 中執行 Apache Hive 查詢。
- 使用 Microsoft Hive ODBC 驅動程式將 Excel 連線到 HDInsight。
- 使用 Power Query 將 Excel 連線到 Apache Hadoop。
- 使用 Data Lake Tools for Visual Studio 連線至 Azure HDInsight 及執行 Apache Hive 查詢。
- 使用適用於 Visual Studio Code 的 Azure HDInsight 工具。
- 將數據上傳至 HDInsight。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應