Note
Access to this page requires authorization. You can try signing in or changing directories.
Access to this page requires authorization. You can try changing directories.
原文發表於 Azure HDInsight makes HBase (NoSQL database) a GA Feature
在 2014 年 6 月,我們在 Azure HDInsight 中提供了 HBase 的預覽服務,而在 8 月 21 號,我們正式推出 HBase 的服務(同時也釋出了包含了像是 Azure DocumentDB、Azure Search 等服務)。Apache HBase 是 Apache Hadoop 生態系中,一個基於行式(columnar)的 NoSQL(Not only Structured Query Language)分散式資料庫的專案。
HBase 在 Apache Hadoop 生態系中提供了資料交易操作的功能,讓用戶能夠迅速地在 Azure Blob 儲存體中儲存資料,以及從大筆的資料中進行查詢。由於是分散式的資料庫架構,HBase 能夠依據負載及效能的需求來延展,所以 HBase 非常適合需要處理數以幾百萬或幾十億資料量的用戶(正式營運後,Azure HDInsight 中的 HBase 能支援 Azure Blob 儲存體中 500 TB 的資料),當然,HBase 缺乏了一些像是優化功能、第二層索引、以及進階的查詢語法,所以無法取代現有的關聯式資料庫管理系統(RDBMS)。
關於 HBase 一些常見的應用包括了:
- 物聯網(IoT, Internet-of-Things) — HBase 能夠儲存由各式各樣的裝置、感測器、設備及社交網路來的大量即時資料,資料儲存在 Azure Blob 儲存體中,而 Azure HDInsight 及 HBase 則可以進行一些批次運算,來處理或分析這些大量的資料。
- Web 記錄(Logs) — 可以用來處理網站的記錄檔(logs)或是一些點擊追蹤(clickstream)的資料,一樣由 Azure HDInsight 來處理及分析資料。
- 社交網路資料 — 用來儲存從社交網路來的大量資料。
我們在 Azure 的官方網站上提供了許多關於 HBase 的學習資料,歡迎您多加利用:
- Overview of HBase: https://azure.microsoft.com/zh-tw/documentation/articles/hdinsight-hbase-overview
- Get started with HBase: https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-get-started
- Real-time social sentiment analysis using HBase: https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-analyze-twitter-sentiment
- 更多關於 HDInsight 的文件: https://azure.microsoft.com/en-us/documentation/services/hdinsight/
另外,如果您想瞭解關於 Hadoop 以及 HDInsight 可以參考下列資料:
- 認識 Azure HDInsight (Hadoop) https://azure.microsoft.com/en-us/services/hdinsight/
- 觀看 Channel 9 上關於立即上手 HDInsight 的系列影片: https://channel9.msdn.com/Series/Getting-started-with-Windows-Azure-HDInsight-Service