永續型運算過濾不實環保
Dave Ohara
目錄
數據的必要性
測量能源使用情形
功率因數
在生產環境中測量
Microsoft 企業工程中心
總結
標榜環保、節能、高效率來行銷的產品與解決方案不可勝數。所有這些行銷手法在市場上所造成的混淆,使得環保商品真假難辨。即使評估過各種產品的規格,IT 專業人員仍然難以 (甚至無法)
判斷在環境因素有重大影響時,應該採用哪些設備。產品展示總是以能夠節約大量能源為主打,讓您以為投資報酬率 (ROI) 是升級的好理由。畢竟,節能表示能降低整體擁有成本 (TCO)。
各行各業流行將所有產品標示為環保並利用目前大眾對環保解決方案的興趣,使得「不實環保」一詞應時而生,用來形容過度吹噓環保效益的行為。那麼,節能的真相為何?不像是自家換裝一顆省電燈泡一樣單純,節能的真相無法一言以蔽之。
隨著永續型 IT 事業越來越引人注目,同時 IT 環保設備的市場逐漸擴大,許多組織及個人都迫不及待部署節約能源的膝上型電腦、桌上型電腦及伺服器,並使用虛擬化來減少能源耗用。但卻很少有組織實行能源稽核來確定這些採購行為究竟帶來多少效益。
以理想的情況來說,最好能在生產環境中主動進行測量,但是這麼做的成本很高。若您尚未準備好測量實際生產環境,您還是可以在作業流程的初期執行能源稽核,也就是在效能與評估實驗室中進行 (大部分的公司都設有某種實驗室或小組,負責在實際採購之前先測試和評估設備)。您可以在實驗室中將能源效益也加入測試條件中,然後將這些結果列入採購決定的考量中,而不是依賴製造商單方面提供的數值。因此進行測試時,建立自己的裝置耗電量資料庫。如此一來,您就可以忽略這些不實環保的口號,自行判斷何者真正有效。
當然,我必須提醒您,如果您希望了解在實際工作負荷下操作時的精確數據,就必須在生產環境中監測。您越早開始監測生產環境,對您的組織及營運就越有利。長遠看來,這項作業對於成功有關鍵性的影響。
數據的必要性
在理想情況下,應該執行獨立測試來評估硬體裝置在實際使用者工作量下的每瓦效能。但是業界在開發及部署這類測試方面,仍處於早期階段。而目前市面上的測試標準,例如 SPEC Power 基準測試,尚未成熟。這些能源測試一旦完備之後的表現如何,仍有待觀察。但是任何測試都一樣,製造商會從中學習如何修改產品來獲得最佳的測試結果。
老練的 IT 專家已經懂得質疑測試實驗室主導的測試結果。正如車廠一定是派遣它們最棒的車款進行道路試驗,IT 廠商也一定會提交最高效率的設備組態進行能源測試。
試想一下,使用虛擬化測試來比較一組過度佈建又完全沒有執行伺服器整併的伺服器,來展現虛擬化的效益。廠商故意不提節能計劃 (像是虛擬化) 可能造成反效果等這類問題。基本上,這意謂著能源效率降低成本,使得需求增加,此時反而提高能源使用量。每當您看到標榜全效節能的解決方案 (例如虛擬化),就應該心存懷疑。您確實需要觀察各種產品搭配使用的情形,並留意使用一段時間後的漣漪作用。
那麼,您要如何為公司找到正確的方向?您會看到很多顧問都已經準備好提供收費的評估服務。但是這麼做有一些重大缺點。您真的希望將提高效率的專業工作交給組織外部的人員嗎?既然顧問想要拿到長期合約並讓客戶依賴他的服務,您還放心委託顧問嗎?
您可以將這項工作改變成一項多人參與的大型計劃,藉此擬定環保永續發展策略。請避免草率地從環境中隨處開始測量。想法也許沒錯,但作法有欠考慮,因為這種舉動太過貿然。您必須了解能源耗用的源頭,以及從何處著手最有效。
測量能源使用情形
您必須以新思維來看待有效運作這件事。舉例來說,當服務中斷時,IT 專業人員就知道硬體停止運作了。但若是從耗電量的角度來看,要如何得知硬體的運作不佳?可能無從得知,因為大多數的組織都缺乏建置能源效率基準所需的資料。
您要如何取得這些數據?有些人建議由專職的能源總管負責。但是這麼做需要某人能夠確定公司組織結構的方向,而且具備解決電源問題的技能。更簡單可行的方法是在效能實驗室的現有職能中加入能源測量工具。
市場上有一系列的能源測量裝置。可惜目前還沒有專為 IT 效能實驗室提供的理想裝置。退而求其次,您可以選擇 Watts Up Pro。這個 USB 裝置可提供 120V 的線上供電測量。另一項裝置是 Smart-Watt,此網路耗電量裝置包含 100-240 電壓和 15-30 安培系列。Smart-Watt 裝置也提供溫度和濕度感應器來測量環境係數。另外還有工業用電分析裝置,像是 Extech Appliance Tester 380801 和 Fluke 345 Power Clamp。您應該很容易可以找到像這類符合您的實驗室測試需求的裝置。
功率因數
如果您對電量測量不太熟悉,就必須先了解功率因數的概念。交流電系統的功率因數是定義為實功 (Real Power) 對視在功率 (Apparent Power) 之比,並以 0 到 1 之間的數字表示。實功 (瓦數) 是電路執行工作的能量。視在功率 (VA) 是電路上電流和電壓的乘積。
您可能不清楚這個概念的重要性。看一下 [圖 1],照片中是一個 Smart Works 的能源監視系統,用來比較膝上型電腦、燈泡與電容器的能源效率。燈泡有 50 瓦的電量和 50 VA,功率因數為 1.0。純電容負載的電容器有 2 瓦的電量和 193 VA,功率因數為 0.01。膝上型電腦的用電量是 22 瓦,但讀數是 48 VA,因此功率因數為 .47。膝上型電腦的功率因數低是因為缺乏效率的供電設計,而且可能是為了降低製造成本的結果。
[圖 1] 膝上型電腦、燈泡及電容器的耗電量 (按一下以放大影像)
廠商對於能源效率的興致高昂,因此已經開始設法在預期條件下提升電源供應的效能。比較一下現有設備與新設備的功率因數,可能會發現只要選擇電源供應更有效率和功率因數更高的解決方案,也許就能節省一些電量。
在生產環境中測量
效能實驗室中的測量結果目的在於預測生產環境中的效能。但是在生產環境中測量耗電量的問題出在,測量所有裝置所需投入的成本。不過有一個辦法可以減少在生產環境中測量用電的成本,就是根據配電裝置 (Power Distribution Unit,PDU) 進行測量,然後彙總數個設備讀數。[圖 2] 顯示的能源讀數範例是從同個單位上含有多個相同設備的 PDU 測得。每一伺服器的平均耗電量可以透過計算得出,因此這種測量方式能提供生產環境的耗電量數據。
[圖 2] 根據配電裝置進行測量 (按一下以放大影像)
測量過每個設備後,應該將用電資料整合至您的設定管理資料庫中。如果這麼做太困難,您可以建立自己的資料庫,或者至少使用 Excel® 試算表來列出裝置與其用電量。收集到更多裝置的數據之後,您就可以預估其他裝置的用電量,進而建立完整的電容量計算。請記住,新的節能伺服器在閒置時會耗用在尖峰時段時一半以下的電量。如果您有老舊伺服器正在執行過時的解決方案,那麼這些舊伺服器即使在閒置時也會耗用大量的電力。從這些舊伺服器著手是重獲收回電容量最簡單的方法。
若要繼續進行節能的工作,下一步就是計算在資料中心內每一機架的用電。您也必須在改變環境時,確實了解您的電源和冷卻能力。經過一段時間後,您會開始根據電力需求而不只是所佔空間來審視您的設備。空間的概念很簡單 — 這是靜態和視覺上的概念。IT 專業人員可以輕鬆討論 1U、2U 及 4U 伺服器,但是一講到 200 瓦伺服器對 450 瓦伺服器,您會發現同樣的一批人就無法暢所欲言了。這是討論 IT 設備一種全新的語言,在今日的資料中心中顯而易見。許多組織擁有大量空間可容納更多設備,但是卻已經達到電容量上限。
Microsoft 企業工程中心
Microsoft 企業工程中心 (EEC) 最近為中心內的設施增加了電力測量功能。EEC (microsoft.com/windowsserver/evaluation/eec/default.mspx) 座落在華盛頓州雷德蒙的 Microsoft 公司園區中,是專門處理高複雜度運算環境的尖端科技試驗場。
中心裡包含價值四千萬美元以上的硬體及網路設備 (見 [圖 3]),EEC 足以重現最複雜的真實企業生產環境。這個團體與許多頂尖的網路、存放裝置及用戶端/伺服器解決方案提供者合作,創造出尖端技術與舊平台混合的環境。目標是為了確保每次測試都能準確地反映出客戶當前的環境。中心內正在開發的最新服務是報告解決方案的能源耗量,以便提供每瓦效能的基準。
[圖 3] EEC 實驗室中眾多機架的其中一排 (按一下以放大影像)
過去幾年來,EEC 見到許多資料中心操作員耗盡設備的電力和冷卻能力。尖端設備的功率密度往往比較高,對設施造成的壓力也更重。EEC 人員最先了解到升級電力和冷卻基礎結構所需的成本與時間。因此為了提高操作效率和節省成本,EEC 增添了測量每一裝置用電量的功能。
EEC 所用的部分工具及設備在本文編寫時尚未問世。由於這是全新的解決方案,EEC 將繼續開發更完備的技術,並與客戶、廠商及 Microsoft 開發小組共同合作。EEC 與客戶分享 EEC 開發的方法以取得初步回饋,讓客戶能夠建立自己的基準。
別以為測試結果很理所當然。EEC 分享了在 EEC 效能實驗室中使用能源監測功能時,所觀察到的一些有趣結果:
- 關閉裝置所減少的耗電量不見得有您預期的那麼多 (見 [圖 4])。在關於伺服器硬體的一個案例中,EEC 發現裝置在關機但插頭仍插上的情況下,實際上會耗用 100 瓦。這個結果讓人大感意外,EEC 反覆檢查設定很多次。最後,EEC 使用紅外線溫度計來測量插頭與插座的溫度,然後確認裝置的確在關機時耗用 100 瓦的電力。
- 軟體也可能對用電量產生巨大的影響。在完全相同的網路交換機上並使用一模一樣的硬體與 BIOS 組態,執行不同網路軟體會呈現出相差 21 % 的用電量。啟用比較多處理程序與功能的高階解決方案 (例如安全性與監視工具) 往往比低階解決方案耗用更多能源。
- 在虛擬化案例中,EEC 測量了用電量與 I/O 使用率及 CPU 使用率,以確定特定硬體的每瓦效能何時最高。EEC 發現如果只注重 CPU 使用率,將導致實體機器上載入太多虛擬機器,實際上反而降低整體的每瓦效能。
- 如您所料,密度較高的裝置會發生比較多電力和冷卻問題。在部署高密度系統時,應該要盡早諮詢您的電力和冷卻設施人員。如果您知道環境內的電力吃緊,那麼使用這些本身在生產環境中具有電源監視裝置的裝置,可能是不錯的選擇。
- 雙電源供應器比單一電源供應器耗用的電源高出許多。
- 表面上相同且組態設定一樣的硬體出現截然不同的用電量。差異之大,使得 EEC 人員不得不重複檢查硬體以確保兩者的設定真得一模一樣。
- 產品標示上的瓦額定功率並非實際的耗電量,而是電源供應器的額定容量。
- 為了獲得知識和比較資料,維護每個裝置與子元件的能源耗量測試及結果的資料庫很重要。
- 等量 RAM 的組態設定不同,所耗用的能源量也不同。較少的 DIMM 通常耗用的能源較少 — 例如 4 x 2GB DIMM 對 8 x 1GB DIMM。但有時候較少的 DIMM 也可能耗用更多能源。
[圖 4] 開機與關機的用電量比較 (按一下以放大影像)
總結
經由在效能實驗室中增加測量用電量的功能,您可以開始累積關於每一裝置用電量的資料庫,並輸入實際負載的精確數據。當您部署這些解決方案時,應該要以封閉迴路回饋來稽核結果,以確認效能實驗室測試結果的準確性。正如 EEC 在執行本身的測量測試時的意外發現,您可以注意一些很有趣的細節,藉此協助您過濾掉不實環保並發掘真相。
這套在效能實驗室中測量的方法將影響整個市場,讓業界開始辨別什麼才最節能。接著,製造商就必須提供針對他們的節能訴求更準確的參考資料。同樣地,IT 專業人員在評估採購條件時,也會開始討論每一裝置的瓦數。這些作法必須變成例行作業,尤其是那些購買大量伺服器的公司。不過,您現在就可以率先將能源視為寶貴的 IT 資源。
保持資料中心涼爽
資料中心冷卻能力對於降低能源耗量有潛在的強大威力。資料中心產生的熱量,以及為了冷卻硬體所用的能源,往往多到令人吃驚。但如果您想要成功管理冷卻系統、解決問題和開發更有效率的冷卻解決方案,就需要運用溫度監測解決方案。參考一下 Microsoft 資料中心使用的解決方案。
Microsoft Research 為資料中心建置一個溫度感應器網路,可提升溫度控制,也有助於評估各種冷卻增強功能。舉例來說,某個 Microsoft 資料中心評估走道末端風幕機來促進冷熱空氣分離。安裝風幕機之後,某些伺服器開始發出過熱警報。當然,作業工程師增加了冷卻系統的氣流來提供更多冷空氣。但讓人驚訝的是,有更多伺服器發出過熱警報。而且這些伺服器全都位於機架底部 — 當然,在高架地板系統中,機架底部通常是最涼爽的區域。
工程師利用感應器系統確認機架越高處越低溫,而機架底部則最高溫。他們很快發現熱空氣是從機架底部與地板之間的熱走道抽送 — 白努利定律的結果。藉由封閉機架底部並減緩氣流速度,工程師輕而易舉地解決了過熱問題。
這只不過是 Microsoft 企業工程中心在進行效能測試時收集和分析的資料。因此,EEC 最近通知 Microsoft Research 他們已經準備好進行部署測試。一天之內系統中就已經部署了 10 個機架,而且安裝作業只花了一小時就完成了。EEC 現在能夠研究並深入了解冷卻問題以及冷卻與硬體效能之間的關係。
當然,單靠監測本身並非解決方案。真正的收穫是能夠找出您可以修復的問題區域,進行變更,然後評估各種解決方案來確認它們是否能提供您想要的結果。畢竟,您可不希望當新的冷卻解決方案突然造成機架過熱時,卻只能一籌莫展。
Dave Ohara 擁有 26 年的技術經驗,目前與多家公司合作,共同提倡環保方案。
© 2008 Microsoft Corporation and CMP Media, LLC.著作權所有,並保留一切權利。未經許可,不得部分或全部重製。