成本優化取捨
當您設計工作負載以在財務限制下將投資報酬率最大化時,您必須先明確定義功能和非功能需求。 工作和工作優先順序策略至關重要。 基金會是一支具有強烈財務責任感的團隊。 小組應該對可用技術和計費模型有很強的瞭解。
瞭解工作負載的 ROI 之後,您就可以開始加以改善。 若要改善 ROI,請考慮根據成本優化設計原則和成本優化設計檢閱檢查清單中的建議,如何影響其他 Azure 架構架構要素的目標和優化。 對於成本優化,請務必避免專注於更便宜的解決方案。 只專注於將支出降至最低的選項可能會增加破壞工作負載業務目標和信譽的風險。 本文說明在考慮成本優化的目標設定、設計和作業時,工作負載小組可能會遇到的範例取捨。
成本優化與可靠性取捨
服務中斷的成本必須根據防止或復原的成本來衡量。 如果中斷成本超過可靠性設計的成本,您應該投入更多時間來防止或減輕中斷。 相反地,可靠性工作的成本可能大於中斷的成本,包括合規性需求和信譽等因素。 您應該只在此案例中考慮在可靠性設計中策略性撤資。
取捨:降低復原能力。 工作負載包含復原措施,以嘗試避免並承受特定類型和故障數量。
為了節省成本,工作負載小組可能會過度布建元件或過度限制其調整,使得元件更有可能在突然需求尖峰期間失敗。
合併工作負載資源(增加密度)以進行成本優化,可讓個別元件在需求尖峰和更新等維護作業期間更可能失敗。
拿掉支援復原設計模式的元件,例如訊息總線,以及建立直接相依性可減少自我保留功能。
藉由減少備援來節省成本,可以限制工作負載處理並行故障的能力。
使用預算 SKU 可能會限制工作負載可以達到的最大服務等級目標 (SLO)。
設定硬性消費限制可防止工作負載調整以符合合法需求。
如果沒有可靠性測試工具或測試,工作負載的可靠性是未知的,而且不太可能達到可靠性目標。
取捨:有限的復原策略。 可靠的工作負載具有災害案例的已測試事件回應和復原計劃。
減少工作負載災害復原計劃的測試或鑽研可能會影響復原作業的速度和有效性。
建立或保留較少的備份會減少可能的恢復點,並增加遺失數據的機會。
選擇與技術合作夥伴較不昂貴的支援合約可能會增加工作負載復原時間,因為可能延遲技術支援。
取捨:複雜度增加。 使用簡單方法並避免不必要的或過度工程複雜性的工作負載,在可靠性方面通常更容易管理。
使用成本優化雲端模式可以新增元件,例如內容傳遞網路(CDN),或將職責轉移到工作負載必須為其提供可靠性目標的邊緣和用戶端裝置。
事件型調整可能會比以資源為基礎的調整更為複雜,以微調和驗證。
透過數據生命週期動作減少數據量和階層處理數據,可能會與在生命週期事件之前實作匯總的數據點一起,導入工作負載中需要考慮的可靠性因素。
使用不同的區域來優化成本,可能會使管理、網路和監視更加困難。
成本優化取捨與安全性
對工作負載中機密性、完整性和可用性的危害成本,必須一律與防止該入侵的努力成本進行平衡。 安全性事件可能會對公司造成廣泛的財務和法律影響,並損害公司的聲譽。 投資安全性是風險降低活動。 經歷風險的成本必須與投資平衡。 根據規則,請勿危害安全性,以取得低於責任點且已同意風險降低的成本優化。 藉由將解決方案權利化來優化安全性成本是一項重要的優化做法,但在這麼做時,請注意如下的取捨。
取捨:降低安全性控制。 安全性控制是跨多層建立的,有時是重複的,以提供深度防禦。
一種成本優化策略是尋找移除累積單位或營運成本的元件或程式的方法。 為了節省成本而移除安全性元件,例如下列範例, 會影響安全性。 您必須仔細執行此影響的風險分析。
減少或簡化驗證和授權技術會 危害零信任架構的 明確原則。 這些簡化的範例包括使用基本的驗證配置,例如預先共用密鑰,而不是投資時間來學習產業 OAuth 方法,或使用簡化的角色型訪問控制指派來減少管理額外負荷。
拿掉傳輸中的加密或待用加密,以降低成本,以及其作業程式會將數據公開給潛在的完整性或機密性缺口。
由於相關的成本和時間投資,移除或減少安全性掃描或檢查工具或安全性測試,可能會直接影響工具和測試所要保護的機密性、完整性或可用性。
降低安全性修補的頻率,因為投入在編錄和執行修補方面的作業時間會影響工作負載解決不斷演變的威脅能力。
拿掉防火牆之類的網路控制可能會導致無法封鎖惡意的輸入和輸出流量。
取捨:工作負載介面區增加。 安全性支柱會優先處理縮減且包含的介面區,以將攻擊媒介與安全性控件的管理降到最低。
將成本優化的雲端設計模式有時需要引進其他元件。 這些額外的元件會增加工作負載的介面區。 這些元件和數據必須受到保護,可能是系統尚未使用的方式。 這些元件和數據通常受限於合規性。 可引進元件的模式範例包括:
使用靜態內容裝載模式將數據卸除至新的 CDN 元件。
使用代客金鑰模式來卸除處理和保護用戶端計算的資源存取。
透過引進訊息總線,使用佇列型負載撫平模式來平順成本。
取捨:已移除分割。 安全性支柱會優先進行強式分割,以支持目標安全性控件的應用,以及控制爆破半徑。
共用資源,例如在多租用戶的情況下,或在共用應用程式平臺上共置多個應用程式,是一種透過增加密度和減少管理介面來降低成本的方法。 這種增加的密度可能會導致安全性考慮,如下所示:
共用資源的元件之間的橫向移動比較容易。 危害應用程式平臺主機或個別應用程式可用性的安全性事件也有較大的爆破半徑。
共置的資源可能會共用工作負載身分識別,而且存取記錄中沒有有意義的稽核線索。
網路安全性控制必須足夠廣泛,才能涵蓋所有共置的資源。 此設定可能會違反某些資源最低許可權原則。
在共用主機上共置不同的應用程式或數據,可能會導致將合規性需求和安全性控制延伸至其他範圍以外的應用程式或數據。 這擴大範圍需要對共置元件進行額外的安全性審查和稽核工作。
使用卓越營運的成本優化取捨
取捨:遭入侵的軟體開發生命週期 (SDLC) 容量。 工作負載的 SDLC 程式提供更嚴謹、一致性、特定性和優先順序,以變更工作負載中的管理。
減少測試工作以節省時間和與測試人員、資源和工具相關聯的成本,可能會導致生產環境產生更多錯誤。
延遲償還技術債務,將人員精力集中在新功能上,可能會導致開發周期變慢,整體靈活度降低。
將文件優先化,將人員工作放在產品開發上,可能會導致新員工上線時間更長、影響事件回應的有效性,以及危害合規性需求。
缺乏對訓練的投資會導致技能停滯不前,從而降低團隊採用較新技術和做法的能力。
移除自動化工具以節省成本,可能會導致人員花費更多時間處理不再自動化的工作。 這也會增加錯誤和不一致的風險。
減少規劃工作,例如範圍界定和活動優先順序,可增加因模糊規格和實施不力而進行重新作業的可能性。
避免或減少持續改善活動,例如回顧和事件後報告,讓工作負載小組專注於傳遞,可能會產生錯失的機會,將例行、非計劃性和緊急程序優化。
取捨:減少可觀察性。 需要可觀察性,才能協助確保工作負載具有有意義的警示和成功的事件回應。
減少記錄和計量磁碟區以節省記憶體和傳輸成本可減少系統可觀察性,並可能導致:
- 建立與可靠性、安全性和效能相關的警示的數據點較少。
- 事件回應活動的涵蓋範圍差距。
- 與安全性或合規性相關的互動或界限的可觀察性有限。
成本優化設計模式可以將元件新增至工作負載,增加其複雜性。 工作負載監視策略必須包含這些新元件。 例如,某些模式可能會引入跨越多個元件或將進程從伺服器轉移到用戶端的流程。 這些變更會增加相互關聯和追蹤資訊的複雜性。
減少對可檢視性工具的投資,以及維護有效儀錶板的能力,可以減少從生產環境學習、驗證設計選擇,以及通知產品開發的能力。 這種減少也可能妨礙事件響應活動,並使得更難達到復原時間目標和 SLO。
取捨:延遲維護。 工作負載小組預期會以及時有序的方式,讓程式代碼、工具、軟體套件和操作系統受到修補和更新。
讓與工具廠商的維護合約過期,可能會導致優化功能、錯誤解決和安全性更新遺失。
增加系統修補程式以節省時間之間的時間可能會導致遺漏的錯誤修正或缺乏保護,以防止不斷演變的安全性威脅。
成本優化取捨與效能效率
成本優化和效能效率要素會優先最大化工作負載的價值。 效能效率強調滿足效能目標,而不需要花費更多費用。 成本優化強調將工作負載資源所產生的價值最大化,而不會超過效能目標。 因此,成本優化通常會提升效能效率。 不過,有與成本優化相關聯的效能效率取捨。 這些取捨可能會使得達到效能目標並阻礙持續效能優化更加困難。
取捨:未布建或超大規模資源。 高效效能的工作負載有足夠的資源來提供需求,但即使使用模式波動,也不會有過度未使用的額外負荷。
藉由縮減資源來降低成本,可能會剝奪資源的應用程式。 應用程式可能無法處理顯著的使用模式波動。
限制或延遲調整為上限或降低成本可能會導致供應不足,無法滿足需求。
大幅減少以降低成本的自動調整設定,可能會讓服務因需求突然暴增而未準備,或造成頻繁的調整波動(折疊)。
取捨:一段時間后缺乏優化。 評估功能變更、使用模式變更、新技術和工作負載上不同方法的影響,是嘗試提高效率的一種方式。
限制專注於開發效能優化的專業知識,以排定傳遞優先順序,可能會導致無法提升資源使用效率的機會。
拿掉存取效能測試或監視工具會增加未偵測到效能問題的風險。 它也會限制工作負載小組在測量/改善週期上執行的能力。
忽略容易降低效能的區域,例如數據存放區,可能會逐漸惡化查詢效能,並提升整體系統使用量。
相關連結
探索其他要素的取捨: