服務等級協定
- 8 分鐘
在此課程中,到目前為止,我們已討論過雲端運算背後的基本構想,以及已在雲端運算架構下興起的一些服務模型。 假設組織想要將其基礎結構和服務移至雲端提供者,則會浮現數個問題。 例如,組織如何:
- 根據他們向雲端服務提供者要求的服務來定義其需求?
- 識別其所需服務的類型和數量?
- 判斷它預期雲端提供者會提供的服務等級和支援?
- 監視和驗證雲端服務提供者所保證的類型和服務品質?
當組織必須以商務和法律條款正式陳述服務需求時,它會根據「服務等級目標」來定義這些需求,定義如下:
服務等級目標
「(定義)」服務等級目標會定義為關鍵元素,以定義服務提供者所預期的某些服務層面
例如,雲端服務提供者的一般服務等級目標是保證運作時間,其中保證服務會以指定的時間百分比在正常運作參數內可供使用和執行。
通常要在用戶端與服務提供者之間,以較大型合約 (稱為「服務等級協定」或 SLA) 中同意服務等級目標,其定義如下:
服務等級協定
「(定義)」服務等級協定 (SLA) 是服務提供者 (內部或外部) 與用戶端之間的合約,可定義服務提供者所預期的服務等級
服務等級協定存在於許多產業中,其中對於供應商可定期提供給客戶的服務存在著供應商與客戶關係。 自 1980 年代後期以來,固網電信業者會在與公司客戶簽訂合約的過程中,使用目前形式的資訊技術 SLA。
典型的 SLA 通常會由下列元件組成:
- 服務提供者要提供給用戶端的服務定義
- 測量效能的方法
- 管理問題的通訊協定
- 客戶職責清單
- 服務提供者必須遵守的擔保
- 災害復原的相關程序
- 關於合約終止的程序和原則
數十年來一直控管 SLA 的準則,在雲端運算產業中特別適用。 組織必須了解雲端服務提供者所保證的內容,以及他們未保證的內容。
雲端運算中的 SLA
SLA 多年來不斷演進,以適應不同類型的 IT 服務。 共用基礎結構服務 (例如雲端) 的演進必須使用強式服務等級協定。 根據定義,SLA 可以定義任何等級的服務,但結構良好的 SLA 在理想情況下將會1:
- 編寫每個服務元素所需的特定參數和最低等級,以及未能滿足那些需求的補救措施。
- 確認用戶端儲存於服務提供者系統中之資料的擁有權,並指定用戶端取回資料的權利。
- 詳述服務提供者所維護的系統基礎結構和安全性標準,以及用戶端用來稽核其合規性的權利。
- 指定用戶端的權利和成本,以繼續和停止使用雲端服務提供者的服務。
針對雲端使用者,SLA 的最重要元素通常是保證的運作時間,這會因服務和提供者而異。 運作時間通常以「9」來測量,例如,三個 9 表示 99.9%,四個 9 表示 99.99%,依此類推。 如果不符合 SLA,提供者通常會提供服務點數。 例如,如果 Elastic Beanstalk 執行個體的每月運作時間低於 99.99%,Amazon 就會提供 10% 服務點數給客戶,如果低於 99%,則會提供 30% 點數。 99% 之類的數字聽起來很高,但這表示服務每年可能約有 3.5 天無法使用。 對 Amazon 或 Expedia 等公司來說,這段時間很長,因為這些公司會透過網路來建立與其客戶的主要介面 (以及產生收益的方式)。
運作時間保證也會因設定和服務層級而有所不同。 例如,Microsoft 保證您至少有 99.99% 的時間可以連線到 Azure 虛擬機器,但前提是必須在相同 Azure 區域中的兩個或多個可用性區域上部署兩個或多個虛擬機器執行個體。 此外,某些雲端服務可讓您從數個服務層級中選取,層級越高,所提供的保證運作時間越長。 一般來說,保證的運作時間越長,成本就越高。
雲端運算中的稽核
雖然雲端運算提供了許多優點,但主要挑戰之一是確保並驗證雲端服務的可靠性。 如果客戶簽署了服務合約以保證特定等級的可用性,該客戶如何得知提供者是否遵循合約的條款? 就這一點而言,雲端提供者如何得知?
包括 Amazon、Microsoft 和 Google 在內的主要雲端提供者會基於可用性和其他因素 (包括資料安全性和機密性),僱用第三方稽核員來監視其平台。 稽核員會產生「SOC 報告」,此報告符合美國註冊會計師協會 (AICPA) 的服務組織控制 (SOC) 標準。 SOC 報告可分成三個類別:
- SOC 1 報告,涵蓋財務報告
- SOC 2 報告,涵蓋安全性、可用性和隱私權
- SOC 3 報告,也會涵蓋安全性、可用性和隱私權
SOC 1 和 SOC 2 報告通常是私人的,並且僅提供給已與雲端提供者簽署保密合約 (NDA) 的客戶使用。 SOC 3 報告可供大眾使用。
主要雲端提供者也會為其用戶端提供監視服務。 這些服務可以與 IaaS、PaaS 和 SaaS 服務一起部署,例如,若網站關閉或 VM 無法使用,就會以近乎即時的方式警示用戶端。 雖然符合 SLA 條款的責任主要是由雲端提供者承擔,但客戶也可以架構其所部署的解決方案來將可用性最大化,例如,採用雲端提供者所提供的容錯移轉機制,以確定會將流向已變成無法使用之資料庫或 VM 的流量重新導向至該資料庫或 VM 在另一個區域中的複本。
基於雲端服務的本質,需要進行稽核和監視。 這需要即時監視和評估,才能觸發快速回應,以保護用戶端的服務和信譽。 在公用雲端中,必須達成此點,才能防止將用戶端資料公開給其他雲端用戶端。 近乎即時的稽核正在快速演進,並成為對可靠雲端運算服務的需求,其將需要稽核線索,以及監視其他服務之間的服務、效能和安全性計量。
參考資料
- Thomas Trappler。 如果 SLA 位於雲端,請匯至文件:雲端運算合約問題。 https://www.educause.edu/ero/article/if-its-cloud-get-it-paper-cloud-computing-contract-issues