서비스 수준 계약
- 8분
지금까지 이 과정에서는 클라우드 컴퓨팅 및 클라우드 컴퓨팅 패러다임에서 발생하는 몇몇 서비스 모델의 기본 아이디어에 대해 알아보았습니다. 조직에서 인프라 및 서비스를 클라우드 공급자로 이전하기를 원한다고 가정할 경우 몇 가지 질문이 발생합니다. 예를 들어, 조직이
- 어떻게 클라우드 서비스 공급자에게 필요한 서비스의 요구 사항을 정의하나요?
- 어떻게 필요한 서비스 유형 및 수량을 파악하나요?
- 어떻게 클라우드 공급자에게 기대하는 서비스 및 지원 수준을 결정하나요?
- 어떻게 클라우드 서비스 공급자가 보장하는 서비스의 유형 및 품질을 모니터링하고 검증하나요?
조직에서 서비스 요구 사항을 비즈니스 및 법적 용어로 공식적으로 명시해야 하는 경우 다음과 같이 정의된 서비스 수준 목표 측면에서 이러한 요구 사항을 정의합니다.
서비스 수준 목표
(정의) 서비스 수준 목표는 서비스 공급자에게 필요한 서비스의 일부 측면을 정의하는 핵심 요소로 정의됩니다.
예를 들어 클라우드 서비스 공급자에 일반적인 서비스 수준 목표는 가동 시간 보장, 즉 서비스를 정상 작동 매개 변수 범위에서 지정된 시간 백분율 동안 사용 가능 및 실행하도록 보장하는 것입니다.
서비스 수준 목표는 일반적으로 다음과 같이 정의된 서비스 수준 계약 또는 SLA라고 하는 더 큰 계약의 클라이언트와 서비스 공급자 간에 합의됩니다.
서비스 수준 계약
(정의) SLA(서비스 수준 계약)는 서비스 공급자(내부 또는 외부)와 서비스 공급자가 예상하는 서비스 수준을 정의하는 클라이언트 간의 계약입니다.
서비스 수준 계약은 공급자가 고객에게 정기적으로 제공하는 서비스에 대한 공급자-고객 관계가 존재하는 많은 산업에서 체결됩니다. 최신 형태의 정보 기술 SLA는 유선 전화 사업자가 1980년대 말부터 기업 고객과의 계약의 일부로서 사용했습니다.
일반적인 SLA는 다음과 같은 구성 요소를 포함할 수 있습니다.
- 서비스 공급자가 클라이언트에 제공하는 서비스의 정의
- 성능을 측정하는 방법
- 문제를 관리하는 프로토콜
- 고객 의무 목록
- 서비스 공급자가 준수해야 하는 보증
- 재해 복구와 관련된 절차
- 계약 해제와 관련된 프로세스 및 정책
수십 년 동안 SLA를 규제한 원칙은 클라우드 컴퓨팅 산업과 특히 관련이 있습니다. 조직에서 클라우드 서비스 공급자가 보장하는 내용과 보장하지 않는 내용을 이해하는 것이 중요 합니다.
클라우드 컴퓨팅에서의 SLA
SLA는 다년간 다양한 유형의 IT 서비스에 적용되면서 발전해 왔습니다. 클라우드와 같은 공유 인프라 서비스의 진화는 강력한 서비스 수준 계약의 사용을 필요로 했습니다. 정의상 SLA는 모든 서비스 수준을 정의할 수 있지만 잘 구성된 SLA는 이상적으로 다음을 정의합니다1.
- 서비스의 각 요소에 필요한 특정 매개 변수 및 최소 수준, 그리고 해당 요구 사항을 충족하지 못할 경우에 대한 해결 방법을 명문화합니다.
- 서비스 공급자의 시스템에 저장된 데이터에 대한 클라이언트의 소유권을 확인하고 클라이언트가 해당 데이터를 회수할 수 있는 권한을 지정합니다.
- 서비스 공급자에 의해 유지 관리되는 시스템 인프라 및 보안 표준 그리고 클라이언트가 준수 여부를 감사할 권리를 상술합니다.
- 클라이언트가 클라우드 서비스 공급자의 서비스를 계속 사용 및 중단할 권리 및 비용을 지정합니다.
클라우드 사용자의 경우, SLA에서 가장 중요한 요소는 일반적으로 서비스 및 공급자에 따라 달라지는 보장된 가동 시간입니다. 일반적으로 가동 시간은 "9"의 개수로 측정됩니다. 예를 들어 9가 3개면 99.9%, 9가 4개면 99.99% 등을 의미합니다. SLA가 충족되지 않을 경우 공급자는 흔히 서비스 크레딧을 제공합니다. 예를 들어, Amazon은 Elastic Beanstalk 인스턴스에 대한 월별 가동 시간이 99.99% 미만이면 10% 서비스 크레딧을 제공하고, 99% 미만이면 30% 크레딧을 제공합니다. 99%는 매우 높은 것처럼 들리지만, 실제로는 연간 약 3.5일 동안 서비스를 사용할 수 없을 수 있다는 것을 의미합니다. 이는 고객에 대한 기본 인터페이스(및 수익 생성 방법)가 웹을 통해 이루어지는 Amazon 또는 Expedia 같은 회사에게는 긴 시간입니다.
구성 및 서비스 계층에 따라 가동 시간이 달라질 수도 있습니다. 예를 들어, Microsoft는 최소 99.99%의 시간 동안 Azure 가상 머신에 연결하는 것을 보장하지만, 둘 이상의 가상 머신 인스턴스가 동일한 Azure 지역에서는 둘 이상의 가용성 영역에 배포된 경우에만 해당합니다. 또한 일부 클라우드 서비스는 여러 서비스 계층에서 선택할 수 있으며, 상위 계층일수록 더 높은 가동 시간을 보장합니다. 일반적으로 보장된 가동 시간이 높을수록 비용이 상승합니다.
클라우드 컴퓨팅에서 감사
클라우드 컴퓨팅은 다양한 이점을 제공하지만, 주요 과제 중 하나는 클라우드 서비스의 안정성을 보장하고 확인하는 것입니다. 특정 수준의 가용성을 보장하는 서비스 계약에 서명하는 경우 고객은 공급자가 계약 조건을 얼마나 이행하는지 어떻게 알 수 있나요? 또한 클라우드 공급자는 어떻게 알 수 있나요?
Amazon, Microsoft, Google 등 주요 클라우드 공급자는 외부 감사자를 선임하여 자사 플랫폼에서 가용성과 데이터 보안 및 기밀성 같은 기타 요인을 모니터링합니다. 감사는 미국 공인 회계사 연구소(AICPA) SOC (서비스 조직 제어) 표준을 준수하는 SOC 보고서를 생성합니다. SOC 보고서는 다음 세 가지 범주로 나뉩니다.
- 재무 보고를 다루는 SOC 1 보고서
- 보안, 가용성 및 개인 정보 보호를 다루는 SOC 2 보고서
- 역시 보안, 가용성 및 개인 정보 보호를 다루는 SOC 3 보고서
SOC 1 및 SOC 2 보고서는 일반적으로 비공개이며, 클라우드 공급자와 NDA(비밀 유지 계약)에 서명한 고객만 사용할 수 있습니다. SOC 3 보고서는 일반에 공개할 수 있습니다.
또한 주요 클라우드 공급자는 클라이언트에 모니터링 서비스를 제공합니다. 이러한 서비스는 IaaS, PaaS 및 SaaS 서비스와 함께 배포하여 웹 사이트 작동이 중단되거나 VM을 사용할 수 없게 되는 경우 등에 거의 실시간으로 클라이언트에 경고할 수 있습니다. SLA 조건을 충족하는 책임은 대부분 클라우드 공급자에게 있지만, 고객도 가용성을 최대화하기 위해 배포하는 솔루션을 설계할 수 있습니다. 예를 들어 클라우드 공급자가 제공하는 장애 조치(failover) 메커니즘을 사용하여 가동 중지된 데이터베이스 또는 VM에 대한 트래픽을 다른 지역의 VM 또는 해당 데이터베이스의 복사본으로 리디렉션할 수 있습니다.
클라우드 서비스의 특성을 고려할 때 감사 및 모니터링은 필수적입니다. 이를 위해 신속한 응답을 트리거하여 클라이언트의 서비스 및 평판을 보호하기 위한 실시간 모니터링 및 평가가 필요합니다. 퍼블릭 클라우드에서는 클라이언트 데이터를 다른 클라우드 클라이언트에 노출하는 것을 방지하면서 이를 달성해야 합니다. 근 실시간 감사는 빠르게 진화하고 있으며 신뢰할 수 있는 클라우드 컴퓨팅 서비스에 대한 요구 사항이 되고 있기 때문에, 이를 위해 서비스, 성능 및 보안 메트릭에 대한 감사 내역 및 모니터링이 필요합니다.
참고 자료
- 토마스 트래플러. 클라우드에 있는 경우 종이에 가져오기: 클라우드 컴퓨팅 계약 문제. https://www.educause.edu/ero/article/if-its-cloud-get-it-paper-cloud-computing-contract-issues