연속 운영 살펴보기

완료됨

연속 운영은 DevOps 분류의 8가지 기능 중 하나입니다.

연속 운영이 필요한 이유 알아보기

복잡한 시스템에는 장애가 발생하기 마련이고 큰 비용이 소요되는 중단을 초래할 수 있습니다. 몇 가지 예를 살펴보겠습니다.

회사 이벤트
Icon for issue affecting Delta Airlines
Delta Air Lines
2016년 8월, Delta는 애틀란타에 있는 운영 센터에서 장비 한 개의 오작동으로 인해 전원 공급 중단이 발생했을 때 2,300편의 항공편을 취소해야 했습니다. 회사에 보고된 비용은 1억 5,000만 달러였습니다.
Icon for issue affecting FedEx
FedEx 및 영국 국민건강보험
2017년 5월, WannaCry 랜섬웨어로 인해 FedEx에 운영 중단이 발생했습니다. 이로 인해 FedEx 1개 자회사가 3억 달러의 손실을 입은 것으로 보고되었습니다. 영국의 국립보건원은 랜섬웨어의 또 다른 희생자로서 컴퓨터에 대한 액세스를 차단하고 핵심 의료 장비를 폐쇄하고 일부 병원으로 하여금 앰뷸런스를 다른 위치에 배치하도록 강제적 조치를 시행했습니다.
Icon for issue affecting Amazon S3
Amazon S3
2017년 2월, 연산자 오류로 인해 Amazon의 핵심 스토리지 서비스가 4시간 동안 중단되었고, 이는 Alexa, IFTTT, Quora 및 Trello와 같은 중요한 웹 자산에 여러 영향을 미쳤습니다.
Icon for issue affecting LinkedIn
LinkedIn
LinkedIn은 개발 작업을 2개월 동안 중단시킨 문제를 겪었습니다.
Icon for issue affecting Equifax
Equifax
Equifax는 2017년, 1억 6,000만 명 이상의 소비자의 개인 정보가 노출되는 결과를 낳은 보안 위반을 경험했습니다. 연속 보안에 대해 자세히 살펴보았습니다.

보안 위반이 비즈니스에 미치는 영향 및 비용

보안 위반으로 인해 발생하는 비용은 판매량과 기업에 대한 신뢰의 손실을 뛰어 넘는 경우가 많습니다. 이러한 비용에는 다음이 포함될 수 있습니다.

  • 응답 및 알림
    • 법률에서 요구하는 대로 영향을 받은 당사자에게 알리는 데 소요되는 운영 비용 빛 서비스 비용이 있습니다. 이러한 비용에는 콜 센터, PR 지원 및 신용 모니터링서비스를 위한 추가 비용도 포함되는 경우가 많습니다.
  • 직원 생산성 및 매출액 손실
    • Yahoo의 법무 자문위원은 사임했으며 CEO에게는 2016년분 연간 보너스가 지급되지 않았습니다.
  • 소송 및 분쟁 해결
    • 해킹 대상은 미국의 47개 주에 1,850만 달러를 지급했습니다.
  • 규제상 벌금 및 대응
    • 2018년 유럽 연합에서 새로운 데이터 보호 정책을 시행한 이래 보안 위반으로 인한 벌금은 연간 수익의 4% 또는 2,000만 유로 중 더 큰 금액입니다.
  • 브랜드 복구 비용
    • 채광 기술 회사인 Codan에서는 수익이 1년 만에 4,500만 달러에서 920만 달러로 급감했습니다.
  • 기타 부채
    • 두 번의 대규모 해킹 후 Verizon가 Yahoo에 지불하는 인수 금액은 3억 5천만 달러가 삭감되었습니다.

추가 보안 및 감사 요구 사항도 필요할 수 있습니다.

연속 운영이 가용성 및 복구에 미치는 영향

Gartner 설문 조사에 따르면 비즈니스 및 IT 리더는 2020년경에는 프로덕션 애플리케이션 중 47%가 퍼블릭 클라우드 위치에서 실행될 것으로 예상합니다.

전체 데이터 센터가 코드 한 줄로 인해 파괴될 수 있다면 인프라 및 운영 리더가 프로덕션 환경의 가용성 및 복구와 관련하여 초점을 두어야 할 부분이 달라져야 합니다. 새로운 배포 패턴은 당사에서 애플리케이션과 인프라의 가용성과 복구 능력을 보장하기 위한 방법을 바꾸고 있습니다.

Diagram shows the Continuous Operations supporting availability, resiliency, recovery, and reliability. We detect issues, triage them, act upon them, and learn from our actions. The cycle is supported by people and technology.

프로덕션 환경에서 증가하는 앱과 릴리스

소프트웨어 제공 성능의 핵심 성과 지표는 다음과 같습니다.

  • 변경의 리드 타임
  • 배포 빈도
  • 평균 복원 시간
  • 변경 실패율

속도를 높이기 위해 노력하지만 프로세스에 품질을 구축하기 위해 충분한 투자를 하지 않는 팀은 더 큰 실패를 경험하고 서비스를 복원하는 데 더 많은 시간을 쓰게 될 것입니다. 프로세스에 품질을 구축하는 팀은 속도와 안정성을 모두 성취합니다.

웹 및 모바일 애플리케이션의 수와 애플리케이션 릴리스의 빈도가 크게 증가했습니다. 코드도 점점 더 복잡해지고 있습니다.

Diagram shows the number of applications and the release frequency increased from 2010 to 2020.

참고 항목

일반적으로 DevOps를 가치 있게 하는 중요한 요인 중 하나는 혁신(속도)과 비즈니스 연속성(제어) 사이의 적절한 균형을 찾아준다는 것입니다.

연속 운영이란?

중요

연속 운영은 예약된 유지 관리와 같은 계획된 가동 중지 시간 또는 중단의 필요성을 줄이거나 제거합니다. 가능한 경우 인프라, 애플리케이션 및 서비스에 대한 모니터링은 자동화된 수정과 연계됩니다. 사용자는 업데이트 또는 증분 릴리스가 언제 발생하는지 전혀 모르게 됩니다.

Diagram shows how AIOps and Digital Experience Monitoring, Application Release Orchestration, and uptime-based monitoring support Customer Experience Insights, Rapid Application Deployment, Dynamic Scalability and Cloud-first strategies.

기존 운영 방식과 연속 운영 방식 비교

기존 엔터프라이즈 모델에서는 IT 부서에서 엄격한 프로세스와 절차를 통해 릴리스된 기능을 적용하고 모든 사항을 제어합니다.

이 접근 방식은 개발 팀과 IT 거버넌스 간의 불일치를 초래합니다. 개발 팀은 대부분 민첩하고 속도에 중점을 두며 릴리스가 빈번하게 배포되기를 기대합니다. 이들에게 IT 거버넌스는 오늘날 비즈니스에 요구되는 기대 출시 시간 목표에 부합하지 않는 장애물로 비춰집니다.

Diagram shows the misalignment between Dev teams and IT Governance. Development teams focus on speed through self-service, production access and rapid releases. Governance focuses on control through policies, security, and cost management.

Important

올바르게 구현된 DevOps는 혁신(속도)과 비즈니스 연속성(제어)을 모두 실현할 수 있습니다.

기존 개발 수명 주기의 특징은 다음과 같습니다.

  • 실제 운영으로 넘어가기 직전에 테스트가 수행됩니다.
  • 모니터링이 이양되는 경우가 많습니다.
  • 보안이 테스트 단계에서 논의되는 경우가 많습니다.
  • 이양 기간 동안 코드 및 모든 서비스 관리 제어에 대한 보안 검사가 수행되어야 합니다.
  • 규정 준수는 이양 업무에 포함되지 않는 경우가 많지만 서비스가 운영 상태에 있는 동안 갑자기 튀어 나오는 문제입니다.
  • 복원력/연속성 계획은 디자인 단계의 일부로 수행되긴 하지만 관련 시나리오에 대한 실제 테스트는 운영 또는 테스트 단계에서만 수행되는 경우가 많고 이로 인해 구성 변경, 재작업 및 노력이 낭비되는 결과로 이어질 수 있습니다.
  • 운영 담당자, 보안 및 규정 준수 담당자, 개발자 간의 협업은 인시던트 관리 및 문제 관리 프로세스를 통해 사후 대응적 방식으로 이루어지는 경우가 많습니다.
  • 최종 단계에 이를 때까지 자동화를 미뤄두면 자동화를 위한 리소스가 거의 남지 않게 되는 경우가 많습니다.

Diagram shows the traditional development lifecycle.

새로운 방법, 기술 및 작업 방식은 연속 운영에 대한 새로운 접근 방법을 요구합니다. 다음 8개의 주요 연속 운영 사례가 등장하여 계속 진화하고 있습니다.

  • 설계를 기준으로 한 보안 및 규정 준수는 고도로 자동화된 클라우드 환경에 맞는 설계를 수행할 때 특정 표준, 법규뿐 아니라 추적 가능성 및 감사 가능성과 같은 비즈니스 요구 사항을 설계 시점에서 고려해야 함을 인정합니다.
  • 연속성 및 복원력은 비즈니스 요구 사항이 설계 및 구현에 반영될 수 있도록 조직과의 긴밀한 협업을 필요로 합니다.
  • 원격 분석 및 모니터링은 고객 사용 패턴, 새로운 잠재적 요구 사항 및 사용자에게 오류가 발생하는 지점에 대한 자세한 정보를 파악하는 데 사용할 수 있습니다. 이러한 도구는 가치가 실현되도록 하는 데 도움이 될 수도 있습니다.
  • 서비스 관리는 DevOps 문화권에서 다른 의미를 갖습니다.
    • 혁신은 내가 서비스를 소유한다는 것을 의미합니다. 내가 서비스를 구축하고, 실행하며, 문제가 생길 때 내가 문제를 해결합니다.
    • 필요한 사항에 초점을 둡니다.
    • 거버넌스를 강화합니다.
    • 투명성을 촉진합니다.
  • 문화권협업 은 연속 작업에 필수적입니다. DevOps 팀으로의 전환을 촉진하기 위해서는 조직의 업무 방식을 변경해야 하는 경우가 많습니다. 또한 협업은 보안 및 복원력을 위한 설계 시 필수적인 요소입니다.
  • 자동화 및 AI/ML Ops는 DevOps(및 클라우드)를 기존 운영 팀과 차별화하는 중요한 측면입니다. 한 영역뿐 아니라 자동화 중인 전체 시스템(시스템 자동화)에 초점을 두어야 합니다.
  • 지속적인 배포는 최신 릴리스 파이프라인을 사용하여 개발 팀이 새로운 기능을 빠르고 안전하게 배포하여 고객 가치를 지속적으로 전달하고 문제 해결 시간을 단축할 수 있게 해줍니다.
  • 시프트 라이트 테스팅은 다크 론칭, 기능 플래그, 모니터링 및 A/B 테스팅과 같은 방식을 사용합니다. 그러면 팀에서 테스트를 계속 수행하여 애플리케이션이 가동 중에 동작, 성능 및 가용성의 기대치를 충족하는지 확인할 수 있습니다.

Diagram shows how to do Continuous Operations. You need to apply a paradigm shift and use DevOps Continuous Operations principles.

DevOps 접근 방법을 실현하기 위해서는 최신 IT 접근 방법으로 비즈니스 가치를 실현할 수 있는 패러다임의 변화가 문화권 내에서 발생해야 합니다.

기존 IT 최신 IT
DNA 중개 중개의 제거
서비스 제공 웨이브 기반 연속 반복 기반
서비스 안정성 성공을 위한 설계(HA/중복) 실패에 대비한 설계(복원)
위탁 수준 IT 사일로 엔드투엔드 서비스
프로세스 문서, 최적화됨, 재설계됨 셀프 서비스, 지식, 충돌이 적음, 자동화됨
Automation 격리됨, 수동으로 시작됨 시스템, 트리거됨, 자동
Monitoring 요소, 결함 중심 서비스, 엔드투엔드 기능 중심
지원 서비스 데스크/문의 센터 고객 관리/셀프 서비스
수명 주기 N-1 이전 N, N+1
구성/자산 관리 검색됨/수동 구성 규정됨, 선언적, 자동화됨

이러한 변화는 프로세스가 간소화 및 자동화되고, 결과 인센티브가 합리적으로 조정되며, 고객 중심의 접근 방식이 도출되는 결과를 가져옵니다.