루틴 및 비루틴 작업을 공식화하기 위한 권장 사항

이 Azure Well-Architected Framework 운영 우수성 검사 목록 권장 사항에 적용됩니다.

OE:02 설명서, 검사 목록 또는 자동화를 사용하여 필요에 따라 루틴 및 긴급 운영 작업을 실행하는 방법을 공식화합니다. 왼쪽 이동 방식과 같은 업계 최고의 관행과 접근 방식을 채택하여 팀 프로세스 및 결과물의 일관성과 예측 가능성을 위해 노력합니다.

이 가이드에서는 루틴 및 비루틴 작업을 공식화하기 위한 권장 사항을 설명합니다. 효율적이고 성공적인 워크로드 팀은 일관되고 예측 가능한 워크로드 관리 사례를 가지고 있습니다. 업계에서 입증된 도구와 사례를 채택하고 실용적일 때 프로세스를 자동화하여 효율성과 일관성을 최적화합니다. 일상적인, 즉석 및 응급 작업을 처리하는 방법에 대해 일관성을 유지하면 문제가 발생할 때 준비되지 않은 위험을 최소화할 수 있습니다. 워크로드 관리에 대한 지속적인 개선 접근 방식을 사용하면 워크로드 수명 주기 내내 팀의 일관성과 효율성을 높일 수 있습니다.

주요 디자인 전략

일관된 프로세스를 통해 작업 품질을 예측 가능하고 예측 가능한 작업 품질로 인해 워크로드 지원이 더 원활해집니다. 프로세스의 일관성을 달성하려면 표준 패턴으로 프로세스를 실행하는 방법에 대해 의도적이고 명시적이어야 합니다. 자동화 및 왼쪽 이동 접근 방식과 같은 전략을 사용하여 예측 불가능의 잠재적 영역을 최소화합니다.

프로세스 표준화는 여러 셰이프를 사용합니다. 표준화에 접근할 수 있는 모든 방법을 설명하는 것은 이 가이드의 scope 없지만 몇 가지 일반적인 권장 사항은 다음과 같습니다.

  • 표준화하는 프로세스는 안정성, 보안, 비용 최적화, 성능 및 운영 프로세스와 같은 워크로드 관리의 모든 측면을 포함해야 합니다. 워크로드 팀은 organization 전체 거버넌스에서 워크로드를 유지 관리하고 지속적으로 개선하는 데 필요한 만큼 프로세스의 소유권을 가져야 합니다.

  • 사용자가 생성하는 설명서는 표준 운영 절차를 캡처하고 작업을 수행하는 방법을 지시하지만 설명서는 최종적인 것이 아니라는 것을 설명합니다. 워크로드와 팀이 발전함에 따라 절차가 진화해야 합니다. 정기적으로 표준을 검토하고 이의를 제기하여 현재 팀에 적합한 표준인지 확인합니다. 설명서 형식의 일관성을 보장하고 검토 및 업데이트 기록이 있는지 확인하기 위해 설명서를 템플릿화하고 버전을 제어해야 합니다. 또한 버전 관리를 통해 팀이 정기적으로 예약된 간격으로 설명서 검토를 수행하는 요구 사항을 강화하는 데 도움이 됩니다.

  • 루틴, 즉석 및 응급 작업을 이해하기 쉬운 검사 목록 항목으로 분류합니다. 일상적인 작업의 예는 오픈 소스 종속성에 업데이트를 적용하는 프로세스입니다. 워크로드는 타사 메시지 서비스를 사용하려면 SDK와 같은 오픈 소스 라이브러리를 사용해야 할 수 있습니다. 이 SDK는 보안 패치, 버그 수정 및 기능 향상을 위해 정기적으로 업데이트되어야 합니다.

    업데이트가 필요하다고 판단되면 워크로드 팀에 하위 환경에서 업데이트 테스트, 프로덕션 환경에 업데이트를 배포하기 위한 변경 관리 요청 만들기, wiki 또는 기술 자료 같은 문서 업데이트와 같은 항목이 포함된 검사 목록이 있을 수 있습니다. 명확하게 정의된 개별 작업에 각 검사 목록 항목을 집중합니다.

  • 즉석 및 긴급 작업은 시나리오에 따라 다릅니다. 그러나 운영자는 여전히 자신의 역할과 책임을 명확하게 이해해야 합니다. 이러한 유형의 작업을 효율적으로 수행하려면 워크로드 팀 및 organization 다른 팀과 상호 작용하는 방법을 알아야 합니다.

    예를 들어 즉석 작업은 워크로드 기능 향상을 위해 승인된 기계 학습 서비스와 같은 새로운 유형의 리소스를 배포할 수 있습니다. 이러한 유형의 리소스 배포 및 테스트에 대해 완전히 실현된 검사 목록이 없을 수 있습니다. 그러나 승격 체인의 각 단계에서 성능, 보안 및 안정성에 대한 인프라 테스트를 다루는 코드 템플릿 및 표준으로 인프라에 새 리소스를 추가하기 위한 일반적인 검사 목록이 있어야 합니다.

    마찬가지로 긴급 대응 계획은 역할과 책임, 일반 프로세스 및 절차를 명확하게 정의해야 합니다. 긴급 상황에서 이 계획을 준수하여 효율적으로 처리해야 합니다.

    즉석 및 긴급 운영은 표준 운영 절차를 개선하는 방법을 배울 수있는 좋은 기회이기도합니다. 워크로드 팀에게 작업이 더 원활해질 수 있는 방법을 반영하고 기존 프로세스에 대한 업데이트가 앞으로 도움이 될 수 있는지 여부를 결정하도록 요청합니다.

  • 업계에서 입증된 사례를 채택하여 팀이 프로세스 및 표준을 발명하는 데 소비하는 시간을 최소화합니다. 스크럼과 함께 민첩한 사례를 따르고, Kanban 보드를 통해 작업을 구성하고, 왼쪽 교대 근무 정신을 채택하는 것은 수년 동안 개발되어 왔으며 모든 규모의 조직에 효과적인 것으로 입증된 사례의 모든 예입니다. 많은 성숙한 조직에서는 버전 제어 표준 운영 절차, wiki, 신입 직원 매뉴얼 및 운영 매뉴얼을 사용하여 일관성을 적용합니다.

    팀의 경험을 사용하여 워크로드 수명 주기 관리에 적합한 사례를 결정합니다. 특정 사례가 조직 구조에 얼마나 적합한지 이해하기 위해 성공적으로 구현된 표준에 대해 다른 팀에서 알아봅니다.

    이러한 맥락에서 왼쪽 전환 정신은 워크로드 팀이 워크로드의 보안, 안정성 및 비용 효율성을 향상시킬 수 있는 조치를 찾을 수 있는 권한을 부여받아야 한다는 것을 의미합니다. 그런 다음, 외부 팀으로 책임을 옮기는 대신 자체 백로그에 이러한 개선 조치를 추가합니다.

    예를 들어 예비 테스트는 보안 검사에 의해 노출될 때까지 검색되지 않았을 수 있는 보안 개선 영역을 발견할 수 있습니다. 이 영역은 월별 또는 덜 자주 발생합니다. 워크로드 팀이 수명 주기의 모든 측면에서 워크로드의 소유권을 부여하고 다른 팀에 의존하지 않고 사전에 지속적인 개선에 기여하도록 장려합니다.

  • 조직 요구 사항 및 교차 절단 기능을 표준 운영 절차에 통합합니다. organization 채택해야 하는 일부 프로세스에 대한 표준이 있을 수 있습니다. 그러나 다른 프로세스에 대한 고유한 표준을 개발할 수 있으므로 필요한 표준을 프로세스에 통합하는 방법을 찾습니다. 사용자가 소유한 프로세스는 다른 팀의 프로세스와 교차할 가능성이 높으므로 표준을 실행 가능한 범위로 조정하기 위해 노력합니다.

    워크로드 팀과 다른 팀의 프로세스가 서로 다른 위치를 문서화하여 워크로드 팀이 교집합 지점이 있을 때 다른 팀과 더 잘 작동할 수 있도록 합니다. 중앙 보안 팀은 워크로드 팀과는 다른 도구와 절차를 사용할 수 있으며, 이러한 차이점을 알고 있는 경우 팀은 더 쉽게 공동 작업할 수 있습니다.

  • 규정 준수 요구 사항을 표준 운영 절차에 통합합니다. 업계 및 운영 지역에 따라 작업을 수행하고 문서화하는 방법에 대한 엄격한 요구 사항이 있을 수 있습니다. 표준을 작성하는 동안 이러한 요구 사항을 이해하고 통합해야 합니다. 이러한 요구 사항에 대해 워크로드 팀을 정기적으로 학습시킵니다.

  • 자동화를 사용하여 일관성을 달성할 수 있습니다. 반복적이고 사람의 오류가 발생하기 쉬운 작업을 자동화하여 팀의 관리 부담을 덜어줍니다. 예를 들어 ITSM 티켓 생성과 같은 프로세스를 자동화할 기회를 찾습니다. 자세한 내용은 자동화 구현을 위한 권장 사항을 참조하세요.

  • 오픈 소스 채택에 대한 접근 방식에 대해 의도적으로 설명합니다. 오픈 소스 도구의 사용이 허용되는 시기에 대한 규칙을 표준화하고 조직 및 규정 준수 요구 사항에 부합하는지 확인합니다. 오픈 소스 프로젝트에 대한 워크로드 팀 구성원의 기여 대한 표준을 만들고 organization 다른 개발 팀에 사내 코드를 열지 여부를 결정할 수 있습니다.

절충: 표준 운영 절차를 명문화하면 정체 또는 안주로 이어질 위험이 있습니다. 표준을 따라야 하지만 엄격하거나 정적이어서는 안 됩니다. 프로세스가 시간이 지남에 따라 안전하게 발전할 수 있도록 엄격한 준수와 혁신 허용 사이의 균형을 찾기 위해 노력합니다.

Azure 촉진

프로세스 및 절차의 공식화를 직접 용이하게 하는 Azure 제품은 없지만 Microsoft는 이 항목에 대한 많은 지침을 게시합니다. 이 지침을 사용하여 업계에서 입증되고 권장되는 사례를 이해하고 워크로드에 적용하는 방법을 고려합니다.

또한 Well-Architected Framework는 워크로드 및 워크로드 팀이 업계 표준에 따라 실행되도록 코딩해야 하는 프로세스 및 절차에 대한 자세한 지침을 제공합니다.

운영 우수성 검사 목록

전체 권장 사항 집합을 참조하세요.