SRE 시작

완료됨

이 모듈의 최종 단원으로, SRE를 살펴보려는 경우 여기서 어디로 이동할지 설명하겠습니다.

읽기 및 보기

SRE에 대한 자세한 내용은 해당 주제에 대해 발행된 다음 세 권의 서적을 참조하세요.

  1. Site Reliability Engineering: How Google Runs Production Systems(“The SRE Book”이라고 함)
  2. The Site Reliability Workbook: Practical Ways to Implement SRE(“The SRE Workbook”이라고 함)
  3. Seeking SRE: Conversations About Running Production Systems at Scale

(참고로, 이 모듈의 주요 작성자는 세 번째 서적의 큐레이터/편집자입니다.)

각 서적에서는 다음과 같은 중요한 정보를 제공합니다.

  • The SRE Book - Google이 몇 년 동안 SRE를 어떻게 구현했는지에 대해 자세히 설명합니다.

  • The SRE Workbook - The SRE Book의 동반 서적으로, Google 및 다른 몇몇 장소에서 SRE가 “무엇”인지뿐만 아니라 “어떻게” 및 “왜”에 대해서도 자세히 설명합니다.

  • Seeking SRE - 다른 환경에서 구현된 방법에 대한 정보를 비롯하여 SRE의 기원을 넘어 SRE 분야를 보다 광범위한 시각에서 바라봅니다.

비판적인 눈으로 세 권의 서적을 모두 읽어보세요. 이러한 서적에 기록된 모든 내용이 사용자와 사용자 조직에 적용되는 것은 아닙니다. 시간을 할애해서 명확히 긍정적인 가치를 제공할 수 있는 정보를 식별하세요. 조직 문화와 가치의 어떤 부분이 SRE 작업을 설명된 대로 지원할 수 있고 어떤 부분이 더 어렵게 만들 수 있는지 생각해 보세요.

시각적 정보를 원하는 경우 SREcon14 회의에서 Ben Treynor가 참여한 Keys to SRE 담화를 시청해 보세요. Treynor는 자신이 생각하는 SRE가 무엇인지를(최소한 Google 컨텍스트에서) 설득력 있게 설명합니다. 이 회의 시리즈 등에서 녹화된 다른 SRE 관련 담화도 유용할 수 있습니다.

다른 관심 있는 사람과 대화하기

동료들과 SRE에 대해 논의하는 것도 SRE에 대한 서적을 읽는 것만큼 중요하거나 때로는 그보다 훨씬 중요할 수 있습니다. SRE와 관련된 과제, 성공 및 실패를 논의하는 것은 주제를 자세히 파악하는 데 중요할 수 있습니다.

SRE 콘텐츠를 다루는 여러 모임과 회의가 있습니다. 가장 직접적으로 관련된 것은 USENIX에서 개최하는 글로벌 분산 SREcon 회의입니다(부인: 이 모듈의 주요 작성자는 SREcon의 공동 창립자 중 한 명임).

점점 더 많은 SRE 콘텐츠가 Velocity, LISA 등의 회의와 DevOps Days 등의 현지 DevOps 회의에서 논의되고 있습니다. 이 콘텐츠뿐 아니라 어디서든 주제에 관심 있는 다른 사람들을 찾아보세요.

회사에서의 첫 번째 단계

SRE가 "전부 또는 전혀" 제안이 아니라는 점을 기억하는 것이 중요합니다. SRE를 환경에 도입하는 방법을 탐색하려면 작은 단계에서 SRE 원칙 및 사례를 채택할 수 있습니다.

Mikey Dickerson은 미국 디지털 서비스에서 근무한 경력을 바탕으로 잘 알려진 SRE입니다. 그들은 healthcare.gov를 구할 책임이 있었습니다. 그는 Maslow의 욕구 계층 구조를 따라 안정성 계층 구조를 제안했습니다. 첫 번째 SRE 서적의 사례 섹션에 인용되어 있습니다.

이 계층 구조는 먼저 사용자 환경의 모니터링이 안정적으로 작동하도록 해야 한다고 제안합니다. 사용자 환경에서도 모니터링이 SRE의 첫 번째 단계여야 합니다. 측정할 수 없는 경우 무엇이 안정적인지(또는 개선되거나 악화되는지) 알 수 없습니다.

신뢰할 수 있는 모니터링 플랫폼이 준비되면, 다음에 도달 가능한 단계는 회사에서 서비스를 선택합니다. 그런 다음, SLI 및 SLO에 대해 대화를 시작합니다. 간단히 시작합니다. 서비스에 대한 SLI 및 SLO를 만들고, 모니터링 시스템에서 구현한 다음, SRE 렌즈를 사용하여 안정성에 주의하기 시작할 때 발생하는 결과를 확인하세요. 이러한 단계는 시작하기에 좋은 지점입니다.