Поделиться через


Книги по проектированию надежности сайтов (SRE)

Один из лучших способов узнать или углубить свои знания о SRE — это прочитать об этом. Вот некоторые из лучших письменных источников информации, которые мы видели по этой теме.

Основные книги SRE

Для получения более подробной информации о проектировании надежности сайта (SRE) лучший источник — это три книги, которые были опубликованы по этой теме

Каждая из этих книг содержит важный набор сведений:

  • Книга о SRE — подробно описывает, как именно компания Google внедряла SRE в течение многих лет.

  • Рабочая книга по SRE — это дополнение к SRE, которое более подробно описывает не только, что именно представляет собой SRE в Google и нескольких других местах, но и "как" и "для чего" используется этот подход.

  • "В поисках SRE" — содержит более открытый взгляд на подход SRE без привязки к источнику, включая сведения о том, как он был реализован в других средах.

Поскольку в этих книгах описывается опыт, среда и культура организаций, которые могут или не могут напоминать ту, в которой вы находитесь, важно читать эти книги критически. По мере чтения попытайтесь определить, какие методы будут успешными, а какие нет в вашей организации. Уделите время тому, чтобы отобрать именно те сведения, которые обязательно принесут пользу. Подумайте, какие ценности и культурные особенности вашей организации способны упростить или затруднить описанную реализацию SRE. Тщательное итеративное использование SRE почти всегда дает лучшие результаты, чем полное копирование того, что вы читаете в этих книгах.

Дополнительные книги SRE

После прочтения упомянутых выше книг, если вы хотите глубже изучить практику использования индикаторов уровня обслуживания (SLI)/целей уровня обслуживания (SLO), следующая книга является отличным ресурсом:

Реализация целей уровня обслуживания

Если вы хотите исследовать пересечение инженерии безопасности и надежности, эта книга содержит ряд хороших наблюдений по этой теме:

Создание безопасных и надежных систем