Взаимодействие и совместная работа
Своевременный и четкий общий доступ к информации является важным элементом эффективного реагирования на инциденты на протяжении всего жизненного цикла реагирования на инциденты. Взаимодействие имеет важное значение во время каждого этапа:
- Обнаружение: Сообщите соответствующим людям, что произошёл инцидент, а также о его характере, серьёзности и воздействии.
- Ответ: сообщайте детали об инциденте по мере продолжения диагностического процесса, какие шаги необходимы для устранения проблемы и кто что должен делать.
- восстановление: Сообщите, как и когда служба была восстановлена до нормальной работы и о необходимых дальнейших действиях.
- Анализ: Сообщите об уроках, извлеченных из инцидента, и о том, что можно сделать, чтобы предотвратить его повторение.
- готовности: обмен данными об изменениях (или необходимых изменениях) в плане реагирования на инциденты, наших процедурах и наших системах, полученных из уроков, извлеченных из этого инцидента.
Уделяйте первоочередное внимание четкому общению
Ранее в этом модуле мы упомянули, что элитные и высокопроизводительные организации принимают упреждающий, а не реактивный подход. Переход от простого реагирования к эффективному реагированию на инциденты является побочным продуктом приоритезации и создания хорошей, четкой, точной коммуникации.
Ключевые аспекты установления приоритетов для ясного общения включают:
- Убедитесь, что вы делитесь информацией о том, что происходит на каждом шаге пути.
- Документируйте сведения; поместите их в письменном виде, чтобы с меньшей вероятностью они были неправильно поняты или забыты.
- Поместите информацию в централизованное расположение, где оно будет доступно всем, кто нуждается в нем.
- Используйте средства для повышения эффективности взаимодействия.
Несмотря на то, что мы не назвали это прямо в то время, все эти виды поведения мы продемонстрировали в последнем блоке.
Средства коммуникации: ChatOps
Прежде чем говорить о средствах коммуникации, необходимо узнать о ChatOps, который не является конкретным инструментом, а моделью совместной работы на основе бесед. Он популярен среди разработчиков, так как объединяет людей, инструменты, процессы и автоматизацию. ChatOps предоставляет вам новый и лучший способ для работы команд, используя групповый чат, а не полагаться на старые технологии, такие как электронная почта для совместной работы.
В своей расширенной форме ChatOps может использовать настраиваемые боты и искусственный интеллект для автоматизации работы. В контексте реагирования на инциденты можно использовать ChatOps для привлечения средств группового чата в беседу. Работая таким образом, можно сильно стимулировать инженеров для совместной работы в групповом чате и совместной работы по вопросам и инцидентам, а также нормальных инженерных усилий.
Групповой чат помогает делиться более подробной информацией о том, что происходит в вашей системе с точки зрения институциональных знаний, перемещая эту информацию из голов людей в чат, чтобы она могла быть предоставлена и использована другими пользователями.
Это повышает видимость и оперативную осведомленность по всей команде и помогает другим научиться делать то, что они должны делать. При выполнении команд и совместном использовании того, что вы делаете в чате, вы учите других, что делать и как это делать.
Обучение — это побочный продукт обмена дополнительными сведениями о том, что происходит в сфере проектирования. Когда вы лучше понимаете, что делают и думают ваши сверстники, коллеги и руководство, в том числе как они принимают решения, вы можете быть более сочувствующим к тому, что происходит. Все это происходит более естественно, когда вы начинаете переносить работу в чат.
Использование Microsoft Teams в решении ChatOps
Вы уже узнали, как Microsoft Teams может быть важной частью набора средств коммуникации во время инцидента. Вы можете создать мост беседы с каналом, посвященным инциденту, и даже использовать Logic Apps для автоматизации публикации сведений об инциденте непосредственно в канале.
Так как Microsoft Teams является централизованным местом, где у нас есть много разговоров о наших инженерных усилиях, это хорошее место, чтобы начать работу с решением ChatOps для предоставления обновлений состояния и дополнительного контекста.
Например, для обновления страницы состояния можно использовать веб-перехватчик из Microsoft Teams. Вы можете настроить Teams для прослушивания определенной команды в чате и, если получено, отправить запрос другому приложению. Это простое приложение может быть функцией Azure, которая обновляет статическую HTML-страницу, хранящуюся в хранилище BLOB-объектов Azure, с информацией об инциденте. В итоге простая команда в чате позволяет предоставить обновление для дополнительных заинтересованных лиц, не участвующих в чате. Этот простой шаг экономит время, которое иначе могло бы уйти на информирование тех, кто не задействован в реакции.
До сих пор мы в основном потратили время на этапы перед устранением. Теперь давайте переместим наше внимание на способы улучшения этого этапа.