피해야 할 일반적인 함정
- 7분
인시던트 후 검토 프로세스를 시작하는 데 도움이 되도록 논의한 로드맵은 도움이 되지만 이 여정에서 발생할 수 있는 몇 가지 장애물에 대해 아는 것도 유용할 수 있습니다.
이 단원에서는 사후 인시던트 검토 과정에서 다른 사람들이 빠졌던 몇 가지 흔한 함정과 이를 방지하는 방법에 대해 알아봅니다.
함정 1: "사용자 오류"에 대한 특성
보다 일반적인 "인간 오류" 레이블의 특정 형태인 "파일럿 오류"는 모듈 소개에서 시작한 B-17 이야기에서 초기 조사자가 도달한 결론이었습니다. 그 이야기로 돌아가봅시다.
그 소개에서, 우리는 도달 결론이 당신에게 불만 될 수 있음을 제안했다. 그들은 미 육군 공군(USAAF)이 이 사건을 조사해 달라는 요청을 받은 군사 심리학자 알폰스 차파니스에게 확실히 불만을 품고 있었다. 그는 무엇보다도 이러한 사고가 B-17과 소수의 다른 항공기에 고유하다는 것을 발견했습니다. 서유럽에서 동시에 수천 대의 C-47 수송기가 사용되었지만 C-47은 비슷한 사건을 경험한 적이 없었습니다.
그래서 그는 조종사들을 인터뷰했고, 그들로부터 들은 내용을 바탕으로 B-17 조종석을 보았습니다. 기어 스위치와 플랩 스위치라는 두 개의 스위치가 있었습니다. 스위치는 조종석에서 서로 약 3 인치 떨어져 있었다. 그들의 작업 모드는 동일했습니다. 그들은 서로 혼동하기가 너무 쉬웠고, 이것이 이 사건에서 일어난 일입니다. 방금 비행기에 착륙했다면 플랩이 확장되어 있을 것이며, 주차하기 전에 플랩을 접을 것입니다. 그래서 차파니스는 뭔가 다른 것을 시도했다.
그는 기어 스위치에 작은 고무 휠을 붙이고 플랩 스위치에 단단한 각진 '덮개'를 붙였으며, 그 결과 사고가 확실히 멈추었습니다.
그는 현재 인체 공학 분야의 창립자 중 한 명으로 알려져 있으며 (인간의 성능에 대한 디자인 요인 연구), 조종석의 디자인은 인간의 오류 가능성에 영향을 미칠 수 있다는 간단한 관찰을 했습니다. 이 접근 방식은 현대 항공기의 설계에 영향을 미쳤습니다. 예를 들어 미국의 운송용 항공기 규정에 따라 랜딩 기어 컨트롤은 휠 모양이어야 하고 플랩 컨트롤과 구별되어야 합니다.
그래서, 왜 우리는 당신에게이 이야기를 했습니까?
인간은 실수를 합니다. 그러나 사람의 실수 는 원인이 아닙니다. 증상입니다. 인적 오류가 실패의 원인으로 간주되는 경우 사람들은 인시던트를 추가로 분석하는 대신 중지합니다.
시스템 디자인, 조직 컨텍스트 및 개인 컨텍스트는 모두 사람들이 실수를 할 때, 어떻게, 어떤 영향을 미치는지에 영향을 미칩니다. "사용자 오류"는 시스템에 대해 흥미로운 것을 발견하려는 순간에 조사를 종료하게 하는 레이블입니다.
수사에서 "인간의 오류" 결론의 문제는 사람들의 행동이 그 당시에는 그들 자신에게 의미가 있었다는 사실을 간과하게 만든다는 것입니다. 정의상 실수는 의도적인 것이 아니므로 실수를 할 의도가 없었습니다.
"인간의 실수"를 보거나 들을 때, 그것은 우리가 더 깊이 보아야 한다는 신호입니다. 우리가 배우고 싶다면, 우리는 우리가 너무 자주하는 것처럼, 우리가 인간의 오류를 찾을 때 조사를 중지해서는 안됩니다. B-17s의 이야기에서 알 수 있듯이, 인간의 실수를 넘어 우리가 시스템에 대해 흥미로운 것들을 배우는 곳입니다.
트랩 2: 상반된 추론
반사실적은 "사실에 반하는"을 의미하며 반사실적 추론은 일어난 사건을 설명하기 위해 일어나지 않은 사건에 대한 이야기를 제시하는 것을 의미합니다. 사람들이 항상 그렇게 하는 경향이 있더라도 이것은 별로 의미가 없습니다.
주요 표현을 사용하여 반사실적 문장을 식별할 수 있습니다.
- 할 수도 있었다
- 있어야 합니다.
- 했을 것이다
- 실패했습니다
- 하지 않았다
- 만약에
인시던트 후 검토와 관련된 반대 진술의 몇 가지 예:
"모니터링 시스템에서 문제를 감지하지 못했습니다."
"엔지니어가 구성을 적용하기 전에 구성의 유효성을 확인하지 않았습니다."
"이것은 카나리아 환경에서 포착되었을 수 있습니다."
인시던트 후 검토에서 이러한 유형의 추론의 문제는 어떤 일이 일어났는지 이해하는 데 시간을 할애하는 대신 일어나지 않은 일에 대해 이야기하고 있다는 것입니다. 당신은이 추측에서 아무것도 배울 수 없습니다.
트랩 3: 표준 언어
규범적 언어 는 종종 연산자가 취해야 할 "분명히 올바른" 작업 과정이 있음을 의미하며, 뒤늦게 그 연산자의 행동을 판단합니다.
규범적 언어는 일반적으로 "부적절하게", "부주의하게", "서둘러"와 같은 부사로 식별될 수 있습니다.
규범적 사고는 결과에 따라 결정을 판단하도록 유도합니다. 결과가 결정과 판단을 내린 사람들에게 제공되지 않은 유일한 정보 이기 때문에 이러한 말하기 방식은 논리적이지 않습니다.
표준 언어는 반대의 의미로도 사용할 수 있습니다. 예를 들어 사람들은 연산자가 "적절하게" 행동한 것에 대해 칭찬할 수 있습니다. 그러나 다시 말하지만, 종종이 판단은 문제의 사람들이 가지고 있지 않은 정보의 혜택으로 이루어집니다.
규범적 언어의 문제는 반인상적 추론의 문제와 유사합니다: 사고 당시 관련자가 사용할 수 없었던 정보를 사용한 사실 이후에 판단을 내린다면, 우리는 운영자의 행동이 당시 그들에게 어떻게 이해되었는지 이해하지 못합니다.
트랩 4: 기계적 추론
기계적 추론 은 특정 결과가 개입으로부터 유추될 수 있다는 개념을 가리킵니다. 때때로 이것은 제시카 DeVita에 의해 만들어진 참견쟁이 아이들 증후군이라고 불리는데, 이는 "우리의 시스템은 잘 작동했을 텐데... 그 참견쟁이 아이들이 아니었다면"이라는 전제에 기반합니다.
인시던트 후 검토에서 기계적 추론을 사용할 때, 작업하는 시스템과 내부 시스템이 기본적으로 제대로 작동하고 있다는 잘못된 가정에 근거하여 결론을 내립니다. 그리고 만약 "말썽쟁이 아이들"이 문제를 일으키지 않았다면 실패가 발생하지 않았을 것이라고 생각하는 오류를 범합니다.
그러나 시스템이 작동하는 방식은 아닙니다.
이 점을 설명하기 위해 프로덕션 서비스에서 작업하는 시나리오를 상상해 보세요. 이제 해당 서비스를 터치하거나 수행할 수 없다는 말을 들었습니다. 팀 외부의 모든 작업은 이전과 같이 계속됩니다. 고객은 계속해서 서비스를 사용하고, 외부 종속성은 계속 변경되며, 인터넷은 정상적으로 작동합니다.
하지만 코드 또는 구성을 변경할 수는 없습니다. 배포도 없고, 컨트롤 플레인 작업도 없습니다.
하루 후에도 서비스가 예상대로 실행될 것이라고 생각하십니까? 일주일 후? 한 달 후? 1 년 후? 인간의 개입 없이 서비스가 계속 실행되기를 현실적으로 얼마나 오래 기대할 수 있습니까? 대부분의 경우 그렇지 않습니다.
이 생각 운동은 중요한 결론으로 우리를 이끈다:
시스템을 가동하고 실행하려면 인적 적응 용량이 필요합니다.
시스템이 처음에 계속 가동되고 실행되는 유일한 이유는 제어 루프에서 사람의 작업 때문입니다. 그것은 단지 인간의 행동과 시스템이 계속 작동하는 변화하는 상황에 적응하는 능력을 통해서만 가능합니다.
따라서 시스템이 "기본적으로 잘 작동하고 있었다고, 방해가 된 아이들이 아니었다면"이라고 결론 짓는 것은 잘못된 일입니다. 사실, 서비스의 안정성은 그것을 운영하는 사람들과 분리될 수 없습니다. 인간이 매일 그것에 하는 작업을 통한 직접적 결과물이다.
기계적 추론의 문제는 결함이 있는 인간을 찾는 것이 문제를 찾는 것과 같다고 믿는 길을 따라 내려갈 수 있다는 것입니다. 그러나 그 결함 있는 인간은 즉흥적으로 대응하고 적응하면서 시스템을 몇 주 또는 몇 달 동안 계속 유지하고 있다. 아마도 이 역할은 인시던트 후 검토에 반영할 만큼 중요합니다.
인시던트 후 검토 중에 피해야 할 몇 가지 사항을 알게 되었으므로 다음 단원으로 이동하여 해당 검토에 대한 몇 가지 유용한 사례를 살펴볼 수 있습니다.