Postmortem de incidente sem a cronologia que sumiu.
A maioria dos postmortems é escrita semanas depois do incidente quando a memória já esmaeceu e as ações corretivas já escorregaram. Este template impõe a mesma estrutura sempre para que padrões apareçam e correções realmente saiam.
Para times de engenharia e sre. Sem cartão. Primeira run em menos de um minuto.
Postmortem Incidente #INC-0317
Timeout em cascata na API · Severidade 1 · 2h 45m downtime
- Declarar responsável100%Comandante IncidenteSLA 30min
- Capturar cronologiaComandante IncidenteEvidência
- Análise causa raizEngenhariaMétodo 5 porquês
- Fatores contribuintesEngenharia
- Ações corretivasEngenhariaEvidência
- Revisão do timeTime de Resposta
- Publicar postmortemTech LeadGate de aprovaçãoDep. pendente
- Verificar fechamento açõesBLOQUEADAComandante IncidenteDep. pendente
Postura
O que tiramos. E o que mantivemos.
Esse template é repetível, não abrangente. Abrangente é o motivo dos postmortems serem adiados.
Tiramos
- Write-ups de incidente em formato livre no Confluence.
- Ações corretivas em tracker separado.
- Postmortems publicados antes da revisão do time.
- Causa raiz sem 5 porquês estruturado.
Mantivemos
- Responsável declarado em 30 minutos.
- Cronologia capturada enquanto a memória está fresca.
- Gate de aprovação do tech lead antes da publicação.
- Verificação de ações corretivas embutida no fluxo.
O que este template inclui
Etapas do processo
- 1Declarar responsável pelo incidente e nível de severidade em até 30 minutos
- 2Capturar cronologia do incidente: o que aconteceu, quando e quem estava envolvido
- 3Identificar causa raiz pelo método dos 5 porquês, documentar em campos estruturados
- 4Listar fatores contribuintes: lacunas de processo, falhas de ferramentas, problemas de comunicação
- 5Definir ações corretivas com responsável e prazo para cada item
- 6Revisar rascunho do postmortem com o time de resposta completo
- 7Publicar postmortem final, gate de aprovação do tech lead
- 8Verificar fechamento das ações corretivas no prazo acordado
Por que times usam este template
Postmortems funcionam melhor quando são consistentes. Quando cada incidente segue um formato diferente, alguns no Confluence, outros por e-mail, outros sequer escritos, os padrões que causam interrupções repetidas nunca aparecem.
Este template impõe a mesma estrutura sempre: cronologia, causa raiz, fatores contribuintes e ações com responsáveis. O gate de aprovação garante que o postmortem seja revisado antes de ser publicado, não depois que as perguntas começam a chegar.
Pronto para rodar este processo?
Abra este template no Cadenio, customize os campos e aprovações para o seu contexto, e rode a primeira vez em menos de 60 segundos.
Setor relacionado
Caso de uso: TI & DevOpsTemplates relacionados
Revisão de Prontidão para Produção
Template de production readiness, segurança, observabilidade, plano de rollback e teste de carga verificados antes de qualquer deploy, com gates de aprovação de engenharia.
OperaçõesGovernança de Solicitação de Mudança
Template de governança de mudanças, encaminhe mudanças pelos aprovadores certos com 3 gates, sem atalhos e com registro completo de quem aprovou o quê e quando.
OperaçõesGestão de Mudança de Processo
Template de gestão de mudanças, análise de impacto, aprovação de stakeholders e plano de rollout em um único fluxo para que nada passe despercebido quando um processo muda.