Plataforma de Atendimento Humano - Tech4Humans
Incident Report for Tech4Humans
Resolved
A partir da identificação do sintoma, acionamos o time de cloud e banco de dados e iniciou-se a investigação para identificar a causa raiz do problema. O time iniciou a validação da Infra-estrutura Azure para uma análise mais ampla do que poderia estar acarretando a instabilidade.
Após o término da análise, entendemos que a instabilidade aconteceu por conta de drops de conexão ao PGbouncer, degradando 2 das 4 máquinas que possuem dentro da pool de conexões, com os restarts realizados foram restabelecidas as máquinas.

A aplicação se manteve parcialmente funcional por terem 2 outras máquinas capturando as conexões, e retornou a estabilidade após os restarts.
Posted Mar 27, 2023 - 11:00 GMT-03:00