A partir da identificação do sintoma, acionamos o time de cloud e banco de dados e iniciou-se a investigação para identificar a causa raiz do problema. O time iniciou a validação da Infra-estrutura Azure para uma análise mais ampla do que poderia estar acarretando a instabilidade. Após o término da análise, entendemos que a instabilidade aconteceu por conta de drops de conexão ao PGbouncer, degradando 2 das 4 máquinas que possuem dentro da pool de conexões, com os restarts realizados foram restabelecidas as máquinas.
A aplicação se manteve parcialmente funcional por terem 2 outras máquinas capturando as conexões, e retornou a estabilidade após os restarts.