**
Srs. Clientes**
Lamentamos imensamente a falha ocorrida na plataforma que por sua vez afetou os clientes.
Detalhes de toda tratativa até a restauração do ambiente:
Problema: Lentidão na plataforma após realização do scale up do banco de dados transacional ( banco de dados de Logs de mensagens, notificações e comandos enviados);
Impacto:
Todos os componentes do portal e Desk e usabilidade associados a eles ficaram degradados.
Análise: Identificado um alto impacto para os clientes causado pelo processo de Scale Up, sendo necessário o cancelamento do processo. O processo de Scale Up foi cancelado às 17:47h. Após cancelado o processo de Scale Up foi observado um erro de TDS (Protocolo de comunicação do SQL Server).
Causa raiz: Em decorrência do aumento anormal do fluxo causando aumento no tempo de resposta do Banco dados que contém o contexto dos fluxos dos Bots).
Correção aplicada: O serviço foi totalmente restabelecido após o Scale Up no banco de dados realizado entre o horário de 21h do dia 23/03/2020 e finalizado por volta de 01:35 da madrugada do dia 24/03/2020. Ainda no dia 23/03/2020 foram implementadas várias manobras conforme detalhado acima, com objetivo de minimizar a lentidão identificada pelos clientes, uma vez que o Scale Up do Banco no horário de operação causaria um impacto ainda maior. Por volta das 17h01min após esgotado todas as tentativas, o time técnico em conjunto com a liderança resolveram realizar o Scale Up, no entanto, ao iniciar o processo, foi constatado um grande impacto na produção, sendo necessário cancelamento do mesmo por volta de 17h45min. Após o cancelamento foi observado um erro inesperado por parte do provedor de cloud, motivando o time técnico fazer um novo alinhamento, chegando a conclusão que o erro identificado estava ainda mantendo um impacto alto ao cliente, o que culminou a necessidade de realizar uma nova tentativa de Scale UP, novamente sem sucesso. No entanto nesse segundo momento de cancelamento do processo, foi observado que o erro já não ocorria mais. Com o ambiente ainda com lentidão mas estável, foi decidido pelo corpo técnico que o processo de Scale UP fosse iniciado no horário de menor fluxo. Ainda foi aberto um incidente interno 55634 para mapeamento de melhorias.
Início degradação: 23/03/2020 11h40min
Fim da instabilidade: 24/03/2020 01:35min