Infraestrutura e Segurança
Suporte e Monitoramento
Monitoramento de verdade não é só “ping verde no Grafana”: é saber qual métrica importa para o negócio, quem acorda quando ela quebra e o que fazer nos primeiros quinze minutos. Suporte bom não empilha “aguardando retorno do cliente” sem explicar o que já foi tentado. A Viscale trata operação como produto: fila visível, prioridade acordada com você e retrospectiva que muda configuração — não só fecha chamado.
Camadas de observabilidade que conversam com o time de produto. Latência de API, taxa de erro, fila crescendo, disco e conexões de banco — cada alerta com limiar justificado e destinatário certo. Evitamos “alerta que nunca dispara” e “alerta que dispara toda noite” com a mesma energia: tuning em cima de incidente real, não de achismo.
O que a gente pode fazer pra você?
Plantão em horário comercial ou 24x7
Combinamos escopo e canal (Slack, e-mail, telefone) com SLA de primeira resposta.
Painéis de saúde do ambiente
Uma página que o CEO entende: verde, amarelo, vermelho com explicação.
Alertas com runbook de 1 página
Sintoma → checagem → ação ou escalação.
Gestão de patches e janelas
CVE crítico com plano de aplicação e rollback.
Revisão mensal de custo e performance
O que subiu, por quê e o que dá para cortar sem risco.
Suporte a deploy e release
Alguém de plantão na janela combinada com checklist de smoke test.
Integração com seu ITSM
Jira, Freshdesk ou planilha — ticket com histórico único.
Postmortem e backlog de melhoria
Incidente virando três ações com dono e data.
Suporte com contexto e sem jogar problema para o outro lado. Quando abre chamado, registramos o que já checamos, qual ambiente, qual versão e qual hipótese — para o próximo plantonista não recomeçar do zero. Se a causa é código, acionamos o time de engenharia com log e passos de reprodução; se é infra, agimos no limite do contrato sem esconder risco.
Melhoria contínua que aparece na fatura do tempo. Após incidentes relevantes, rodamos postmortem enxuto com ações donáveis (patch, limiar novo, documentação). Se o custo de nuvem subiu, apontamos o serviço culpado e opções de ajuste — autoscaling, lifecycle de log ou query pesada. O CTA é falar com a gente para combinar plantão, janela de manutenção e o que é P0 versus P2 no seu mundo.
Portfólio de Suporte e Monitoramento
Entregáveis
Acordo de serviço (SLA)
Horários, canais e severidades assinados.
Painéis de monitoração
Links e legenda em linguagem de negócio.
Biblioteca de runbooks
PDF ou wiki com passos curtos.
Registro de incidentes
Histórico pesquisável com causa raiz quando houver.
Lista de contatos e escalonamento
Quem chama quem em cada horário.
Relatórios periódicos
PDF ou e-mail com métricas combinadas.
Backlog de melhorias técnicas
Itens priorizados com estimativa grosseira.
Evidência de patches aplicados
Data, pacote e ambiente.
Calendário de janelas
Manutenção planejada visível para o time.
Sessão de handoff
Se houver transição de fornecedor ou equipe interna.
Metodologia de execução
-
Onboarding técnico
Acesso, ambientes, contatos e o que é crítico para o negócio.
-
Definição de SLAs e severidades
P0 a P3 com tempo de primeira resposta e resolução alvo.
-
Instrumentação mínima
Métricas, logs e alertas acordados.
-
Runbooks iniciais
Um pager por serviço crítico.
-
Teste de plantão
Simulamos falha e medimos tempo até ação.
-
Operação contínua
Filas, mudanças e comunicação semanal ou quinzenal.
-
Gestão de mudança
Janelas, rollback e aviso ao produto.
-
Revisão de alertas
Corta ruído, adiciona o que faltou após incidente.
-
Relatório mensal
Incidentes, MTTR, custo e riscos em aberto.
-
Retrospectiva trimestral
O que mudar no contrato ou na arquitetura.