Analista de Monitoramento Pleno (Presencial)
Dataside Ver todas as vagas
- São José dos Campos - SP
- Permanente
- Período integral
- Monitorar sistemas, infraestrutura e eventos de negócio utilizando ferramentas como Zabbix, Grafana, Dynatrace e Datadog;
- Atuar sobre sistemas críticos do ecossistema financeiro, incluindo fluxos de pagamento e transações (ex: PIX), garantindo rápida identificação de impactos;
- Identificar proativamente anomalias e acionar os times responsáveis conforme criticidade, impacto e risco ao negócio;
- Realizar análise inicial de alertas, incluindo validações básicas (logs, comportamento e correlação de eventos) antes de escalonamento;
- Executar atendimentos iniciais com base em Runbooks e Playbooks;
- Escalonar incidentes quando não houver procedimento definido ou quando a resolução não for possível no nível de atuação;
- Conduzir ou apoiar war rooms para tratativa de incidentes críticos, considerando impacto financeiro e reputacional;
- Acompanhar e gerenciar tickets do início ao encerramento, garantindo comunicação clara e cumprimento de SLA/SLO;
- Criar e manter Procedimentos Operacionais junto às áreas técnicas e de negócio;
- Identificar padrões de falhas e recorrências, realizando abertura de Problemas (PRB);
- Contribuir com análises de causa raiz em conjunto com times técnicos;
- Atuar em conformidade com boas práticas de ambientes regulados, garantindo rastreabilidade e correta classificação de incidentes;
- Apoiar na identificação de incidentes relacionados à segurança (ex: acessos indevidos, comportamento anômalo), realizando o devido encaminhamento;
- Identificar e reportar desvios operacionais e oportunidades de melhoria nos processos e monitoramento.
- Experiência em atendimento de 2º nível (N2);
- Conhecimento em ambientes cloud (Azure, AWS ou GCP);
- Experiência com ferramentas de monitoramento (Zabbix, Grafana, Datadog ou similares);
- Conhecimento básico em análise de logs e troubleshooting;
- Conhecimento em bancos de dados (consulta e validação básica);
- Conhecimento em processos ITIL (Incident, Problem e Change Management);
- Noções de operação em ambientes regulados (ex: financeiro, LGPD, auditoria);
- Noções básicas de segurança da informação;
- Experiência com gestão de SLA/SLO e ambientes de alta disponibilidade;
- Vivência em ambientes críticos;
- Boa comunicação sob pressão, senso de urgência e raciocínio lógico.
- Experiência em operações NOC/SRE em instituições financeiras ou fintechs;
- Vivência com sistemas de pagamento (ex: PIX, adquirência, banking APIs);
- Experiência prática com gestão de incidentes críticos (war room);
- Conhecimento básico em Python ou automação;
- Experiência na criação de Procedimentos Operacionais (Runbooks/Playbooks);
- Certificações em cloud (Azure, AWS ou GCP);
- Certificações ou cursos em ITIL ou segurança da informação;
- Perfil analítico, proativo e com facilidade de aprendizado.
- 💪 Wellhub, pra manter corpo e mente ativos, do jeito que você gosta.
- 🧠 Terapia online 100% custeada pela empresa, porque saúde mental importa.
- 🥗 Atendimento em nutrição online, com até 2 consultas mensais para cuidar da sua saúde alimentar.
- 🛡️ Seguro de vida com apólice no valor de R$ 125 mil, garantindo mais segurança para você e sua família.
- 🎉 Day off no aniversário, porque o seu dia merece ser especial.
- 🌴 Descanso remunerado, para que você possa recarregar as energias.
- 🏆 Gamificação interna, transformando conquistas em prêmios e reconhecimento.
- 🎓 Parcerias educacionais com faculdades como FIAP, Anhanguera e Instituto Infnet, pra apoiar seu crescimento e aprendizado.
- 📚 Bônus por certificação técnica, reconhecendo e recompensando seu esforço em aprender.
- 🍽️ Vale refeição, pra apoiar sua alimentação no dia a dia.
- 🚌 Vale transporte, facilitando seu deslocamento com mais tranquilidade.