
SITE RELIABILITY ENGINEER
- Brasil
- Permanente
- Período integral
- Garantir a confiabilidade de nossos sistemas e serviços, com foco em uptime, resiliência e escalabilidade;
- Implementar e evoluir monitoramento e alertas (Application Insights, Azure Monitor, Log Analytics, Grafana, Prometheus);
- Participar da análise e resposta a incidentes, com foco em melhoria contínua (post-mortem, RCA, automação de recuperação);
- Realizar análises de performance e atuar proativamente para evitar gargalos;
- Coordenar com a consultoria rotinas relacionadas a banco de dados (tuning, backup, troubleshooting);
- Trabalhar em parceria com arquitetura, devs e devops na transição do legado monolítico para microsserviços modernos;
- Contribuir com indicadores operacionais e sustentação de SLOs, SLIs e Error Budgets.
- Cloud: Azure, AWS;
- Observabilidade: Azure Monitor, Log Analytics, Application Insights, Grafana, Prometheus;
- Ambientes: Azure App Services, Azure Functions, Service Bus, Redis, SQL Server (PaaS);
- Ferramentas: Bitbucket, Azure DevOps, Postgres/MongoDB (legado), SQL Server.
- Arquiteto de Soluções (foco em direcionamento técnico e transição do legado);
- DevOps (responsável pelas esteiras e automações);
- Consultoria técnica (apoio em banco de dados e troubleshooting avançado);
- Devs Node estratégicos (que criam componentes técnicos compartilhados).
- Disponibilidade e confiabilidade dos sistemas;
- Tempo de resposta a incidentes (MTTR);
- Performance e capacidade de serviços;
- Apoio à migração do legado e evolução arquitetural.
- CLT, Híbrido (para candidatos de BH e região), ou remoto (demais localidades).
- Carga horária: 44h semanais, de segunda a quinta-feira das 08h às 18h e sexta-feira das 08h às 17h.
- Experiência prática em monitoramento, logging e resposta a incidentes;
- Análise de custos e planos de equalização de recursos para equilíbrio financeiro;
- Capacidade analítica para troubleshooting e melhoria contínua;
- Conhecimentos em tuning de performance e sustentação de bancos relacionais;
- Boa comunicação e colaboração com equipes técnicas;
- Comprometimento com estabilidade, segurança e eficiência operacional.