Site Reliability Engineer Júnior

Parnamirim - RN
Permanente
Período integral

Há 10 horas

Detalhes da VagaEscolaridade Não InformadoSegmento Não InformadoSalário Não InformadoÁrea de AtuaçãoDiversos / OutrosO que você irá fazer

Viabilizamos a gestão de ativos através de plataformas e ferramentas modernas e inovadoras.
Nosso foco é desenvolver soluções eficazes para os mercados de pagamento, crédito e financeiro do Brasil.
De sub-credenciadoras a bancos, criamos uma estrutura robusta e flexível para atender diferentes tipos de operações.
Aqui, você irá trabalhar com um time apaixonado por desafios, focado no cliente e em busca dos melhores resultados em suas entregas.
Quer mais? Tudo isso de forma 100% remota, em home office e com uma galera que é referência no mercado de tecnologia! Como é ser uma pessoa Site Reliability Engineer Júniorno nosso time: Ser um(a) Site Reliability Engineer no nosso time significa atuar no centro da nossa operação de monitoramento e observabilidade, garantindo que os sistemas e serviços estejam sempre disponíveis, estáveis e confiáveis.
Esse papel exige profundidade técnica, visão estratégica e capacidade de resposta rápida em momentos críticos.
No dia a dia, você será um(a) especialista em Datadog, criando, refinando e mantendo monitoramentos inteligentes, métricas estratégicas e dashboards que fornecem visibilidade total da saúde dos sistemas.
Também terá papel central na gestão de incidentes, conduzindo war rooms, investigando causas-raiz e propondo soluções que previnam recorrências.
Sua atuação na gestão de alertas será essencial para reduzir falsos positivos, ajustar thresholds e otimizar a eficiência de resposta.
Na área de observabilidade, garantirá que tenhamos dados confiáveis e insights acionáveis para tomada de decisão rápida, conectando métricas, logs e traces de forma integrada.
O que esperamos de você: Atuar no coração da operação, com foco em monitoramento, observabilidade e gestão de incidentes.
Criar e otimizar alertas no Datadog, dashboards e métricas.
Garantir observabilidade ponta a ponta, conectando métricas, logs e traces.
Trabalhar lado a lado com times de desenvolvimento, infraestrutura e negócio para prevenir problemas antes que eles ocorram.
Experiência em Datadog (alertas , dashboards, métricas, logs, traces, watchdog e anomaly detect ).
Práticas de observabilidade e otimização de alertas.
Conhecimento em ITIL (incident, problem, event management).
Experiência com arquiteturas distribuídas/microserviços (cloud, containers, Kubernetes como diferencial).
Senso de urgência e resiliência em situações críticas.
Comunicação clara e objetiva.
Pensamento analítico e mentalidade de dono.
Proatividade e espírito colaborativo.
O que aumentam suas chances: Uso de IA e Machine Learning no Datadog para prever e correlacionar incidentes.
Automação com Python ou outra linguagem para criar scripts, integrações e relatórios.
Experiência com playbooks automatizados para resposta a incidentes.
# Como é o processo seletivo: Nosso foco está na história e trajetória das nossas pessoas candidatas.

Informações AdicionaisQuantidade de Vagas 1Jornada Período comercial

Caderno Nacional

Candidatar-se