Site Reliability Engineer Júnior

  • Parnamirim - RN
  • Permanente
  • Período integral
  • Há 10 horas
Detalhes da VagaEscolaridade Não InformadoSegmento Não InformadoSalário Não InformadoÁrea de AtuaçãoDiversos / OutrosO que você irá fazer
  • Viabilizamos a gestão de ativos através de plataformas e ferramentas modernas e inovadoras.
  • Nosso foco é desenvolver soluções eficazes para os mercados de pagamento, crédito e financeiro do Brasil.
  • De sub-credenciadoras a bancos, criamos uma estrutura robusta e flexível para atender diferentes tipos de operações.
  • Aqui, você irá trabalhar com um time apaixonado por desafios, focado no cliente e em busca dos melhores resultados em suas entregas.
  • Quer mais? Tudo isso de forma 100% remota, em home office e com uma galera que é referência no mercado de tecnologia! Como é ser uma pessoa Site Reliability Engineer Júniorno nosso time: Ser um(a) Site Reliability Engineer no nosso time significa atuar no centro da nossa operação de monitoramento e observabilidade, garantindo que os sistemas e serviços estejam sempre disponíveis, estáveis e confiáveis.
  • Esse papel exige profundidade técnica, visão estratégica e capacidade de resposta rápida em momentos críticos.
  • No dia a dia, você será um(a) especialista em Datadog, criando, refinando e mantendo monitoramentos inteligentes, métricas estratégicas e dashboards que fornecem visibilidade total da saúde dos sistemas.
  • Também terá papel central na gestão de incidentes, conduzindo war rooms, investigando causas-raiz e propondo soluções que previnam recorrências.
  • Sua atuação na gestão de alertas será essencial para reduzir falsos positivos, ajustar thresholds e otimizar a eficiência de resposta.
  • Na área de observabilidade, garantirá que tenhamos dados confiáveis e insights acionáveis para tomada de decisão rápida, conectando métricas, logs e traces de forma integrada.
  • O que esperamos de você: Atuar no coração da operação, com foco em monitoramento, observabilidade e gestão de incidentes.
  • Criar e otimizar alertas no Datadog, dashboards e métricas.
  • Garantir observabilidade ponta a ponta, conectando métricas, logs e traces.
  • Trabalhar lado a lado com times de desenvolvimento, infraestrutura e negócio para prevenir problemas antes que eles ocorram.
  • Experiência em Datadog (alertas , dashboards, métricas, logs, traces, watchdog e anomaly detect ).
  • Práticas de observabilidade e otimização de alertas.
  • Conhecimento em ITIL (incident, problem, event management).
  • Experiência com arquiteturas distribuídas/microserviços (cloud, containers, Kubernetes como diferencial).
  • Senso de urgência e resiliência em situações críticas.
  • Comunicação clara e objetiva.
  • Pensamento analítico e mentalidade de dono.
  • Proatividade e espírito colaborativo.
  • O que aumentam suas chances: Uso de IA e Machine Learning no Datadog para prever e correlacionar incidentes.
  • Automação com Python ou outra linguagem para criar scripts, integrações e relatórios.
  • Experiência com playbooks automatizados para resposta a incidentes.
  • # Como é o processo seletivo: Nosso foco está na história e trajetória das nossas pessoas candidatas.
Informações AdicionaisQuantidade de Vagas 1Jornada Período comercial

Caderno Nacional