A Getrak, líder em plataforma SaaS de rastreamento, monitoramento e segurança veicular, busca um Senior Site Reliability Engineer (SRE) para integrar o time de Tecnologia e Produto. Atuando em um ambiente de alta escala e missão crítica, você será responsável por garantir a confiabilidade, disponibilidade e performance da nossa plataforma, que processa milhões de requisições diárias. Se está em busca deste desafio, vem ser Getraker! Principais responsabilidades: Definir, implementar e monitorar SLIs/SLOs de disponibilidade, latência e confiabilidade.Projetar e otimizar pipelines de CI/CD para microsserviços em ambiente de alta disponibilidade.Administrar e evoluir infraestruturas em AWS (EC2, ECS/EKS, S3, RDS, CloudFront, VPC, IAM, CloudWatch etc.).Gerenciar bancos distribuídos e sistemas críticos: Astra DB / Cassandra (DataStax), Redis e RabbitMQ.Automatizar provisionamento, configuração e escalabilidade com Terraform, Ansible ou similares.Desenvolver e manter práticas de observabilidade (métricas, logs, tracing) usando DataDog e ferramentas correlatas.Liderar investigações em incidentes críticos, propondo soluções definitivas (blameless postmortems).Atuar em otimização de custos em nuvem, equilibrando confiabilidade e budget.Garantir a segurança e conformidade da infraestrutura, com políticas de acesso, backup e auditoria contínua.Colaborar com times de engenharia e produto, trazendo visão de confiabilidade para o ciclo de desenvolvimento. Requisitos técnicos: 6+ anos de experiência em SRE/DevOps em ambientes de alta escala e missão crítica.Domínio de AWS e arquitetura cloud-native.Conhecimento avançado em Cassandra (Astra DB / DataStax), Redis e RabbitMQ.Experiência com microsserviços e conteinerização (Docker, Kubernetes, ECS/EKS).Forte experiência em automação (Terraform, Ansible, etc.).Vivência com observabilidade e DataDog (métricas, logs e tracing).Sólido entendimento de redes, segurança e protocolos.Experiência com incident response e resolução de problemas complexos.Atuação em ambientes ágeis, com cultura DevOps/SRE.Diferenciais • Experiência em ambientes SaaS B2B de grande volume de dados. • Certificações relevantes (AWS, Kubernetes, DevOps, SRE). • Conhecimento especializado em GitHub Actions. • Experiência com arquiteturas serverless (AWS Lambda) e event-driven. • Histórico em migração e otimização de bancos distribuídos e infraestrutura em nuvem. Perfil comportamental: Proatividade;Facilidade em se comunicar;Ser uma pessoa que trabalhe em equipe, com comprometimento e responsabilidade.