
Analista de SRE Pleno
- São Carlos - SP
- Permanente
- Período integral
- Experiência com arquitetura distribuída, virtualização e ambientes em nuvem AWS.
- Domínio de Linux e conhecimentos em Windows Server.
- Vivência com Docker e orquestração de containers via Kubernetes / AWS EKS.
- Conhecimento em ferramentas de mensageria como Kafka, RabbitMQ, SQS.
- Familiaridade com práticas DevOps, CI/CD (Jenkins) e automação com Terraform, Terragrunt e Ansible.
- Habilidade com Shell Script e desenvolvimento em Python para automações e soluções técnicas.
- Experiência com metodologias ágeis (Kanban, Scrum), participação ativa em cerimônias como daily meetings.
- Conhecimento em produtos AWS como RDS, EC2, EMR, MWA, além de bancos como DocumentDB.
- Boa comunicação, proatividade e capacidade de trabalhar em equipe.
- Atuar diretamente em uma squad multidisciplinar, participando de cerimônias ágeis, discussões técnicas e decisões estratégicas.
- Garantir a qualidade, segurança e resiliência da infraestrutura dos produtos.
- Comunicar e documentar o design da infraestrutura de forma clara e acessível para o time.
- Definir e implementar a infraestrutura dos produtos conforme diretrizes de arquitetura.
- Monitorar e garantir resiliência, performance e disponibilidade dos ambientes.
- Gerenciar e alinhar SLIs, SLAs e SLOs.
- Realizar troubleshooting de infraestrutura e apoiar os times de desenvolvimento na resolução de problemas.
- Propor e implementar soluções de monitoramento, logging e automação.
- Documentar a infraestrutura e acompanhar custos e capacidade dos ambientes.
- Participar de POCs e testes de novas soluções.
- Implantar infraestrutura como código (IaC) com Terraform, Terragrunt ou Ansible.
- Apoiar requisições e integrações com times de infraestrutura on-premises.
- Experiência com ambientes de alta criticidade e compliance.
- Conhecimento em observabilidade com ferramentas como Prometheus, Grafana, Datadog ou similares.
- Experiência prática na correção de vulnerabilidades em ambientes de infraestrutura, containers e aplicações serverless.
- Capacidade de analisar relatórios de segurança e aplicar correções de forma eficiente e segura.
- Conhecimento em práticas de hardening, gestão de patches e mitigação de riscos em ambientes distribuídos.
- Vivência com ferramentas de escaneamento e compliance, integradas ao ciclo de vida de desenvolvimento e infraestrutura como código.
- Terraform
- Kubernetes
- AWS
- Jenkins
- DataDOG
- DevOps