Site Reliability Engineer (SRE)

  • São Paulo - SP
  • Permanente
  • Período integral
  • Há 2 mêses
Como Site Reliability Engineering, você irá ajudar a construir e manter nossa infraestrutura em cloud além de consolidar parcerias com as equipes de engenharia garantindo que os serviços estejam cada vez mais escaláveis seguros e resilientes.

Entre suas atividades está a identificação e correção de problemas de desempenho, provisionamento de infraestrutura em cloud, automatizações de workflows, além de desenvolver ferramentas para melhorar o trabalho de seus colegas engenheiros.

Abaixo estão alguns casos reais de trabalho que realizamos no passado:

Criação de operadores Kubernetes em Golang, com a finalidade de automatizar a gestão de infraestrutura,
Arquitetamos uma solução para que todos os nossos microsserviços e usuários se conectem aos bancos de dados usando credenciais temporárias,
Atualizamos nossa plataforma de continuous delivery para usar GitOps, sem interromper os fluxos de trabalho do desenvolvedor (realizamos mais de 150 deploys em produção diariamente),
Criamos pipelines de dados para analisar nossas métricas de incidentes,
Oferecemos workshops sobre implantação e monitoramento de aplicativos no Kubernetes,
Planejamos e executamos a segmentação das contas AWS,
Trabalhamos em conjunto com os desenvolvedores para solucionar problemas complexos em nosso ambiente de produção,
Trabalhamos em conjunto com os desenvolvedores para criar SLOs para latência e taxa de erro para nossas APIs,
Construímos ferramentas para garantir a segurança de nossos sistemas sem onerar a operação.

O que estamos procurando:

Tenha alguma experiência em programação (gostamos muito de Golang!),
Experiência com o sistema operacional GNU/Linux,
Experiência com containers Docker,
Experiência com AWS, GCP ou Azure.

O que seria diferencial se tivesse:

Conheça Orquestração de containers (Kubernetes, ECS, Mesos, Docker Swarm),
Possua experiência no desenvolvimento de microsserviços com Golang, Python, NodeJS ou Java,
Conheça infraestrutura como código (Terraform, Ansible, CloudFormation, Chef, Puppet),
Possua experiência no gerenciamento de clusters Kafka, Zookeeper e/ou ElasticSearch,
Conheça métricas e sistemas de tracing (Prometheus, Grafana, Jaeger, Zipkin),
Conheça SLOs e SLIs e tê-los implementado no passado,
Possua experiência como instrutor ou gosta de fazer apresentações e escrever especificações técnicas,
Tenha participação ativa na comunidade de tecnologia como palestrante ou organizador de eventos, escritor de artigos técnicos ou contribuidor de projetos open sources,

Acima de tudo, o requisito mais importante é a vontade de aprender, então sinta-se à vontade para se inscrever, mesmo se você achar que não está pronto!

Benefícios

Salário competitivo (Contrato CLT),
Ticket refeição (vale-alimentação e/ou vale-refeição),
Auxílio transporte,
Assistência médica,
Assistência odontológica (opcional),
Seguro de vida,
Auxílio creche,
Auxílio para prática de atividades físicas (Gympass),
Licença maternidade e paternidade estendidas,
Espaço para amamentação,
Desconto em estacionamento nos nossos escritórios,
Translado gratuito das estações Vila Madalena e Fradique Coutinho até o escritório,
Bicicletário gratuito no estacionamento.

NetCarreiras