Especialista Observability
Datum Ver todas as vagas
- Brasil
- Permanente
- Período integral
- Definir e evoluir a estratégia de observabilidade (Datadog/Elasticsearch)
- Atuar como referência técnica e promover boas práticas e governança
- Apoiar times técnicos no uso da plataforma e disseminar conhecimento
- Configurar, administrar e otimizar a plataforma de observabilidade
- Gerenciar consumo, retenção de dados, custos e performance
- Definir padrões de tagging, organização de serviços e ambientes
- Garantir escalabilidade, disponibilidade e desempenho da solução
- Implementar instrumentação e telemetria (OpenTelemetry, SDKs, agentes)
- Coletar, correlacionar e enriquecer métricas, logs e traces
- Mapear dependências entre serviços e componentes
- Analisar performance (latência, erros, throughput, disponibilidade)
- Atuar em troubleshooting e análise de causa raiz (RCA)
- Investigar incidentes e gargalos em sistemas distribuídos
- Criar dashboards, alertas e monitoramentos acionáveis
- Implementar detecção de anomalias e correlação de eventos
- Desenvolver consultas, notebooks e análises técnicas
- Criar automações e workflows operacionais
- Integrar com ferramentas como CI/CD, ITSM, APIs e webhooks
- Automatizar onboarding de serviços e configurações
- Apoiar integração com DevOps, cloud e Kubernetes
- Traduzir dados técnicos para áreas de negócio e liderança
- Apoiar decisões estratégicas com base em dados
- Contribuir para melhoria contínua dos processos de operação e confiabilidade
- Experiência com Datadog ou Elasticsearch (implementação, administração e evolução)
- Gestão de agentes e coletores
- Políticas de retenção de dados
- Tuning de performance
- Gestão de consumo e licenciamento
- Organização e governança da plataforma
- Instrumentação de aplicações (automática e manual)
- OpenTelemetry e telemetria distribuída
- Análise e correlação de métricas, logs e traces
- Troubleshooting avançado e análise de causa raiz (RCA)
- Profiling e distributed tracing
- Criação de dashboards, alertas, consultas e notebooks
- Workflows e automações dentro da ferramenta
- Integrações via APIs, webhooks e conectores nativos
- Integração com ferramentas ITSM/CMDB e monitoramento
- Experiência com ambientes cloud
- Aplicações distribuídas
- Kubernetes/EKS e monitoramento de containers
- Metodologias ágeis (Scrum e Kanban)
- Experiência em ambientes com Kubernetes de grande porte e missão crítica
- Domínio avançado em Datadog ou Elasticsearch
- Experiência com alta volumetria de dados e arquitetura distribuída
- Vivência em operações 24x7 com alta disponibilidade e resiliência
- Experiência com suporte a aplicações críticas (varejo, financeiro, logística ou e-commerce)
- Conhecimento em observabilidade aplicada a microsserviços, APIs e mensageria
- Experiência em ambientes híbridos e cloud
- Integração entre observabilidade e incident/problem management
- Automação de observabilidade como código
- Atuação como referência técnica e multiplicador de conhecimento
- Para sua saúde, oferecemos assistência médica e odontológica sem coparticipação em exames e consultas.
- Quer mais bem-estar? Oferecemos Gympass e Zenklub (com duas sessões gratuitas por mês) para você cuidar da sua saúde física e mental.
- Quando bater aquela fome, utilize nosso benefício de alimentação Caju para fazer compras em qualquer supermercado ou restaurante.
- Ama viajar? Aqui temos o Férias & Co, um benefício que te ajuda a viabilizar aquela viagem dos sonhos.
- Tem filhos? Conte com o auxílio creche.
- Família crescendo? Temos o MomCare, um incentivo monetário flexível pós licença maternidade para as novas mamães datunianas.
- Para deixar seu ambiente de trabalho com a sua cara, conte com o nosso auxílio home office.
- Quer investir no seu desenvolvimento profissional? Temos parcerias com várias instituições de ensino de renome para oferecer a você descontos que podem chegar a 70% em cursos de graduação, pós-graduação, MBAs, idiomas e muito mais!