ESPECIALISTA DE INFRAESTRUTURA CLOUD
V8.Tech
- São Paulo - SP
- Permanente
- Período integral
- Definir e evoluir a estratégia de observabilidade dos clientes, com forte ênfase na utilização e otimização do ecossistema Elasticsearch/OpenSearch para logs, métricas e traces.
- Projetar, implementar e manter a arquitetura de clusters Elasticsearch/OpenSearch, garantindo escalabilidade, resiliência, segurança e performance em ambientes de produção de larga escala.
- Desenvolver e otimizar pipelines de coleta de dados utilizando Filebeat, Logstash ou agentes customizados para ingestar logs, métricas e traces de diversas fontes (aplicações, infraestrutura, serviços de nuvem, etc.) para o Elasticsearch/OpenSearch.
- Realizar o parsing, normalização e enriquecimento de dados dentro do pipeline de ingestão para garantir a qualidade e a utilidade dos dados de observabilidade.
- Criar e manter dashboards e visualizações perspicazes no Kibana/OpenSearch Dashboards, transformando grandes volumes de dados em insights acionáveis para as equipes de operação e desenvolvimento.
- Configurar e otimizar regras de alerta (utilizando Elastic Alerts, Watcher ou OpenSearch Alerting) para eventos críticos, anomalias e violações de SLOs/SLIs, minimizando falsos positivos e garantindo notificações eficazes.
- Monitorar e otimizar o desempenho e o custo dos clusters Elasticsearch/OpenSearch, incluindo ajuste de índices, gerenciamento do ciclo de vida de dados (ILM/ISM), otimização de queries e estratégias de armazenamento.
- Realizar profiling e tuning de queries e agregations para melhorar a experiência de busca e visualização nos dashboards.
- Colaborar com equipes de Engenharia, SRE e Operações para integrar a observabilidade em todo o ciclo de vida do software.
- Disseminar conhecimento e as melhores práticas de observabilidade e uso do Elasticsearch/OpenSearch para as equipes.
- Experiência em engenharia de observabilidade, SRE ou DevOps, com profunda especialização no ecossistema Elasticsearch/OpenSearch (Elastic Search, Kibana, Logstash, Beats, Elastic Agent, Fleet Server);
- Experiência prática com as funcionalidades de Machine Learning e Inteligência Artificial do Elastic (detecção de anomalias, análise de séries temporais, job management).
- Conhecimentos em OpenSearch;
- Sólidos conhecimentos em extração e manipulação de dados;
- Sólidos conhecimentos de Observabilidade (APM, logs, metricas, synthetics, etc);
- Sólidos conhecimentos em Cloud;
- Sólidos conhecimentos em OpenTelemetry.