
Cientista de Dados (Foco em Engenharia de Dados)
- São José dos Campos - SP
- Permanente
- Período integral
- Digital Transformation - Desenvolvimento de Soluções: Apoiar os projetos de dados das mais variadas áreas de negócio da Embraer, participar da construção da cultura Data-Oriented da Embraer, atuar no aculturamento de boas práticas de uso de dados de âmbito corporativo, visando sempre estar de acordo com questões de segurança, qualidade e solução de problemas de negócio identificados nos projetos.
- Projetar e implementar pipelines robustos para ingestão, processamento e disponibilização de dados em grande escala;
- Garantir a qualidade e a confiabilidade dos dados, lidando com problemas como dados faltantes, inconsistentes ou duplicados;
- Otimizar desempenho de processos ETL/ELT, identificando gargalos e propondo melhorias e ou automatizações;
- Trabalhar com arquiteturas distribuídas e cloud (AWS, Azure ou GCP), aproveitando serviços gerenciados e boas práticas de segurança;
- Colaborar com outras áreas para entender requisitos de dados, modelar soluções adequadas e entregar valor de forma incremental.
- Desenvolver e manter pipelines de dados (ETL/ELT) escaláveis e resilientes;
- Implementar boas práticas de governança, versionamento e monitoramento de dados;
- Participar de discussões de arquitetura e propor soluções técnicas alinhadas às necessidades do negócio;
- Garantir a documentação adequada dos processos e pipelines desenvolvidos;
- Apoiar a evolução contínua do ambiente de dados, propondo automações e melhorias nos processos existentes.
- Superior Completo;
- Inglês fluente/avançado/intermediário para leitura e escrita de documentação técnica e participação de eventos e reuniões;
- Experiência nas principais linguagens de programação voltada a dados (Python, SQL, JavaScript etc);
- Experiência no design de pipelines robustos e escaláveis (ETL/ELT - dbt, Apache NiFi, Talend, Pentaho, Fivetran);
- Experiência em otimizar e automatizar queries, bancos e processos para alto desempenho;
- Experiência em implementação de pipelines e integração de APIs;
- Experiência com: Hadoop, Spark, Parquet, Delta Lake;
- Conhecimento em modelagem de dados projetando modelos eficientes (OLTP, OLAP, data lakes, data warehouses);
- Conhecimento ambientes Cloud e arquiteturas em nuvem (AWS, GCP e Azure);
- Conhecimento e experiência na orquestração e automação (Airflow, etc);
- Conhecimento e experiência em banco de dados relacionais (PostgreSql, MySQL, Oracle) e não-relacionais (MongoDB, Cassandra, Redis).
- Experiência nas ferramentas de streaming de dados: Kafka, Kinesis, Flink;
- Experiência infraestrutura como código (IaC): Terraform, CloudFormation;
- Experiência com versionamento e CI/CD: Git, GitLab CI, Jenkins, AzureDevOps.
- Experiência em containers: Docker, Kubernetes (para deploys e jobs).
- Conhecer conceitos de data governance: catálogo de dados, linhagem, qualidade de dados;
- Ter noções de Machine Learning;
- Conhecimento em monitoramento.
- Seguro de Vida
- Convênio Médico
- Convênio Odontológico
- Benefício Vacina
- Benefício Farmácia
- Gympass
- Cartão Multibenefícios (para modelo de trabalho Híbrido ou 100% remoto)
- Refeitório na empresa
- Auxílio Home Office (para modelo de trabalho Híbrido ou 100% remoto)
- PLR (Participação de Lucros e Resultados)
- Previdência Privada
- Cooperativa
- EMpower (plataforma interna de treinamento e desenvolvimento)
- Etapa 2: Triagem (Screening)2Triagem (Screening)
- Etapa 3: Análise de Perfil (Talent Acquisition)3Análise de Perfil (Talent Acquisition)
- Etapa 4: Análise de Documentação4Análise de Documentação
- Etapa 5: Entrevista com o Time5Entrevista com o Time
- Etapa 6: Finalistas6Finalistas
- Etapa 7: Contratação7Contratação