Projetar, desenvolver e implementar soluções de engenharia de dados robustas e escaláveis, assegurando a qualidade e disponibilidade dos dados. Processar, transformar e gerenciar grandes volumes de dados provenientes de diversas fontes (transacionais, streaming, NoSQL, etc.). Estabelecer e manter pipelines ETL eficientes e tolerantes a falhas, movendo dados de diferentes origens para destinos como data warehouses e sistemas de armazenamento distribuído. Projetar estratégias de governança de dados suportadas por soluções orientadas a dados (data-driven). Colaborar estreitamente com equipes de Machine Learning, Ciência de Dados e Negócios para entender suas necessidades e traduzir os requisitos de dados em soluções técnicas. Otimizar o desempenho da infraestrutura de dados e assegurar as melhores práticas no desenvolvimento de software e na gestão do ciclo de vida dos dados. Demonstrar experiência sólida no uso de Python para manipulação, transformação e integração de dados. Saber aplicar conhecimentos em bibliotecas Python voltadas ao processamento eficiente de grandes volumes de dados. Possuir experiência em projeção e implementação arquiteturas de dados robustas, desenvolvendo soluções escaláveis e documentadas. Conhecer profundamente técnicas, ferramentas e melhores práticas para movimentação e processamento ETL. Dominar bancos de dados relacionais, não relacionais, distribuídos e data warehouses variados. Utilizar ambientes de Big Data, especialmente no Google Cloud, e compreender o funcionamento de metastore para gerenciamento avançado de dados.