Cientista De Dados Para Lauro De Freitas
Tata Consultancy Services Ver todas as vagas
- Lauro de Freitas - BA
- Permanente
- Período integral
Requisito:Cientista de Dados – TerraMagnaCom 8 anos de história, a TerraMagna vive a missão de tornar a agricultura tudo aquilo que o mundo precisa que ela seja. Hoje atua como financiadora da cadeia de insumos do agronegócio, visando ser seu sistema operacional e principal parceiro financeiro.O Desafio e o Time de ModelagemComo uma startup em constante desenvolvimento, nosso ambiente é dinâmico e exige autonomia. O Time de Modelagem é enxuto e focado em resolver problemas complexos de risco de crédito e de análise de dados no agronegócio. Buscamos um Cientista de Dados experiente, com perfil voltado para mentoria e trabalho em equipe.Valorizamos pessoas movidas a novos desafios, capazes de desbravar o agronegócio e nos ajudar na nossa principal missão: levar para o agronegócio o insumo mais importante: o crédito.
- Desenvolver, implementar e monitorar modelos estatísticos e de machine learning, especialmente modelos de credit scoring e análise de risco.
- Produtizar os modelos, trabalhando de forma autônoma desde a concepção até a implementação em ambiente de produção.
- Colaborar com a liderança técnica na definição da arquitetura de dados e nas escolhas tecnológicas do time.
- Traduzir problemas complexos de negócio em soluções baseadas em dados, comunicando os resultados de forma clara para audiências técnicas e não técnicas.
- Colaborar dinamicamente com os times de produto e engenharia.
- Manter-se atualizado com tendências e melhores práticas em Engenharia e Ciência de Dados.
- 3+ anos de experiência atuando como Cientista de Dados, preferencialmente em ambientes de startup ou empresas de tecnologia.
- Domínio em probabilidade e estatística e em modelos de machine learning supervisionados e não supervisionados.
- Domínio em Python e principais bibliotecas para Ciência de Dados (Pandas, NumPy, Scikit-learn, TensorFlow, etc.).
- Forte conhecimento em SQL (modelagem, performance e manipulação de grandes volumes de dados).
- Experiência no desenvolvimento e operacionalização de pipelines de machine learning ponta a ponta em produção.
- Experiência com práticas de engenharia para produção de modelos, incluindo versionamento de código com Git/Github, deploy em nuvem, automação de fluxos e suporte ao monitoramento e manutenção dos modelos em produção.
- Familiaridade com serviços em nuvem, preferencialmente Google Cloud Platform (GCP).
- Perfil proativo, com capacidade para atuar em problemas ambíguos, autonomia analítica e excelente habilidade de comunicação para alinhamento com múltiplos stakeholders.
- Interesse genuíno em evoluir tecnicamente em um ambiente dinâmico de fintech.
- Formação acadêmica em Estatística, Ciência da Computação, Ciência de Dados, Engenharias, Matemática, Física, Economia ou áreas correlatas.
- Experiência prévia com modelagem de risco de crédito, credit scoring ou detecção de fraudes.
- Conhecimento de metodologias de inferência causal e experimentação.
- Experiência em projetos envolvendo metaheurísticas aplicadas a problemas de otimização combinatória.
- Conhecimento ou experiência prévia no setor do Agronegócio (AgTech) ou em serviços financeiros.
- Conhecimento em manuseio de dags (Airflow ou similar) para composição de bases de dados para análises exploratórias e treinamento de modelos.
- Ajudar a melhorar a alfabetização de dados e o ambiente analítico geral na empresa.
- Manipular dados estruturados e não estruturados usando SQL e outras linguagens de programação.
- Realizar análises avançadas de dados e reportar resultados.
- Construir modelos preditivos e algoritmos de aprendizado de máquina.
- Combinar modelos através de modelagem de conjunto.
- Propor soluções e estratégias para os desafios do negócio.
- Participar de experimentos e testes de hipóteses.
- Colaborar com gerentes de produto para criar produtos de dados.
- 3+ anos de experiência com Data Science / Data Engineering, machine learning, IA e estatística.
- Proficiência em SQL e em Python, R ou outra linguagem de programação importante.
- Experiência prática com aprendizado de máquina (classificação, regressão, clustering, redes neurais, validação cruzada).
- Forte conhecimento em probabilidade e estatística, desenho experimental, modelagem preditiva, otimização e inferência causal.
- Experiência prática com AWS, especialmente SageMaker, Bedrock e outros serviços de ML.
- Habilidades de comunicação e capacidade de colaborar com usuários não técnicos.
- Certificações AWS (por exemplo, AWS Certified AI Practitioner).
- Experiência com automação e scripts (por exemplo, Terraform, Python).
- Habilidades de visualização de dados e storytelling.
- Construir modelos e algoritmos de aprendizado de máquina, incluindo regulagem de hiperparâmetros.
- Desenvolver pipelines de dados robustos, garantindo qualidade, governança e confiabilidade.
- Colaborar com gerentes de produto para criar soluções de dados inovadoras.
- Propor estratégias de melhoria e alfabetização de dados na empresa.
- Participar ativamente nas decisões de capítulo de Data Science / Data Engineering.
- Experiência profunda em Python, R ou outra linguagem de programação responsável.
- Proficiência em SQL e em manipulação de dados em large scale.
- Experiência em modelos de ML em produção, incluindo batch e real‑time processing.
- Conhecimento prático de IA generativa e em serviços AWS (SageMaker, Bedrock).
- Desenhar agentes, ferramentas de calling e prompts para casos de uso reais.
- Construir pipelines de RAG (ingestão, chunking, embeddings, retrieval, reranking).
- Definir guardrails de segurança, privacidade e compliance.
- Desenvolver estratégia de avaliação de métricas e testes.
- Otimizar qualidade e custo de latência e contexto.
- Parceria com engenharia para produção, logs, auditoria e monitoramento.
- Experiência prática com LLMs e IA aplicada (agentes, prompting, RAG).
- Boa base em Python e engenharia de experimentação.
- Conhecimento de vetores/embeddings, busca híbrida e reranking.
- Familiaridade com avaliação de qualidade e redução de erro.
- Capacidade de comunicar decisões técnicas de forma clara.
- Desenvolver e testar modelos de deep learning e machine learning para dados espaciais.
- Integrar dados estruturados e não estruturados em pipelines.
- Aplicar visão computacional, CNN e NLP em imagens de satélite e radar.
- Garantir qualidade, validação e manutenção da solução.
- Colaborar na construção de agentes inteligentes e em iniciativas de inovação.
- Formação em Matemática, Estatística ou Engenharias com foco em dados.
- Experiência em SQL, NoSQL e manipulação de dados espaciais.
- Conhecimento em GIS, sensoriamento remoto e geoprocessamento.
- Habilidade em Python, ciência de dados e técnicas de ML.
- Experiência em bol tanto em projetos de compliance quanto em ambientes regulados.
- Desenvolver, testar e refinar prompts (Chain-of-Thought, Few-shot, ReAct).
- Construir e evoluir agentes de IA baseados em LLMs.
- Avaliar performance de modelos e agentes para casos de uso.
- Preparar e estruturar dados para alimentar modelos de linguagem.
- Garantir diretrizes de segurança e governança.
- Integrar soluções IA gerativa em produtos e sistemas.
- Formação em Estatística, Matemática, Engenharia ou Ciência da Computação.
- Experiência prática no desenvolvimento de prompts e agentes de IA com LLMs.
- Experiência em manipulação de dados em SQL.
- Experiência com modelagem preditiva e machine learning.
- Conhecimento do mercado de crédito ou produtos financeiros.
Salário:A combinar
Benefícios:Não foi informado
Vagas em Salvador