
Cientista de Dados Pleno
- Curitiba - PR
- Permanente
- Período integral
- Desenvolver e otimizar modelos de Machine Learning para prever padrões e identificar anomalias em operações de comércio exterior.
- Implementar sistemas ensemble (Random Forest, XGBoost, LightGBM) para maximizar a acurácia e cobertura das predições.
- Processar e analisar dados de grande escala (milhões de registros), aplicando técnicas de sampling e otimização de performance.
- Aplicar técnicas avançadas de NLP e extração de entidades.
- Construir e otimizar pipelines de dados robustos, integrando múltiplas fontes para alimentar modelos em produção.
- Colaborar com equipes de negócios para traduzir desafios do domínio aduaneiro em soluções analíticas inovadoras.
- Implementar sistemas de monitoramento e retreinamento de modelos para garantir performance consistente em ambiente de produção.
- Experiência prática no desenvolvimento de modelos de Machine Learning, com foco em classificação multiclasse e cenários de dados desbalanceados.
- Habilidade comprovada em processamento e análise de datasets de grande escala, utilizando técnicas de otimização.
- Conhecimento e experiência na implementação de modelos de gradient boosting (XGBoost, LightGBM) e fine-tuning de hiperparâmetros.
- Experiência no tratamento de dados categóricos de alta cardinalidade e engenharia de features.
- Conhecimento em validação temporal de modelos e estratégias de split para dados de série temporal.
- Familiaridade com modelos de linguagem e NLP, incluindo processamento de texto em português para extração de entidades e classificação (ex: spaCy, FastText, Word2Vec).
- Python avançado (com pandas, numpy, scikit-learn para manipulação e modelagem de dados).
- SQL avançado para queries complexas em datasets relacionais.
- Conhecimento em infraestrutura e produção: AWS (S3, EC2, Sagemaker), Docker e Git.
- Experiência com processamento distribuído de big data (PySpark, Apache Spark).
- Familiaridade com orquestração de pipelines de dados (Airflow).
- Conhecimento em otimização bayesiana (Optuna) e métodos de interpretabilidade de modelos (SHAP, LIME).
- Experiência com ferramentas de visualização (Plotly, Streamlit).
- Conhecimento do sistema aduaneiro brasileiro (NCM, canais aduaneiros, URFs).
- Etapa 2: Bate-papo com Pessoas & Cultura 💜🧡2Bate-papo com Pessoas & Cultura 💜🧡
- Etapa 3: Mão na Massa!3Mão na Massa!
- Etapa 4: Bate-papo com Gestor 💜🧡4Bate-papo com Gestor 💜🧡
- Etapa 5: Bate-papo com Head 💜🧡5Bate-papo com Head 💜🧡
- Etapa 6: Bate-papo com C-Level 💜🧡6 Bate-papo com C-Level 💜🧡
- Etapa 7: E aí, podemos te chamar de Logger?? 💜🧡7E aí, podemos te chamar de Logger?? 💜🧡
- Etapa 8: Contratação8Contratação