
CIENTISTA DE DADOS - Santos/SP
- Santos - SP
- Permanente
- Período integral
- · Auxiliar e dar suporte ao time na limpeza do Dataset e em Feature Engineering;
- · Trabalhar em conjunto com o engenheiro de dados na criação de Datasets, no formato necessário para treinamento de múltiplos modelos de machine learning;
- · Limpar, Analisar, organizar, integrar dados e ajudar na criação de pipelines de dados;
- · Atuar em análises exploratórias e descritivas, bem como na modelagem preditiva, aplicando aprendizado de máquina;
- · Aplicar melhorias contínuas dos modelos que compõem a ferramenta SISMO®DEEPBLUE;
- · Analisar e aplicar melhorias na arquitetura de dados, com comunicação direta com os desenvolvedores e/ou Arquiteto de Dados;
- · Liderar reuniões de apresentações orais e escritas, bem como relatórios sobre os resultados, para clientes, sócios e outros stakeholders;
- · Desenvolver relatórios de análise de dados, performance da previsão e desenvolvimento dos modelos preditivos, direcionados aos clientes;
- · Usar PCA para possíveis experimentos que envolvam redução de dimensionalidade.
- · Usar notebooks como o Jupyter e/ou Google Colab;
- · Desenvolver e melhorar modelos de IA para análise e previsão de séries temporais meteoceanográficas;
- · Aplicar técnicas de processamento, qualidade e validação de dados (ex.: QARTOD/NOAA);
- · Trabalhar em conjunto com oceanógrafos e engenheiros na interpretação dos resultados;
- · Contribuir para a evolução da nossa plataforma de análise e visualização de dados.
- Mínimo 3 anos em Ciências de dados e 5 anos em análise de dados e séries temporais;
- Superior completo em Oceanografia, Meteorologia ou áreas correlatas. Especialização em Ciência de Dados;
- · Redação de documentos técnicos;
- Inglês e espanhol avançado para leitura, escrita (manuais, documentos técnicos e e-mails) e conversação;
- Excel avançado (domínio de funções como PROCV e SE; tabela dinâmica e dashboards); · Word intermediário (formatação, referência cruzada, índice);
- Experiência com análise exploratória de dados meteo-oceanográficos;
- Experiência no emprego de técnicas estatísticas e modelagem preditiva;
- Experiência com Data Cleaning & Prep e estatística Descritiva para análise inicial dos dados;
- Experiência em programação com utilização da linguagem Python 3.x e seus pacotes para análise de dados como por exemplo, Scikit-Learn, TensorFlow, Pandas, Numpy, dentre outras;
- Experiência em análise de dados com aplicação dos algoritmos de Deep Learning, estes essenciais para o projeto como MLP, LSTM, CNNs etc. com uso de Python;
- Experiência em análise e modelagem de séries temporais;
- Algoritmos árvores de Decisão, Random Forest, Regressões, KNN dentre outros, com uso de Python;
- Conhecimentos em Transfer Learning; · Conhecimento nas linguagens SQL, Shell scripts; ·
- Conhecimento em sistemas gerenciadores de dados;
- Conhecimento em validação e elaboração de documentos (emissão de relatórios direcionados a validação de produtos);
- Conhecimento em desenvolvimento e armazenamento cloud (Nuvem AWS);
- Experiência em ambiente em nuvem (Preferencial AWS) e Ferramentas de Big Data; · Conhecimento em arquitetura de dados;
- Otimização e Melhoria Contínua (otimizar algoritmos e processos, melhorando a eficiência e a precisão dos modelos).