Analista de BI Sênior
Qintess Ver todas as vagas
- São Paulo - SP
- Permanente
- Período integral
- Liderar, junto à squad (engenharia, arquitetura, produto e segurança), o desenho e evolução dos componentes de IA do backend.
- Definir e padronizar:
- Contratos de APIs (REST)
- Estrutura de respostas
- Rastreabilidade e evidências
- Projetar e implementar fluxos:
- Síncronos (ex: chat em tempo real)
- Assíncronos (ex: ingestão e reprocessamento em lote)
- Desenvolver e otimizar serviços de inferência de LLMs, com foco em:
- Performance (latência e throughput)
- Uso eficiente de GPU
- Observabilidade
- Criar e manter pipelines de RAG (Retrieval-Augmented Generation):
- Extração e normalização de documentos (PDF, HTML, imagens com OCR)
- Processamento (chunking e embeddings)
- Enriquecimento de metadados
- Armazenamento e consulta
- Gerenciar ciclo de vida dos dados e índices:
- Versionamento
- Atualizações (upsert/delete)
- Rebuild e rollback
- Monitorar continuamente os sistemas:
- Métricas de qualidade e performance
- Dashboards
- Auditoria e rastreabilidade
- Garantir conformidade com:
- LGPD
- Controle de acesso (RBAC)
- Boas práticas de governança de dados
- Apoiar a definição de requisitos e comunicação técnica com stakeholders.
- Mínimo de 5 anos de experiência na área.
- Experiência prática com:
- Machine Learning aplicado
- IA Generativa (LLMs)
- Arquiteturas com RAG
- Vivência em ambientes de produção com:
- Monitoramento
- Logs e métricas
- Gestão de incidentes
- SLOs
- Linguagens e IA
- Python avançado
- Prompt Engineering
- NLP e embeddings
- Arquitetura & Integração
- APIs REST
- Arquiteturas baseadas em serviços
- Infraestrutura
- Docker
- Ambientes conteinerizados (ex: Nomad)
- Execução com GPUs (otimização de performance)
- Dados e Busca
- Vector databases (ex: Milvus)
- Busca híbrida (ex: Elasticsearch)
- Modelagem de índices, metadados e escalabilidade
- Engenharia e DevOps
- Git / GitFlow / GitLab
- CI/CD
- Boas práticas de código, testes e documentação
- Experiência em:
- Setor público / govtech
- Ambientes regulados e auditáveis
- Ingestão de documentos complexos:
- OCR
- Extração estruturada
- MLOps:
- Airflow
- MLflow
- Governança de modelos e dados
- Avaliação automatizada de RAG/LLMs