Engenheiro(a) de IA Conversacional e LLMs Sr. - Foco em Agentes Inteligentes e Canais Digitais
Winover Contact Center Ver todas as vagas
- Mogi das Cruzes - SP
- Permanente
- Período integral
- Projetar e desenvolver agentes conversacionais baseados em LLMs para canais digitais.
- Criar fluxos conversacionais e arquiteturas agentic, utilizando padrões como:
- Plan-and-Execute
- ReAct (Reasoning + Acting)
- Self-Reflection / Self-Critique
- Implementar workflows multiagentes, com delegação de tarefas e cooperação entre agentes.
- Projetar, documentar e otimizar prompts estruturados para diferentes cenários de uso.
- Implementar estratégias de gestão de contexto e memória conversacional.
- Desenvolver context builders, pipelines de enriquecimento e controle de tokens.
- Implementar Tool Use (Function Calling) para integração com APIs externas.
- Definir esquemas JSON seguros e robustos para execução de ferramentas.
- Tratar erros de execução e criar mecanismos de fallback para agentes.
- Implementar arquiteturas de Retrieval Augmented Generation (RAG).
- Desenvolver pipelines de:
- ingestão de documentos
- geração de embeddings
- indexação semântica
- Aplicar estratégias como:
- Query Expansion
- Hybrid Search (keyword + semantic)
- Re-ranking de resultados
- Self-querying retrieval.
- Analisar logs de conversas, métricas de qualidade e feedback dos usuários.
- Monitorar métricas como:
- taxa de resolução
- fallback
- latência
- custo por token
- Construir datasets de avaliação e testes automatizados para evolução contínua dos agentes.
- Conduzir experimentos A/B em prompts e fluxos conversacionais.
- Desenvolver scripts e pipelines em Python para automações e integrações.
- Integrar LLMs em arquiteturas orientadas a eventos e sistemas assíncronos, suportando alta escala em canais como WhatsApp e Telegram.
- Colaborar com times de Backend, Produto e UX Writing para garantir consistência técnica e linguística.
- Formação em Engenharia de Software, Ciência da Computação, Inteligência Artificial, Linguística Computacional ou áreas correlatas.
- Experiência no desenvolvimento de chatbots ou agentes conversacionais em plataformas como: Blip, Dialogflow, Twilio, Zenvia ou frameworks próprios.
- Experiência sólida com Python, incluindo: consumo e integração com APIs REST; automações e scripts; manipulação e processamento de dados.
- Experiência com Modelos de Linguagem Generativa (LLMs) e suas APIs, como:
- OpenAI (GPT), Anthropic (Claude), Gemini, Mistral ou outros modelos open-source.
- Conhecimento prático de conceitos de LLMs e Prompt Engineering, incluindo:
- tokens, embeddings, contexto, temperatura, few-shot learning e chain-of-thought.
- Experiência com versionamento de código (Git) e ferramentas de testes de API como Postman.
- Boa comunicação, pensamento analítico e atenção a detalhes.
- Experiência com frameworks de orquestração de agentes e aplicações com LLMs, como: LangChain, LlamaIndex, LangGraph, CrewAI, AutoGen ou Agno.
- Experiência com arquiteturas de agentes (Agentic Workflows), utilizando padrões como: Plan-and-Execute, ReAct, Self-Reflection e delegação entre agentes.
- Experiência com arquiteturas RAG (Retrieval Augmented Generation), incluindo:
- criação de embeddings
- pipelines de ingestão de conhecimento
- uso de vector databases.
- Experiência com APIs de IA como OpenAI, Anthropic, Gemini ou Azure OpenAI.
- Experiência com Python aplicado a pipelines de LLMs, incluindo automações, experimentação, ETL de prompts e testes A/B.
- Experiência com gestão de memória conversacional, utilizando ferramentas como Zep ou MemGPT.
- Conhecimento em deploy e otimização de modelos open-source (Llama, Mistral), incluindo vLLM ou Ollama.
- Noções de UX Writing e Design Conversacional.
- Inglês técnico para leitura de documentação, papers e APIs.
- Modalidade de contratação: Pessoa Jurídica (PJ).
- Atuação remota ou híbrida (a depender da localidade e dinâmica do time).
- Ambiente colaborativo com foco em entregas ágeis, aprendizado contínuo e inovação.