ENGENHEIRO DE DADOS PL
Stefanini Group
Descrição da vaga
Na Stefanini, acreditamos no poder da colaboração. Co-criamos soluções inovadoras em parceria com nossos clientes, combinando tecnologia de ponta, inteligência artificial e a criatividade humana. Estamos na vanguarda da resolução de problemas de negócios, proporcionando impacto real em escala global.Ao se juntar à Stefanini, você se torna parte de uma jornada global de transformação. Estamos empenhados em criar impacto positivo não apenas nos negócios, mas também na vida de nossos colaboradores. Se você procura uma oportunidade de crescimento profissional em uma empresa que valoriza inovação, respeito, autonomia e parceria, você encontra aqui!Junte-se a nós e seja parte da mudança!Modelo de trabalho- Híbrido - DF#LI-AA2Responsabilidades e atribuiçõesBuscamos um(a) Engenheiro(a) de Dados Pleno para atuar na construção e evolução de pipelines de dados voltados à alimentação de soluções de Inteligência Artificial, com foco em RAG (Retrieval-Augmented Generation) e construção de matriz de conhecimento corporativa.O(a) profissional será responsável por transformar dados estruturados e não estruturados em ativos prontos para consumo por modelos de IA, garantindo qualidade, governança e performance dos dados.Responsabilidades:Atuar no desenvolvimento de pipelines de ingestão, transformação e enriquecimento de dados para uso em IATrabalhar com dados estruturados e não estruturados (textos, PDFs, HTML, áudios, entre outros)Implementar processos de chunking, embeddings e indexação vetorialConstruir e manter datasets voltados à matriz de conhecimento corporativaDesenvolver pipelines utilizando Databricks (Spark / PySpark)Atuar com arquitetura medalhão (bronze, prata e ouro)Integrar dados com bancos vetoriais (Azure AI Search, pgvector, entre outros)Garantir performance, escalabilidade e confiabilidade dos pipelinesAplicar boas práticas de qualidade de dados (completude, consistência e versionamento)Implementar políticas de atualização, retenção e expurgo de dadosGarantir rastreabilidade e auditabilidade dos dados utilizados pelos modelosAtuar em conjunto com times de AI/ML na preparação e otimização de dadosApoiar estratégias de recuperação de informação (RAG)Otimizar dados para melhorar a relevância e precisão das respostas dos modelosRequisitos e qualificaçõesFormaçãoEnsino superior completo em Tecnologia da Informação, Engenharia, Sistemas de Informação ou áreas correlatasConhecimentos necessáriosExperiência sólida em engenharia de dadosConhecimento em Python e/ou PySparkExperiência com Databricks e Spark (batch e/ou streaming)Experiência com pipelines de dados (ETL/ELT)Modelagem de dados (Data Lake / Lakehouse)Experiência com dados não estruturados (documentos, textos, etc.)Integração e consumo de APIsHabilidades técnicasCapacidade de atuar com autonomia na construção de pipelinesConhecimento em arquitetura moderna de dadosExperiência com processamento e preparação de dados para IAAtuação em ambientes complexos com múltiplas integraçõesCompetências comportamentaisCapacidade analítica e pensamento estruturadoAutonomia e postura investigativaFacilidade para lidar com dados não estruturadosBoa comunicação e colaboração com times multidisciplinaresRequisitos desejáveisExperiência com RAG (Retrieval-Augmented Generation)Conhecimento em embeddings e bancos vetoriaisExperiência com chunking de documentosVivência com LangChain ou frameworks similaresConhecimento em OpenAI, Azure OpenAI ou outros LLMsConhecimento em indexação semântica e busca vetorialExperiência com ingestão de documentos corporativos (PDF, Word, HTML)Vivência com pipelines de dados voltados para IAExperiência em ambientes corporativos complexos ou projetos de grande porteInformações adicionais🍛 Vale-alimentação ou vale-refeição;👨🏼🎓 Desconto em cursos, universidades e instituições de idiomas;📚 Academia Stefanini — plataforma com cursos on-line, gratuitos, atualizados e com certificado;🗣 Mentoring;💉 Clube de vantagens para consultas e exames;🏥 Assistência médica;🦷 Assistência odontológica;💰 Clube de vantagens e descontos nos melhores estabelecimentos;🛫 Clube de viagens;🐶 Convênio para pets.
