[ES] CIENTISTA DE DADOS - SÊNIOR
iblue Consulting
Descrição da vaga
Ouvir, criar e inspirar a transformação digital dos nossos clientes é o que nos motiva.
De pessoas para pessoas 😍
Acreditamos que, mais do que tecnologia, a transformação digital é sobre como as pessoas conduzem as mudanças nas empresas. E por entender isso, o fator humano é o que nos faz evoluir e modernizar processos.
Não é somente mais uma oportunidade... e sim um convite para você fazer parte dessa história.
Na iblue Consulting você vai trabalhar com uma equipe multidisciplinar, que é responsável por alavancar o crescimento do negócio através das nossas pessoas. 🚀
Buscamos profissionais com os seguintes valores que corroboram com os nossos valores:
- Cuidado com as pessoas;
- Responsabilidade;
- Ética;
- Excelência e Resultados;
- Cliente no centro.
Estamos em busca de um CIENTISTA DE DADOS SÊNIOR com sólida experiência no desenvolvimento de soluções de Machine Learning utilizando Python, SQL, BigQuery e Google Cloud Platform (GCP), com expertise mínima de 5 anos em projetos de dados, modelagem analítica e operacionalização de modelos em produção, que seja apaixonado por inovação e que esteja comprometido com a entrega de soluções de alta qualidade. Se você se identifica com valores como colaboração e comprometimento, essa oportunidade é para você!
Principais Responsabilidades
- Desenvolver, evoluir, validar e operacionalizar modelos de Machine Learning, com foco principal em:
- Predição de Churn;
- Recommendation Systems.
- Atuar na transformação de modelos analíticos ainda não produtivos em soluções confiáveis, escaláveis e monitoráveis em produção;
- Estruturar e implementar fluxos de retreinamento periódico dos modelos, garantindo atualização contínua, consistência e performance;
- Construir e sustentar práticas de MLOps, incluindo:
- Versionamento de modelos;
- Automação de pipelines;
- Monitoramento de performance;
- Controle de data drift e model drift;
- Critérios de promoção de modelos para produção.
- Trabalhar em parceria com times de dados, engenharia e áreas de negócio para garantir a correta aplicação dos modelos e geração de valor mensurável;
- Realizar exploração, preparação e transformação de dados para criação de variáveis relevantes e melhoria contínua dos modelos;
- Garantir a evolução da maturidade analítica da operação, contribuindo para que iniciativas de Machine Learning saiam do ambiente experimental e passem a gerar resultado efetivo para o negócio.
Contexto Técnico de Atuação no Projeto
- O profissional atuará em um ambiente já estruturado pela Engenharia de Dados, com arquitetura analítica organizada no modelo medalhão (Bronze, Silver e Gold) e pipelines de ingestão já consolidados em Google Cloud Platform (GCP);
- O ecossistema de dados utiliza o BigQuery como Data Warehouse Analítico, com integração de dados provenientes de diferentes fontes, como:
- Google Analytics;
- SAP;
- SQL Server;
- BigQuery.
- Neste cenário, o grande desafio da posição não é construir a base de dados do zero, mas sim tirar os modelos do papel, colocá-los em produção na GCP e garantir sua sustentação operacional, com automação de retreino, monitoramento de desempenho, controle de drift e confiabilidade para consumo pelas áreas de negócio;
- A atuação exigirá forte interface com times técnicos e stakeholders de negócio, sendo essencial combinar capacidade analítica, visão prática de implementação e domínio de boas práticas de produção de modelos.
Requisitos e Qualificações
- Experiência sólida como Cientista de Dados Sênior, Engenheiro de Machine Learning ou função equivalente;
- Experiência prática com desenvolvimento de modelos de Machine Learning supervisionado e não supervisionado;
- Vivência com construção de soluções voltadas para:
- Churn;
- Recomendação;
- Segmentação;
- Propensão;
- Comportamento do usuário.
- Domínio de Python para ciência de dados;
- Domínio de SQL avançado;
- Experiência com BigQuery;
- Experiência com Google Cloud Platform (GCP);
- Conhecimento prático em Vertex AI ou serviços equivalentes para treinamento, deployment e monitoramento de modelos.
- Experiência com:
- Feature engineering;
- Avaliação e validação de modelos;
- Métricas de performance de Machine Learning;
- Análise exploratória de dados;
- Tratamento e manipulação de grandes volumes de dados;
- Versionamento de modelos e experimentos;
- Automação de pipelines;
- Conceitos e aplicação de MLOps.
- Conhecimento em bibliotecas e frameworks como:
- Pandas;
- NumPy;
- Scikit-learn;
- XGBoost, LightGBM ou equivalentes;
- TensorFlow, PyTorch ou similares.
Habilidades Comportamentais
- Perfil analítico, crítico e orientado à solução de problemas;
- Capacidade de transformar desafios de negócio em soluções analíticas aplicáveis;
- Senso de propriedade e responsabilidade sobre entregas ponta a ponta;
- Boa comunicação para interação com públicos técnicos e não técnicos;
- Colaboração e facilidade para atuar em conjunto com times multidisciplinares;
- Proatividade, autonomia e postura executora;
- Comprometimento com qualidade, escalabilidade e geração de valor;
- Resiliência para atuar em cenários de evolução de maturidade analítica e operacional.
Diferenciais
- Experiência anterior com projetos de Churn e Recommendation Systems;
- Vivência com dados oriundos de Google Analytics / GA4;
- Experiência com integração entre Google Analytics e BigQuery;
- Atuação anterior em ambientes com arquitetura de dados em camadas Bronze, Silver e Gold;
- Conhecimento em CI/CD aplicado a Machine Learning;
- Experiência com:
- Feature Store;
- Model Registry;
- Monitoramento automatizado de modelos;
- Testes automatizados para pipelines de dados e modelos;
- Construção de APIs para exposição de predições ou recomendações;
- Cloud Run ou serviços equivalentes.
- Experiência em ambientes de dados modernos com foco em produção de modelos e geração de valor para áreas de negócio.
