[ES] CIENTISTA DE DADOS - SÊNIOR

iblue Consulting

📍 São Paulohibrido

Descrição da vaga

Ouvir, criar e inspirar a transformação digital dos nossos clientes é o que nos motiva.

De pessoas para pessoas 😍

Acreditamos que, mais do que tecnologia, a transformação digital é sobre como as pessoas conduzem as mudanças nas empresas. E por entender isso, o fator humano é o que nos faz evoluir e modernizar processos.

Não é somente mais uma oportunidade... e sim um convite para você fazer parte dessa história.

Na iblue Consulting você vai trabalhar com uma equipe multidisciplinar, que é responsável por alavancar o crescimento do negócio através das nossas pessoas. 🚀

Buscamos profissionais com os seguintes valores que corroboram com os nossos valores:

Cuidado com as pessoas;
Responsabilidade;
Ética;
Excelência e Resultados;
Cliente no centro.

Estamos em busca de um CIENTISTA DE DADOS SÊNIOR com sólida experiência no desenvolvimento de soluções de Machine Learning utilizando Python, SQL, BigQuery e Google Cloud Platform (GCP), com expertise mínima de 5 anos em projetos de dados, modelagem analítica e operacionalização de modelos em produção, que seja apaixonado por inovação e que esteja comprometido com a entrega de soluções de alta qualidade. Se você se identifica com valores como colaboração e comprometimento, essa oportunidade é para você!

Principais Responsabilidades

Desenvolver, evoluir, validar e operacionalizar modelos de Machine Learning, com foco principal em:
- Predição de Churn;
- Recommendation Systems.
Atuar na transformação de modelos analíticos ainda não produtivos em soluções confiáveis, escaláveis e monitoráveis em produção;
Estruturar e implementar fluxos de retreinamento periódico dos modelos, garantindo atualização contínua, consistência e performance;
Construir e sustentar práticas de MLOps, incluindo:
- Versionamento de modelos;
- Automação de pipelines;
- Monitoramento de performance;
- Controle de data drift e model drift;
- Critérios de promoção de modelos para produção.
Trabalhar em parceria com times de dados, engenharia e áreas de negócio para garantir a correta aplicação dos modelos e geração de valor mensurável;
Realizar exploração, preparação e transformação de dados para criação de variáveis relevantes e melhoria contínua dos modelos;
Garantir a evolução da maturidade analítica da operação, contribuindo para que iniciativas de Machine Learning saiam do ambiente experimental e passem a gerar resultado efetivo para o negócio.

Contexto Técnico de Atuação no Projeto

O profissional atuará em um ambiente já estruturado pela Engenharia de Dados, com arquitetura analítica organizada no modelo medalhão (Bronze, Silver e Gold) e pipelines de ingestão já consolidados em Google Cloud Platform (GCP);
O ecossistema de dados utiliza o BigQuery como Data Warehouse Analítico, com integração de dados provenientes de diferentes fontes, como:
- Google Analytics;
- SAP;
- SQL Server;
- BigQuery.
Neste cenário, o grande desafio da posição não é construir a base de dados do zero, mas sim tirar os modelos do papel, colocá-los em produção na GCP e garantir sua sustentação operacional, com automação de retreino, monitoramento de desempenho, controle de drift e confiabilidade para consumo pelas áreas de negócio;
A atuação exigirá forte interface com times técnicos e stakeholders de negócio, sendo essencial combinar capacidade analítica, visão prática de implementação e domínio de boas práticas de produção de modelos.

Requisitos e Qualificações

Experiência sólida como Cientista de Dados Sênior, Engenheiro de Machine Learning ou função equivalente;
Experiência prática com desenvolvimento de modelos de Machine Learning supervisionado e não supervisionado;
Vivência com construção de soluções voltadas para:
- Churn;
- Recomendação;
- Segmentação;
- Propensão;
- Comportamento do usuário.
Domínio de Python para ciência de dados;
Domínio de SQL avançado;
Experiência com BigQuery;
Experiência com Google Cloud Platform (GCP);
Conhecimento prático em Vertex AI ou serviços equivalentes para treinamento, deployment e monitoramento de modelos.
Experiência com:
- Feature engineering;
- Avaliação e validação de modelos;
- Métricas de performance de Machine Learning;
- Análise exploratória de dados;
- Tratamento e manipulação de grandes volumes de dados;
- Versionamento de modelos e experimentos;
- Automação de pipelines;
- Conceitos e aplicação de MLOps.
Conhecimento em bibliotecas e frameworks como:
- Pandas;
- NumPy;
- Scikit-learn;
- XGBoost, LightGBM ou equivalentes;
- TensorFlow, PyTorch ou similares.

Habilidades Comportamentais

Perfil analítico, crítico e orientado à solução de problemas;
Capacidade de transformar desafios de negócio em soluções analíticas aplicáveis;
Senso de propriedade e responsabilidade sobre entregas ponta a ponta;
Boa comunicação para interação com públicos técnicos e não técnicos;
Colaboração e facilidade para atuar em conjunto com times multidisciplinares;
Proatividade, autonomia e postura executora;
Comprometimento com qualidade, escalabilidade e geração de valor;
Resiliência para atuar em cenários de evolução de maturidade analítica e operacional.

Diferenciais

Experiência anterior com projetos de Churn e Recommendation Systems;
Vivência com dados oriundos de Google Analytics / GA4;
Experiência com integração entre Google Analytics e BigQuery;
Atuação anterior em ambientes com arquitetura de dados em camadas Bronze, Silver e Gold;
Conhecimento em CI/CD aplicado a Machine Learning;
Experiência com:
- Feature Store;
- Model Registry;
- Monitoramento automatizado de modelos;
- Testes automatizados para pipelines de dados e modelos;
- Construção de APIs para exposição de predições ou recomendações;
- Cloud Run ou serviços equivalentes.
Experiência em ambientes de dados modernos com foco em produção de modelos e geração de valor para áreas de negócio.