← Todas as vagas

[ES] CIENTISTA DE DADOS - SÊNIOR

iblue Consulting

📍 São Paulohibrido

Descrição da vaga

Ouvir, criar e inspirar a transformação digital dos nossos clientes é o que nos motiva.

De pessoas para pessoas 😍

Acreditamos que, mais do que tecnologia, a transformação digital é sobre como as pessoas conduzem as mudanças nas empresas. E por entender isso, o fator humano é o que nos faz evoluir e modernizar processos.

Não é somente mais uma oportunidade... e sim um convite para você fazer parte dessa história. 

Na iblue Consulting você vai trabalhar com uma equipe multidisciplinar, que é responsável por alavancar o crescimento do negócio através das nossas pessoas. 🚀

Buscamos profissionais com os seguintes valores que corroboram com os nossos valores:

  • Cuidado com as pessoas;
  • Responsabilidade;
  • Ética;
  • Excelência e Resultados;
  • Cliente no ​​​​​​​centro.

Estamos em busca de um CIENTISTA DE DADOS SÊNIOR com sólida experiência no desenvolvimento de soluções de Machine Learning utilizando Python, SQL, BigQuery e Google Cloud Platform (GCP), com expertise mínima de 5 anos em projetos de dados, modelagem analítica e operacionalização de modelos em produção, que seja apaixonado por inovação e que esteja comprometido com a entrega de soluções de alta qualidade. Se você se identifica com valores como colaboração e comprometimento, essa oportunidade é para você!

Principais Responsabilidades

  • Desenvolver, evoluir, validar e operacionalizar modelos de Machine Learning, com foco principal em:
    • Predição de Churn;
    • Recommendation Systems.
  • Atuar na transformação de modelos analíticos ainda não produtivos em soluções confiáveis, escaláveis e monitoráveis em produção;
  • Estruturar e implementar fluxos de retreinamento periódico dos modelos, garantindo atualização contínua, consistência e performance;
  • Construir e sustentar práticas de MLOps, incluindo:
    • Versionamento de modelos;
    • Automação de pipelines;
    • Monitoramento de performance;
    • Controle de data drift e model drift;
    • Critérios de promoção de modelos para produção.
  • Trabalhar em parceria com times de dados, engenharia e áreas de negócio para garantir a correta aplicação dos modelos e geração de valor mensurável;
  • Realizar exploração, preparação e transformação de dados para criação de variáveis relevantes e melhoria contínua dos modelos;
  • Garantir a evolução da maturidade analítica da operação, contribuindo para que iniciativas de Machine Learning saiam do ambiente experimental e passem a gerar resultado efetivo para o negócio.

Contexto Técnico de Atuação no Projeto

  • O profissional atuará em um ambiente já estruturado pela Engenharia de Dados, com arquitetura analítica organizada no modelo medalhão (Bronze, Silver e Gold) e pipelines de ingestão já consolidados em Google Cloud Platform (GCP);
  • O ecossistema de dados utiliza o BigQuery como Data Warehouse Analítico, com integração de dados provenientes de diferentes fontes, como:
    • Google Analytics;
    • SAP;
    • SQL Server;
    • BigQuery.
  • Neste cenário, o grande desafio da posição não é construir a base de dados do zero, mas sim tirar os modelos do papel, colocá-los em produção na GCP e garantir sua sustentação operacional, com automação de retreino, monitoramento de desempenho, controle de drift e confiabilidade para consumo pelas áreas de negócio;
  • A atuação exigirá forte interface com times técnicos e stakeholders de negócio, sendo essencial combinar capacidade analítica, visão prática de implementação e domínio de boas práticas de produção de modelos.

Requisitos e Qualificações

  • Experiência sólida como Cientista de Dados Sênior, Engenheiro de Machine Learning ou função equivalente;
  • Experiência prática com desenvolvimento de modelos de Machine Learning supervisionado e não supervisionado;
  • Vivência com construção de soluções voltadas para:
    • Churn;
    • Recomendação;
    • Segmentação;
    • Propensão;
    • Comportamento do usuário.
  • Domínio de Python para ciência de dados;
  • Domínio de SQL avançado;
  • Experiência com BigQuery;
  • Experiência com Google Cloud Platform (GCP);
  • Conhecimento prático em Vertex AI ou serviços equivalentes para treinamento, deployment e monitoramento de modelos.
  • Experiência com:
    • Feature engineering;
    • Avaliação e validação de modelos;
    • Métricas de performance de Machine Learning;
    • Análise exploratória de dados;
    • Tratamento e manipulação de grandes volumes de dados;
    • Versionamento de modelos e experimentos;
    • Automação de pipelines;
    • Conceitos e aplicação de MLOps.
  • Conhecimento em bibliotecas e frameworks como:
    • Pandas;
    • NumPy;
    • Scikit-learn;
    • XGBoost, LightGBM ou equivalentes;
    • TensorFlow, PyTorch ou similares.

Habilidades Comportamentais

  • Perfil analítico, crítico e orientado à solução de problemas;
  • Capacidade de transformar desafios de negócio em soluções analíticas aplicáveis;
  • Senso de propriedade e responsabilidade sobre entregas ponta a ponta;
  • Boa comunicação para interação com públicos técnicos e não técnicos;
  • Colaboração e facilidade para atuar em conjunto com times multidisciplinares;
  • Proatividade, autonomia e postura executora;
  • Comprometimento com qualidade, escalabilidade e geração de valor;
  • Resiliência para atuar em cenários de evolução de maturidade analítica e operacional.

Diferenciais

  • Experiência anterior com projetos de Churn e Recommendation Systems;
  • Vivência com dados oriundos de Google Analytics / GA4;
  • Experiência com integração entre Google Analytics e BigQuery;
  • Atuação anterior em ambientes com arquitetura de dados em camadas Bronze, Silver e Gold;
  • Conhecimento em CI/CD aplicado a Machine Learning;
  • Experiência com:
    • Feature Store;
    • Model Registry;
    • Monitoramento automatizado de modelos;
    • Testes automatizados para pipelines de dados e modelos;
    • Construção de APIs para exposição de predições ou recomendações;
    • Cloud Run ou serviços equivalentes.
  • Experiência em ambientes de dados modernos com foco em produção de modelos e geração de valor para áreas de negócio.