Cientista de Dados Sênior
Brasilseg
Descrição da vaga
O que estará sobre seus cuidados: Atuar no time de Analytics & Data Science, desenvolvendo modelos estatísticos e de machine learning para suportar decisões comerciais, otimizar canais de venda, aumentar conversão, retenção e crescimento da carteira, com rigor científico, experimentação controlada e modelos em produção em larga escala.Responsabilidades e atribuiçõesO que é importante você ter?Construir modelos de Next Best Action para recomendar produto, canal e momento ideais — aumentando cross-sell na base e conversão nos canais digitais.Desenvolver modelos de churn usando histórico comportamental e de apólices, antecipando risco de cancelamento e acionando retenção personalizada.Entregar modelos de propensão de compra para score de leads e base ativa, priorizando clientes por probabilidade de contratação — direcionando atuação comercial e digital.Gerar segmentações comportamentais e econômicas para personalizar comunicação, ofertas e pricing por perfil.Aplicar uplift modeling para medir impacto incremental de campanhas, focando onde há mudança real de comportamento e reduzindo desperdício de budget.Desenhar e analisar testes A/B e RCTs para medir impacto causal de vendas, campanhas e mudanças de jornada — garantindo decisões baseadas em evidência.Construir Marketing Mix Modeling (MMM) e atribuição multicanal para medir ROI por canal e otimizar alocação de budget com base em incrementalidade.Avaliar políticas sem RCT com métodos causais, estimando impacto de mudanças como pricing por região.Modelar LTV preditivo por cliente/segmento, orientando investimento em aquisição e retenção e suportando a lógica CAC vs. LTV.Construir e manter pipelines de MLOps no Databricks, garantindo estabilidade e performance dos modelos em produção.Traduzir análises em recomendações executivas claras, conectando métricas estatísticas a decisões de negócio. Requisitos e qualificaçõesSuperior Completo (Estatística, Matemática, Engenharia, Ciência da Computação ou afins)Domínio avançado de Python (pandas, numpy, scikit-learn) e SQL. Experiência produtiva com Apache Spark / PySpark / Databricks / SparkMLVivência com AWS (S3, Glue, SageMaker, Lambda ou similares) em ambiente de dados em escala.Conhecimento sólido em MLflow: tracking, model registry, aliases champion/challenger, Unity Catalog, nested runs, custom metrics e artifacts.Experiência com Feature Store do Databricks (offline e online tables, Unity Catalog, point-in-time correctness, on-demand features e streaming features).Domínio de MLOps: ciclo dev/test/prod, Databricks Asset Bundles (DABs), model serving endpoints, testes (unit e integration) em notebooks, retraining automatizado com detecção de data drift e performance degradation. Inferência em batch, real-time e streaming (incluindo Delta Live Tables) e deploy de modelos em endpoints. Capacidade de formular problemas de negócio como problemas estatísticos / de ML bem definidos.Diferenciais Experiência prévia no setor financeiro, seguros ou atuarial.Mestrado ou Doutorado em Estatística, Econometria, Matemática, Ciências Atuariais ou áreas quantitativas. Conhecimento avançado em causal inference: DiD, RDD, variáveis instrumentais (IV), propensity score; experiência com estudos observacionais e experimentos clínicos/quase-experimentais.Distributed training e distributed hyperparameter tuning: pandas Function APIs / UDFs, Optuna + MLflow, Ray, e noções de vertical vs. horizontal scaling para ML workloads.Lakehouse Monitoring: drift detection, testes estatísticos, time series e snapshot tables, custom metrics e alerting.Delta Live Tables e pipelines de streaming; custom PyFunc models, REST API e MLflow Deployments SDK. Informações adicionaisInformações adicionaisComo Cuidamos de você:Benefícios:Seguro Saúde;Seguro Odontológico;Seguro Decesso;Vale TransporteVale Refeição;Vale Alimentação;13ª Cesta de Alimentação;Seguro de Vida em Grupo;Plano de Previdência Privada;Auxílio Creche e/ou Babá;Participação nos Lucros e Resultados (PLR);Gympass;Day off para comemorar seu aniversário;Universidade Corporativa com mais 500 cursos;Programa de Saúde Integrada: mental, social, financeira e física.Onde ficamos?Nossa sede fica localizada na zona sul de São Paulo, próximo a estação de trem Morumbi (linha 9 – Esmeralda), na região do bairro Chácara Santo Antônio.
