← Todas as vagas

Cientista de Dados

VENHA SER #SANGUELARANJA 🧡🚀

📍 Belo Horizonte/MGhibrido· CLT

Descrição da vaga

Estamos em busca de uma pessoa para atuar como Cientista de Dados para integrar nossa equipe que atua dedicado a um cliente do mercado financeiro.Responsabilidades e atribuiçõesProjetar, desenvolver e manter modelos de dados analíticos, com foco em modelagem dimensional (modelo estrela) para suportar dashboards e análises das áreas de crédito.  Construir e otimizar pipelines de dados utilizando ferramentas de orquestração e processamento distribuído.  Desenvolver rotinas de ingestão, transformação e validação de dados em ambientes de data lake e data warehouse.  Trabalhar em parceria com áreas de negócio, operações e tecnologia para entender necessidades e traduzir requisitos em estruturas de dados eficientes.  Realizar análises exploratórias, identificar padrões e apoiar a tomada de decisão com insights baseados em dados.  Documentar modelos, regras de transformação, dicionários de dados e fluxos de ingestão.  Apoiar squads e stakeholders na construção de indicadores, métricas e visões analíticas.  Monitorar performance das bases e propor melhorias contínuas em arquitetura, governança e qualidade dos dados. Requisitos e qualificaçõesObrigatóriosApache Airflow para orquestração de pipelines.  PySpark para processamento distribuído e manipulação de grandes volumes de dados.  Python aplicado a engenharia e ciência de dados.  Pandas e Numpy para manipulação e análise de dados.  SQL avançado para consultas, modelagem e otimização.  Experiência com AWS Cloud, incluindo:  AWS Glue (ETL/ELT)  Amazon Redshift (data warehouse)  Consultas em dados armazenados no Amazon S3  Experiência com modelagem dimensional (fatos, dimensões, modelo estrela).  Vivência com pipelines de dados e boas práticas de governança.DesejáveisExperiência no setor financeiro, especialmente em operações ou produtos de crédito.  Familiaridade com ferramentas de visualização (Power BI, Tableau, Looker).  Conhecimento de versionamento (Git) e boas práticas de desenvolvimento.  Noções de qualidade e catalogação de dados (Data Quality, Data Catalog).