Data Engineer (GCP + Databricks)

MED4U PARTICIPACOES SOCIETARIAS S/A

📍 Curitiba/PRhibrido· PJ

Descrição da vaga

Que tal trazer seu talento para a Spesia?

 

A Spesia é a healthtech do Grupo Med4U dedicada ao desenvolvimento de soluções de Inteligência Artificial aplicadas à saúde. Trabalhamos na transformação de dados clínicos em ferramentas reais de apoio à decisão médica, desenvolvendo aplicações inovadoras capazes de impactar diretamente a jornada de cuidado dos pacientes.

 

Estamos em busca de um(a) Data Engineer (GCP + Databricks) para atuar na evolução da nossa plataforma de dados em saúde. Se você é apaixonado por dados, arquitetura, engenharia de dados em larga escala e quer participar da construção de soluções inovadoras em IA para a saúde, essa oportunidade é para você!

 

Vaga: Data Engineer (GCP + Databricks)
Modelo de trabalho: Híbrido (3 dias presenciais e 2 remotos)
Local: Unidade Corporativa - Alameda Dom Pedro II, 574 - Batel

 

Missão do Cargo

Atuar na estruturação, evolução e sustentação da plataforma de dados da Spesia, garantindo a disponibilidade, qualidade, segurança e governança das informações utilizadas em produtos de dados e soluções de Inteligência Artificial aplicadas à saúde.

 

Principais Responsabilidades

  • Projetar, implementar e evoluir arquiteturas de dados utilizando Google Cloud Platform (GCP) e Databricks;
  • Estruturar e manter pipelines de ingestão, transformação e disponibilização de dados com foco em escalabilidade, rastreabilidade e qualidade;
  • Integrar dados provenientes de prontuários eletrônicos, sistemas hospitalares, bancos de dados relacionais e demais fontes clínicas e administrativas;
  • Organizar dados estruturados, semiestruturados e não estruturados para utilização em análises avançadas e aplicações de IA;
  • Definir padrões de modelagem, documentação, governança, qualidade e linhagem dos dados;
  • Construir datasets, tabelas analíticas e produtos de dados que apoiem modelos preditivos, soluções de IA, dashboards e estudos clínicos;
  • Administrar e evoluir o ambiente Databricks, incluindo gestão de permissões, catálogos, monitoramento e otimização de performance;
  • Implementar controles de segurança, privacidade e governança de dados em conformidade com a LGPD;
  • Trabalhar em parceria com equipes de Ciência de Dados, AI Engineering, Produto, TI e especialistas clínicos;
  • Monitorar pipelines e infraestrutura de dados, identificando oportunidades de melhoria contínua;
  • Manter documentação técnica atualizada e contribuir para iniciativas de inovação, pesquisa e desenvolvimento.

 

Requisitos

Formação em Ciência da Computação, Engenharia da Computação, Sistemas de Informação, Engenharia de Software, Engenharia de Dados ou áreas correlatas;

Experiência na construção e sustentação de pipelines de dados em produção;

Domínio de SQL e experiência com Python para engenharia de dados;

Experiência com Apache Spark e processamento distribuído;

Vivência prática com Databricks, incluindo Delta Lake, notebooks e workflows;

Experiência com Google Cloud Platform (GCP), especialmente BigQuery, Cloud Storage e IAM;

Conhecimento de modelagem de dados, Data Lake, Data Warehouse e/ou Lakehouse;

Experiência com bancos de dados relacionais, preferencialmente Oracle ou PostgreSQL;

Conhecimento em governança, qualidade, segurança e observabilidade de dados;

Experiência com ferramentas de orquestração de pipelines.

 

Diferenciais

Experiência com dados de saúde, prontuários eletrônicos ou sistemas hospitalares, especialmente Tasy;

Conhecimento em padrões de interoperabilidade em saúde, como HL7 FHIR;

Familiaridade com terminologias clínicas como CID-10, SNOMED CT, LOINC e mCODE;

Experiência com Unity Catalog, Delta Live Tables, dbt, Terraform e infraestrutura como código;

Vivência com NLP, dados clínicos não estruturados e preparação de dados para aplicações de IA e LLMs;

Conhecimento em anonimização, pseudonimização e proteção de dados sensíveis;

Experiência com ferramentas de observabilidade como Datadog, Prometheus, Grafana ou ELK;

Certificações em GCP ou Databricks;

Participação em projetos de saúde digital, pesquisa clínica ou Inteligência Artificial aplicada à saúde.

 

Na Spesia, você terá a oportunidade de atuar diretamente na construção da base de dados que impulsiona soluções inovadoras de Inteligência Artificial para a saúde, contribuindo para produtos que geram impacto real para médicos, equipes clínicas e pacientes.

 

Quer fazer parte?

Venha construir o futuro da saúde com a gente! ?

Mais vagas em Curitiba

Todas as vagas em Curitiba/PR →Vagas em Paraná →