SRE Sr - Mercado Financeiro/ Inglês Fluente
Evertec Brasil
Descrição da vaga
Somos a única solução completa para o mercado financeiro!
A Evertec é uma empresa especializada em tecnologia para o setor financeiro, com mais de 27 anos de atuação no mercado, e presença em 26 países da América Latina e Caribe e mais de 11 bilhões de transações processadas anualmente.
Oferecemos um portfólio completo de soluções em software, adquirência, processamento e tecnologias para meios de pagamento, contribuindo para a digitalização de instituições financeiras, empresas e fintechs.
Nosso compromisso é com a excelência tecnológica, a inclusão financeira e a geração de valor sustentável para clientes, colaboradores e parceiros.
Foco: Mercado Financeiro | Inglês Fluente
Objetivo da função
Garantir alta disponibilidade, resiliência e performance de sistemas críticos, especialmente em ambientes de missão crítica, atuando de forma estratégica na implementação de práticas de SRE, automação, CI/CD e governança operacional, além de liderar iniciativas de confiabilidade e melhoria contínua.
Principais responsabilidades
- Definir, implementar e evoluir práticas de SRE (SLI, SLO, SLA, error budget)
- Projetar e otimizar pipelines de CI/CD com foco em segurança, rastreabilidade e eficiência
- Liderar a automação de infraestrutura e processos operacionais
- Gerenciar e aprimorar ambientes críticos com alta exigência de disponibilidade (ex: trading, pagamentos, liquidação)
- Atuar como referência técnica em arquitetura de confiabilidade
- Implementar estratégias de observabilidade completa (monitoramento, logging, tracing)
- Conduzir análises de incidentes críticos (RCA/post-mortem) e propor melhorias estruturais
- Garantir aderência a requisitos de compliance e auditoria (ex: SOX, PCI-DSS quando aplicável)
- Colaborar com times globais e stakeholders, utilizando inglês no dia a dia
Requisitos técnicos
Essenciais
- Forte experiência com CI/CD:
- GitHub Actions, Jenkins, GitLab CI ou equivalentes
- Design de pipelines complexos e escaláveis
- Domínio de Git e GitHub:
- Estratégias de branching
- Code review avançado
- Automação com workflows
- Conhecimento avançado em Linux
- Experiência sólida com infraestrutura híbrida:
- Cloud (AWS, Azure, GCP)
- Servidores físicos (on-premise), comuns em instituições financeiras
- Forte conhecimento em redes (latência, balanceamento, segurança)
- Experiência com containers (Docker) e orquestração (Kubernetes)
- Familiaridade com Infrastructure as Code (IaC):
- Terraform, Ansible ou similares
Diferenciais altamente relevantes (mercado financeiro)
- Experiência em ambientes de alta criticidade e baixa latência
- Conhecimento de sistemas de mensageria e streaming:
- Kafka, RabbitMQ
- Práticas de resiliência e tolerância a falhas
- Experiência com sistemas transacionais ou processamento em tempo real
- Conhecimento em segurança e proteção de dados (criptografia, controle de acesso)
Observabilidade e operação
- Ferramentas como:
- Prometheus, Grafana
- ELK Stack / OpenSearch
- Datadog, New Relic ou similares
- Criação de métricas e dashboards estratégicos
- Definição e acompanhamento de indicadores de confiabilidade
Inglês fluente (obrigatório)
- Participação ativa em reuniões com times internacionais
- Escrita e leitura de documentação técnica
- Comunicação clara em incidentes globais (war rooms)
Competências comportamentais - Mentalidade orientada a confiabilidade e automação
- Pensamento crítico e tomada de decisão sob pressão
- Forte senso de ownership
- Comunicação clara e influência técnica
- Capacidade de atuar como referência e mentor
- Visão sistêmica e estratégica
Nível esperado (Sênior) - Atua com autonomia total e liderança técnica
- Toma decisões arquiteturais
- Define padrões e boas práticas do time
- Lidera iniciativas de melhoria contínua
- Atua diretamente em incidentes críticos
- Influencia múltiplos times e projetos
Exemplos de atividades no dia a dia
- Definir SLOs para sistemas de pagamento ou negociação
- Projetar pipeline de deploy seguro com múltiplos gates
- Atuar em incidentes de alta prioridade com impacto financeiro
- Otimizar sistemas para reduzir latência e aumentar throughput
- Coordenar estratégias de disaster recovery
- Garantir compliance técnico em auditorias.
Necessário disponibilidade para atuar em solução 24x7, com demandas aos finais de semana.
