SRE Sênior
Kalendae
Descrição da vaga
Você terá o prazer de poder cuidar do parque tecnológico, realizando gestão dele mantendo sua disponibilidade, crescimento e manutenção. Também será de sua responsabilidade acompanhar os projetos de curto, médio e de longo período, bem como dirigir as implantações no ambiente. Esperamos que com a sua experiência de mercado, possamos fazer uma entrega de valor com muita qualidadeResponsabilidades e atribuiçõesSerá de sua responsabilidade atuar na área de SRE (Site Reliability Engineering), sendo responsável pela criação, definição e implementação, atuando em ações suporte avançado em nível 3.Desenvolver soluções para monitoração de negócios e infraestrutura, pensando em autorecuperação.Realizar interlocução com equipes internas e externas como fabricantes em ambientes on premise e Cloud.Liderar tecnicamente eventuais crises envolvendo o ambiente de tecnologia, coordenando as análises e interações técnicas com outras equipes, buscando a recuperação do serviço afetado até sua causa raiz e plano de correção.Responsável por garantir a disponibilidade das plataformas e sistemas, atuando com equipes distribuídas como gestão de incidentes, monitoração e automações.Será parte de suas atividades, conduzir projetos bem como suas respectivas validações de documentação técnica, fluxos técnicos e Manuais de Procedimentos Operacionais.Requisitos e qualificaçõesNecessário:Formação nas áreas de tecnologia para desenvolvimento áreas correlatasExperiênca em ambientes de alta performanceExperiência em construção diagramas de arquitetura de ambientes em CloudExperiência com zabbix, OpsGinie, New Relic e GrafanaExperiência no mercado com + de 4 anos como SRESoftskills - Excelentes habilidades de comunicação e colaboração.Habilidade de trabalhar em equipe, incluindo colaboração com equipes multidisciplinares e habilidade de ajudar outros membros da equipe quando necessário.Boa capacidade de análise resolução de problemas.Habilidade em gerenciamento de tempo e priorização de tarefas.Habilidade em lidar com situações de pressão e prazos.Capacidade de se adaptar rapidamente a mudanças e aprendizado contínuo.Habilidade em lidar com situações de alta pressão, como picos de tráfego ou interrupções de serviço.Habilidade para documentar adequadamente os problemas e soluções para garantir a continuidade do suporte.Hardskills - Conhecimento em programação em duas das linguagens abaixo:BashPythonConhecimento de CI/CD em Azure DevOpsConhecimento de ferramentas de Controle de versão como GitCompreensão de conceitos de observabilidade, golden metricsConhecimentos avançados de GCPConhecmentos intemediários em Linux e dockerConheCimentos avancados em kubernetesConhecimento em práticas para delnicão de SLA e SLOConhecimento em intermediários em SOLConhecimento em práticas laC Teraform)Informações adicionaisHíbrido: 1 ou 2x presenciaisHorário: das 09hs às 18hs de segunda a sexta-feiraModelo: PJ
