← Todas as vagas

Especialista de Tecnologia

PWS Cloud

📍 São Paulo/SPpresencial· CLT

Descrição da vaga

Estamos em busca de um(a) Operations Engineer para ajudar a construir a próxima geração da operação da PWS Cloud.Mais do que manter ambientes funcionando, buscamos alguém que queira transformar a forma como operamos, automatizando processos, aumentando a observabilidade dos serviços e reduzindo dependências operacionais através de engenharia.Você atuará diretamente na evolução da nossa plataforma Cloud, participando da construção de soluções que permitam escalar a operação com qualidade, confiabilidade e eficiência. Procuramos uma pessoa com perfil analítico, curiosidade técnica e paixão por automação, que goste de transformar atividades manuais em processos inteligentes e sustentáveis.Essa é uma posição estratégica dentro da companhia e uma excelente oportunidade para profissionais que desejam atuar na interseção entre infraestrutura, automação, observabilidade e confiabilidade, contribuindo diretamente para a evolução da plataforma e da operação da PWS Cloud.Responsabilidades e atribuiçõesDesenvolver automações para processos operacionais, provisionamento, monitoramento e gestão de ambientes.Desenvolver integrações entre plataformas, ferramentas e sistemas internos.Evoluir continuamente a observabilidade da plataforma através de métricas, logs, dashboards e alertas.Apoiar a construção dos padrões operacionais da nova plataforma Cloud da PWS.Criar ferramentas internas para aumento de produtividade dos times técnicos.Desenvolver scripts, APIs e soluções para redução de atividades manuais.Participar da definição de indicadores operacionais e de confiabilidade.Apoiar iniciativas de Capacity Planning através da coleta e análise de dados operacionais.Estruturar e evoluir plataformas de monitoramento e observabilidade.Participar da definição de padrões de automação, confiabilidade e engenharia operacional.Atuar em parceria com os times de Infraestrutura, Redes, Segurança, Engenharia e Operações para aumentar a escalabilidade dos serviços.Apoiar a implementação de práticas que servirão de base para a futura estrutura de SRE da companhia.Sua missão principal é construir capacidades que reduzam a necessidade de intervenção operacional manual ao longo do tempo.Requisitos e qualificaçõesExperiência com desenvolvimento de automações utilizando Python.Experiência com consumo e integração de APIs REST.Conhecimento em versionamento de código utilizando Git.Experiência com desenvolvimento de scripts para automação operacional.Conhecimento de boas práticas de desenvolvimento, documentação e controle de versões. Sistemas Operacionais e Infraestrutura Administração de ambientes Linux.Conhecimentos de virtualização e infraestrutura de datacenter.Conhecimentos de redes TCP/IP, DNS, DHCP, VPN e balanceamento de carga. Observabilidade e Confiabilidade Experiência com ferramentas de monitoramento e observabilidade.Experiência na criação de dashboards, métricas, alertas e indicadores operacionais.Conhecimento dos conceitos de disponibilidade, capacidade, desempenho e confiabilidade.Conhecimento de coleta e análise de métricas de infraestrutura e aplicações. Infraestrutura como Código e Automação Conhecimento em Terraform, Ansible ou ferramentas equivalentes de automação.Conhecimento em automação de provisionamento e gerenciamento de infraestrutura.Familiaridade com conceitos de Infrastructure as Code (IaC). Containers e Plataformas Modernas Conhecimento em Docker.Conhecimento em Kubernetes ou plataformas de orquestração de containers.Familiaridade com arquiteturas modernas orientadas a serviços.Informações adicionaisExperiência em provedores de Cloud, MSPs, Hosting ou Datacenters.Experiência com Grafana.Experiência com Prometheus.Experiência com Zabbix.Experiência com OpenSearch ou Elastic Stack.Conhecimentos de CI/CD.Conhecimentos de observabilidade distribuída.Experiência em ambientes de alta disponibilidade e missão crítica.Conhecimentos de práticas de SRE (Site Reliability Engineering).