Pessoa Analista de SRE Júnior
Empresa confidencial
Descrição da vaga
Estamos em busca de uma pessoa analista de SRE Júnior para atuar em sustentação, monitoramento e automação inicial da infraestrutura. Essa pessoa será responsável por acompanhar alarmes e métricas, garantindo a confiabilidade do ambiente, com foco especial na stack de observabilidade (Grafana, Prometheus, Loki, Tempo, OpenTelemetry).
Responsabilidades:
● Aprendizado contínuo das ferramentas utilizadas pela equipe (AWS, Kubernetes,
ArgoCD, Terraform, Grafana Stack).
● Monitorar alarmes e métricas, ajudando na classificação, acionamento e
acompanhamento até a resolução final junto ao time de desenvolvimento.
● Criar, manter e ajustar dashboards no Grafana e alarmes no Prometheus.
● Apoiar o time em rotinas de sustentação de sistemas e aplicações.
● Executar tarefas operacionais básicas em AWS (EC2, S3, IAM, RDS, EKS).
● Contribuir para a documentação e manutenção de runbooks.
● Ser o ponto focal em post-mortems, garantindo documentação de incidentes,
acionamento das pessoas necessárias e acompanhamento da execução dos pontos
de melhoria.
● Participar de mentorias e treinamentos internos.
Experiências e qualificações:
● Conhecimento prático prévio em Grafana e Prometheus (dashboards e alarmes).
● AWS: noções básicas (EC2, S3, IAM, RDS).
● Kubernetes: conceitos básicos (Pods, Deployments, Services, Ingress).
● Terraform: leitura e pequenas alterações em código já existente.
● Containers/Docker: entendimento básico.
● GitHub Actions: noções de pipelines.
Diferenciais
● Experiência com Loki e OpenTelemetry.
● Conhecimento básico em GitOps (ArgoCD).
● Experiência em documentação técnica (runbooks).
