Obowiązki | Senior SRE+ Wdrażanie i rozwój praktyk SRE we współpracy z działami produktowymi, operacyjnymi i delivery IT Odpowiedzialność za niezawodność, bezpieczeństwo i skalowalność systemów IT Odpowiedzialność za część jakościową roadmap-y produktowej dla całej organizacji (współdzielona z Product Managerami) Definiowanie metryk jakościowych i szukanie rozwiązań na ich poprawę Ustalanie roadmap-y dla projektów i inicjatyw SRE Organizacja pracy zespołu SRE (Daily, Scrum/Kanban, planowania) Udział w rekrutacjach Samodzielne rozwiązywanie zgłaszanych problemów oraz samodzielne wyszukiwanie potencjalnych problemów Reakcja na awarie, powtarzające się restarty tych samych usług, itp - dbanie o jakość w organizacji. Analizy, postmortem awarii: analiza przyczyn źródłowych awarii zgłaszanych przez Developerów, DevOps Weryfikacja infrastruktury (VM, Kubernetes, Cloud). Weryfikacja uruchomionych procesów i aplikacji powiązanych z systemem (np. proces odpowiedzialny za zarządzanie kontenerami, apache, silnik bazodanowy). Weryfikacja konfiguracji (Kubernetes, Docker, usługi na VM, aplikacji). Tworzenie rekomendacji w oparciu o przeprowadzoną analizę, best practices, dokumentacje.
Przygotowanie POC rozwiązań na etapie analizy projektu lub usprawniające projekt / zagadnienie. Przeprowadzanie szkoleń wewnętrznych dla zespołów Dev / AM / DevOps. Aktywna współpraca z Architektami IT. Optymalizacje: narzędzi, kodu, baz danych R&D rozwiązań z zakresu IT (narzędzia, architektury, frameworki) wiedza z zakresu zarządzania procesami i projektami
| SRE+ Samodzielne rozwiązywanie zgłaszanych problemów oraz samodzielne wyszukiwanie potencjalnych problemów Reakcja na awarie, powtarzające się restarty tych samych usług, itp - dbanie o jakość w organizacji. Analizy, postmortem awarii: analiza przyczyn źródłowych awarii zgłaszanych przez Developerów, DevOps Weryfikacja infrastruktury (VM, Kubernetes, Cloud). Weryfikacja uruchomionych procesów i aplikacji powiązanych z systemem (np. proces odpowiedzialny za zarządzanie kontenerami, apache, silnik bazodanowy). Weryfikacja konfiguracji (Kubernetes, Docker, usługi na VM, aplikacji). Tworzenie rekomendacji w oparciu o przeprowadzoną analizę, best practices, dokumentacje.
Testy dodatkowych narzędzi oraz funkcjonalności w istniejących, np. narzędzia skanujące infrastrukturę, kod aplikacyjny w poszukiwaniu podatności. narzędzia wspierające optymalizację wykorzystania zasobów dowolnej infrastruktury (Cloud, On-Premise, Kubernetes, itd.). nowe funkcjonalności narzędzi monitoringowych. weryfikacja oraz testy narzędzi CNCF.
Optymalizacja kodu: Automatyzacja: tworzenie i ulepszanie procesów CI/CD (Gitlab). tworzenie i rozwój skryptów automatyzujących standardowe zadania administratorskie (Python, Bash, Ansible). tworzenie i rozwój skryptów rozwiązujące braki w dostępnych narzędziach, procesach, itp - np. ustandaryzowany release aplikacji w dowolnej technologii z wykorzystaniem natywnych narzędzi CI/CD (Python, Golang). tworzenie narzędzi CLI i skryptów służących do usprawniania pracy zespołów DevOps / Dev / innych, np. migracja stref DNS ze środowiska on-premise na AWS z wykorzystaniem Terraform (Python, Bash, Golang).
Przygotowanie POC rozwiązań na etapie analizy projektu lub usprawniające projekt / zagadnienie. Przeprowadzanie szkoleń wewnętrznych dla zespołów Dev / AM / DevOps. Aktywna współpraca z zespołami jakościowymi, np. inicjatywa Architektów.
| Junior SRE+ Wsparcie (deploy, improvement) przy tworzeniu infrastruktury w chmurach publicznych (AWS) Wsparcie (deploy, improvement) przy tworzeniu infrastruktury aplikacyjnej na Kubernetes Analizy optymalizacji kosztów w ramach wsparcia SRE Teach Lead Analiza kodu w celu optymalizacji, znalezienia błędów, itp: Automatyzacja procesów, powtarzalnych zadań (Python, Bash) Tworzenie exporterów metryk dla aplikacji / systemów (Python, Java)
| wsparcie (deploy, monitorowanie) aplikacji napisanych w Java opieka na procesem Incident Response (zarządzanie incydentem) budowa i rozwój systemu monitoringowego z wykorzystaniem narzędzi monitoringowych rozwój obszaru Observability budowa i opieka nad metrykami SLI/SLO/SLA tworzenie KPI w oparciu o dane z zadań oraz incydentów udział przy projektowaniu systemów IT wsparcie w ustalaniu procesów IT rozwój procesu Production Readiness Review Przeglądy kolejek utrzymaniowych (zgłoszenia dotyczące systemów/aplikacji) Analiza zasadności zgłoszeń zapotrzebowania na automatyzację, wyszukiwanie procesów, które warto zautomatyzować rozwój osobisty w obszarze SRE wsparcie SRE/SRE Tech Lead w ich pracy
|
Wymagania | Doświadczenie (jedno z): 5+ doświadczenia jako SRE, 2+ doświadczenie w kierowaniu zespołem 5+ na doświadczenia jako DevOps, 2+ doświadczenie w kierowaniu zespołem 5+ doświadczenia jako Dev, 2+ doświadczenie w kierowaniu zespołem
Bardzo duże doświadczenie w budowaniu wysoko wydajnych i niezawodnych systemów IT Znajomość architektury systemów Bardzo dobra znajomość metodologi SRE Bardzo dobra znajomość cyklu wytwarzania oprogramowania Znajomość zagadnień Security, Quality Assurance Bardzo dobra znajomość: Observability, Monitoring, Incident Response, Chaos Engineering Zdolność do rozwiązywania trudnych problemów technicznych wsparta naturalną dociekliwością Patrzenie na systemy IT przez pryzmat całości (big picture”) - sieć, infrastruktura, aplikacje
| Doświadczenie (jedno z): 3+ doświadczenia jako SRE 5+ na doświadczenia jako DevOps 5+ doświadczenia jako Dev
Bardzo dobra znajomość Chmury Publicznej (AWS) - na poziomie Architect Bardzo dobra znajomość języków: Python / Java / Go Bash HCL, YAML, JSON Jinja2
Bardzo dobra znajomość Kubernetes, pojęcia konteneryzacji Bardzo dobra znajomość narzędzi oraz platform GitOps, CI, CD: FluxCD ArgoCD Gitlab Ansible Puppet Kustomize
Bardzo dobra znajomość narzędzi IaC: Terraform Terragrunt Helm Ansible Puppet Docker Kubernetes
Bardzo dobra znajomość baz danych: Bardzo dobra znajomość systemów operacyjnych z rodziny Linux, np. Znajomość Chaos Engineering
| Doświadczenie (jedno z): 2+ doświadczenia jako Junior SRE 2+ doświadczenia jako DevOps 2+ doświadczenia jako Dev
Dobra znajomość chmury publicznej (AWS) Znajomość języków: Python / Java / Go Bash HCL, YAML, JSON
Dobra znajomość systemów operacyjnych (Linux) Kubernetes: Znajomość podstaw platformy Rozumienie różnic oraz zależności między zasobami Wdrażanie / skalowanie / aktualizacja aplikacji Znajomość różnic między Native Kubernetes a platformami od dostawców chmurowych (EKS, itp)
Znajomość rozwiązań GitOps Analityczne podejście do pracy Nastawienie na automatyzację oraz jakość
| 2+ doświadczenia w administrowaniu aplikacjami/systemami IT Podstawy programowania (dowolny język z Java, Python, Go) Podstawowa znajomość Bash Podstawowa znajomość YAML/JSON Podstawowa znajomość platformy Kubernetes Doświadczenie we wdrażaniu i wspieraniu Microservices opartych na Javie (JEE, Spring, Quarkus) Znajomość API Gateway, Load Balancery ZnajomośćContinuous Integration/Deployment (CI/CD)np. gitlab Znajomość baz danych (np. Postgresql) i systemów kolejkowych (np. Kafka, AMQ) w tym znajomość SQL Podstawowa znajomość rozwiązań chmurowych Znajomość narzędzi monitoringowych (np. Zabbix, Prometheus, Grafana, ELK) Podstawowa znajomość systemów operacyjnych Analityczne myślenie (szybkość wyszukiwania informacji w internecie Ciekawość, chęć analizy jak coś działa Wrażliwość na drobiazgi, chęć poprawiania, myślenie że zawsze można zrobić lepiej Nastawienie na optymalizację Pojęcie domenowe (mile widziana znajomość systemów płatności) Znajomość Confluence/Jira
|