Observability
Program:
Epic:
Dane “live” pokazujące jak się mają nasze systemy oraz pozwalające na wyszukiwanie przyczyn w przypadku awarii. Złożoność systemów jest tak duża, że prześledzenie tego co się dzieje jest bardzo trudne, a wnioskowanie często koliduje z przywracaniem systemu do funkcjonowania w czasie awarii.
Do wybrania zestaw narzędzi, którymi będziemy się posługiwać, żeby “podglądać” wszystko.
W ramach zadań inicjatywy będzie m.in. stworzenie polityki logowania zdarzeń w logach, wytworzenie standardu boardów monitoringowych oraz API jakie systemy mają implementować aby były gotowe do szybkiego podpinania do monitoringów.
Punkt wspólny dla inicjatyw: SRE, monitoringu, Zarządzania Incydentami
Aktualizacja 29 Jun 2023 :
Zaplanowane spotkanie z Dynatrace
W sytuacji braku rezultatów po powyższym, rozpoczniemy implementację własnego observability
Należy przygotować templat’e dashboardu z metrykami dla aplikacji javowych