Delivery 1.0 Help

Observability

Program:

DLV-57

Epic:

DLV-273

Dane “live” pokazujące jak się mają nasze systemy oraz pozwalające na wyszukiwanie przyczyn w przypadku awarii. Złożoność systemów jest tak duża, że prześledzenie tego co się dzieje jest bardzo trudne, a wnioskowanie często koliduje z przywracaniem systemu do funkcjonowania w czasie awarii.

Do wybrania zestaw narzędzi, którymi będziemy się posługiwać, żeby “podglądać” wszystko.

W ramach zadań inicjatywy będzie m.in. stworzenie polityki logowania zdarzeń w logach, wytworzenie standardu boardów monitoringowych oraz API jakie systemy mają implementować aby były gotowe do szybkiego podpinania do monitoringów.

Punkt wspólny dla inicjatyw: SRE, monitoringu, Zarządzania Incydentami

Aktualizacja 29 Jun 2023 :

  1. Zaplanowane spotkanie z Dynatrace

  2. W sytuacji braku rezultatów po powyższym, rozpoczniemy implementację własnego observability

  3. Należy przygotować templat’e dashboardu z metrykami dla aplikacji javowych

Last modified: 30 May 2024