Niedostępność w2.lvlup.pro - 22.06.2017

Archiwum
SystemZ
SystemZ Admin lvlup.pro

Niedostępność w2.lvlup.pro - przebieg incydentu

Szanowni klienci, usługa działa już poprawnie. Poniżej umieszczam wszelkie informacje odnośnie tego zdarzenia.

22.06.2017

18:39

Host w2.lvlup.pro który obsługuje wszystkie konta DirectAdmin czyli usługę Hostingu WWW przestał odpowiadać.

19:00

Po diagnozie i sprawdzeniu logów z monitoringu oraz OpenStack wynika że instancja na której znajduje się w2.lvlup.pro została wyłączona przez obsługę OVH prawdopodobnie w wyniku awarii.

19:10

Zostało utworzone zgłoszenie o niedostępności instancji public cloud obsłudze OVH. Czekam na reakcję.

19:30

Został utworzony wątek na forum aby poinformować klientów o przebiegu awarii

19:40

Chwilowe wyłączenie możliwości zakupu nowych kont hostingu WWW.

20:00

Został wysłany mail na listę dyskusyjną OVH Cloud gdzie często bywają pracownicy techniczni OVH tak aby zwiększyć szansę na szybsze dostrzeżenie przez nich błędu lub uzyskać informację na temat czasu w którym zostanie przywrócona usługa.

W międzyczasie powstał zarys alternatywnego przywrócenia usługi z dostępnych kopii zapasowych, niestety potrwałby on prawdopodobnie wiele godzin, szukam innych rozwiązań aby zminimalizować czas niedostępności.

20:35

Wrócił ping do serwera

20:43

Instancja wróciła do życia, w2.lvlup.pro jest ponownie dostępne i większość usług wygląda na sprawną. Trwa sprawdzanie czy podczas awarii powstały uszkodzenia.

20:55

Usługa DNS wymagała małej poprawki i restartu, działa już poprawnie. Aplikacja do monitoringu błędnie pokazuje dalszą niedostępność serwera, lokalizuję problem. Ostatni restart w2 miał miejsce 303 dni temu i problem pokazał się dopiero teraz.

21:02

Monitoring wykrywa serwer jako online już poprawnie.

Serwer póki co wygląda na całkowicie sprawny. Po przerwie dla admina zostaną rozpatrzone wszelkie tickety odnośnie tego incydentu w poszukiwaniu ewentualnych błędów które mogłem przeoczyć a zauważyli je klienci.

22:05

Przywrócono możliwość zakupu nowych kont WWW.

22:28

Każda usługa dotknięta awarią otrzymała +24h ważności

22:30

Każde zgłoszenie dotyczące tego zdarzenia zostało już rozpatrzone. Nie napotkałem na żadne dodatkowe zgłoszone usterki tak więc stwierdzam że w tym momencie usługa jest już całkowicie sprawna i wszystko wróciło do normy.

Powiązane zdarzenie:

https://lvlup.rok.ovh/t/niedostepnosc-w2-lvlup-pro-26-06-2017/3089

Flyspeak.pl
Flyspeak.pl

No i to się szanuje, całe info co i jak.

Timo
Timo Moderator forum.lvlup.pro

Bardzo lubię taki dokładny opis, pełen profesjonalizm :)

DoreK
DoreK α-tester v3

Ale o problemach z n59 nigdzie nic nie było :kappa: