Niedostępność w2.lvlup.pro - przebieg incydentu
Szanowni klienci, usługa działa już poprawnie. Poniżej umieszczam wszelkie informacje odnośnie tego zdarzenia.
22.06.2017
18:39
Host w2.lvlup.pro który obsługuje wszystkie konta DirectAdmin czyli usługę Hostingu WWW przestał odpowiadać.
19:00
Po diagnozie i sprawdzeniu logów z monitoringu oraz OpenStack wynika że instancja na której znajduje się w2.lvlup.pro została wyłączona przez obsługę OVH prawdopodobnie w wyniku awarii.
19:10
Zostało utworzone zgłoszenie o niedostępności instancji public cloud obsłudze OVH. Czekam na reakcję.
19:30
Został utworzony wątek na forum aby poinformować klientów o przebiegu awarii
19:40
Chwilowe wyłączenie możliwości zakupu nowych kont hostingu WWW.
20:00
Został wysłany mail na listę dyskusyjną OVH Cloud gdzie często bywają pracownicy techniczni OVH tak aby zwiększyć szansę na szybsze dostrzeżenie przez nich błędu lub uzyskać informację na temat czasu w którym zostanie przywrócona usługa.
W międzyczasie powstał zarys alternatywnego przywrócenia usługi z dostępnych kopii zapasowych, niestety potrwałby on prawdopodobnie wiele godzin, szukam innych rozwiązań aby zminimalizować czas niedostępności.
20:35
Wrócił ping do serwera
20:43
Instancja wróciła do życia, w2.lvlup.pro jest ponownie dostępne i większość usług wygląda na sprawną. Trwa sprawdzanie czy podczas awarii powstały uszkodzenia.
20:55
Usługa DNS wymagała małej poprawki i restartu, działa już poprawnie. Aplikacja do monitoringu błędnie pokazuje dalszą niedostępność serwera, lokalizuję problem. Ostatni restart w2 miał miejsce 303 dni temu i problem pokazał się dopiero teraz.
21:02
Monitoring wykrywa serwer jako online już poprawnie.
Serwer póki co wygląda na całkowicie sprawny. Po przerwie dla admina zostaną rozpatrzone wszelkie tickety odnośnie tego incydentu w poszukiwaniu ewentualnych błędów które mogłem przeoczyć a zauważyli je klienci.
22:05
Przywrócono możliwość zakupu nowych kont WWW.
22:28
Każda usługa dotknięta awarią otrzymała +24h ważności
22:30
Każde zgłoszenie dotyczące tego zdarzenia zostało już rozpatrzone. Nie napotkałem na żadne dodatkowe zgłoszone usterki tak więc stwierdzam że w tym momencie usługa jest już całkowicie sprawna i wszystko wróciło do normy.
Powiązane zdarzenie:
https://lvlup.rok.ovh/t/niedostepnosc-w2-lvlup-pro-26-06-2017/3089