Niedostępność w2.lvlup.pro - 26.06.2017

Archiwum
SystemZ
SystemZ Admin lvlup.pro

Niedostępność w2.lvlup.pro - przebieg incydentu

Szanowni klienci, usługa Hosting WWW jest ponownie dostępna Poniżej umieszczam wszelkie informacje odnośnie tego zdarzenia.

26.06.2017

15:04

Instancja Cloud na której ulokowany jest host w2.lvlup.pro przestała odpowiadać.

16:00

Z moich ustaleń poprzez panel OpenStack wynika że niedostępność spowodowana jest migracją instancji na inny węzeł przez OVH co patrząc na poprzednie tego typu zdarzenia może potrwać łącznie szacunkowo około 2h. Cały proces nie powinien spowodować innych utrudnień niż chwilowa niedostępność.

16:15

Został utworzony wątek na forum informujący o zdarzeniu

16:19

Trwa przygotowywanie danych tak aby poinformować obsługę OVH ponownie o zdarzeniu, gdyż jeszcze w tym momencie nie otrzymałem odpowiedzi na zgłoszenie w ramach poprzedniej awarii https://lvlup.rok.ovh/t/niedostepnosc-w2-lvlup-pro-22-06-2017/3057

16:35

Zgłoszenie w OVH zostało zaktualizowane, dodałem informację o niedostępności wraz z MTR

17:40

Chwilowo została zawieszona sprzedaż nowych kont WWW

18:46

Instancja zaczęła odpowiadać na ping, zaczynam weryfikację czy w2.lvlup.pro działa poprawnie.

19:05

Zostały wprowadzone poprawki w konfiguracji w2.lvlup.pro aby w przyszłości restarty przebiegały łagodniej dla przychodzących maili.

19:20

w2.lvlup.pro wygląda na całkowicie sprawny

19:25

Możliwość zakupu nowych kont WWW została wznowiona.

19:50

Wszyscy klienci którzy stworzyli zgłoszenie w panelu klienta odnośnie tego incydentu uzyskali odpowiedź o naprawie w2.lvlup.pro wraz z prośbą o potwierdzenie poprawności działania usługi.

27.06.2017

12:59

Po 5 dniach od utworzenia zgłoszenia związanego z powiązanym incydentem https://lvlup.rok.ovh/t/niedostepnosc-w2-lvlup-pro-22-06-2017/3057

Otrzymałem odpowiedź od OVH że zostało przekazane sprawdzenie tej sytuacji

07.07.2017

10:12

Uzyskałem informację od OVH o powodzie zaistnienia tej sytuacji, oto fragment:

Wszystkie niedogodności związane z instancją spowodowane były działaniem mechanizmu OOM Killer, którego podłożem była bardzo mała ilość pamięci RAM na hoście. Po drugiej, tego rodzaju, niedogodności instancja została zmigrowana, lecz z uwagi na duży flavor operacja ta potrzebowała dłuższego niż przeciętny czasu.

12:24

Kwestia odszkodowania związanego z niedostępnością instancji została rozwiązana zgodnie z SLA.

Incydent mogę uznać za zamknięty

dennijs
dennijs

Eh właśnie zauważyłem. Często takie sytuację będą miały miejsce :/

unqart
unqart

Po migracji zapewne problem zniknie.

SystemZ
SystemZ Admin lvlup.pro

dennijs:

Eh właśnie zauważyłem. Często takie sytuację będą miały miejsce 😕

Możesz rozwinąć co masz dokładnie na myśli? Widzisz przyszłość lub masz dodatkowe informację o ich serwerowni SBG1 i/lub stanie PCI? Podziel się tym ze mną, przydałoby się :slight_smile:

dennijs
dennijs

@SystemZ Po co się od razu unosisz? Wystarczy powiedzieć, że nie masz takich informacji... Zresztą nie informują swoich klientów o tym?? #profejsonalizm

Nieznajomy11
Nieznajomy11 Moderator forum.lvlup.pro

Nikt się tutaj nie unosi, tylko twoje wróżenie z fusów było po prostu głupie, bo to oczywiste, że każda firma stara się mieć jak najlepsze usługi i najlepszą ich dostępność. Firma OVH informuje chyba o wszystkich większych incydentach, nawet jest specjalna strona od tego: http://travaux.ovh.net/

koweq
koweq

dennijs:

Często takie sytuację będą miały miejsce

To tylko brzmi jak stwierdzenie czy jest stwierdzeniem?

Nieznajomy11
Nieznajomy11 Moderator forum.lvlup.pro

hacker @dennijs zapowiada ataki na ovh :kappa:

SystemZ
SystemZ Admin lvlup.pro

Nie wiem skąd ta prawdopodobna wrogość, nie miałem nic złego na myśli :slight_smile: Może po prostu łudziłem się że ktoś zna powód tych problemów z PCI w OVH, ponad 300 dni śmigało bez przerw a teraz downtime po kilka godzin 22 i 26 czerwca 😰