Сбой в работе ЖЖ объяснили «падением» сереров с дневниками топ-блогеров
Сбой в работе блогохостинга LiveJournal был связан с одновременными авариями на двух группах серверов (кластерах), содержащих пользовательские данные. Об этом 17 мая рассказал глава LiveJournal Russia Илья Дронов.
Он отметил, что в ночь с 15 на 16 мая был обнаружен сбой в седьмом из 13 кластеров ЖЖ. На этом кластере хранится, в частности, дневник оппозиционера Алексея Навального. Специалистам пришлось восстанавливать содержимое серверов, скопировав данные с резервного кластера (при этом сам кластер-дублер было решено отключить на время копирования, чтобы обезопаситься от новых аварий).
В процессе восстановления кластера №7, пишет Дронов, система мониторинга отчиталась о нарушении в очередной группе серверов — №9. На ней, а именно, расположен ежедневник Рустема Адагамова, занимающий 1-ое место в рейтинге ЖЖ. Содержимое этого кластера также пришлось восстанавливать при помощи «зеркала», которое было отключено на время операции. Перенос огромного объема данных загрузил интернет-каналы, применяемые в инфраструктуре ЖЖ, и восстановительные работы заняли значимый просвет времени.
Из-за отключения 2-ух кластеров юзеры, чьи дневники расположены на их, не могли воспользоваться ЖЖ. Не считая того, ошибку лицезрели и те юзеры, которые пробовали (например, в френдленте) получить доступ к записям, расположенным на одном из выключенных серверов. К утру 17 мая по столичному времени обычная работа LiveJournal была восстановлена.
Илья Дронов выделил, что предстоит еще узнать, по какой причине фактически сразу вышли из строя сходу два кластера. Юзерам платных сервисов в качестве компенсации продлят действие их услуг на неделю.
ЖЖ не 1-ый раз в этом году сталкивается с суровыми сбоями. Так, сервис оказался недоступен с конца декабря 2012 года по начало января 2013. Тогда Илья Дронов заявил,что предпосылкой проблем стала сработавшая система защиты от DDoS-атак.