November 2019

S M T W T F S
      12
34 5 678 9
10111213141516
17181920212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Monday, July 28th, 2008 01:00 pm
Попросите, пожалуйста, свой саппорт читать вопросы, прежде чем на них отвечать.
Потому что когда я явно спрашиваю о происхождении проблем, наблюдавшихся несколько дней назад, и привожу логи, мне несколько непонятно назначение ответа "сейчас всё работает". Это я и сам вижу.

Upd: "К сожалению, мы не можем точно установить причину, по которой контент не
отдавался 24 июля.
Скорее всего, в тот момент была высокая нагрузка на сервер, вследствие чего
наблюдалась вышеописанная проблема."
Monday, July 28th, 2008 02:03 pm (UTC)
да, там именно так. снаружи nginx, внутри апач. но мониторинг-то должен быть? я понимаю, если один раз что-то не отдалось, это фигня. но за 15 минут ничего не заметить..
Monday, July 28th, 2008 02:45 pm (UTC)
Ну даже если заметили мониторингом, в логи-то всё-равно конкретные причины обычно не пишутся - по логам их можно только косвенно расследовать, да и то не всегда.
Что равносильно "К сожалению, мы не можем точно установить причину, по которой контент не отдавался"

Monday, July 28th, 2008 04:06 pm (UTC)
сценарий (не имеет ничего общего с реальностью, но все же:)

апач жив, но течет, дети достигают критического размера, но пока еще не дохнут. мониторинг показывает живой апач и живой нгинкс,мониторинг начинает орать на 502 ошибку ( если это хороший мониторинг) или клиенты начинают орать про 502 (если мониторинг плохой). администраторы видят что апач жив и теоретически работает, у администраторов наступает состояние " они не знают ".
ну а дальше либо тупо рестартуется апач, либо убивается источник проблемы и апач оживает.
Monday, July 28th, 2008 04:14 pm (UTC)
я искренне надеюсь, что администраторы в мастерхосте достаточно грамотны, чтобы такую ситуацию понять
Monday, July 28th, 2008 06:48 pm (UTC)
Конечно грамотны. Ну а толку?

Это же традиционный виртуальный хостинг, а не cloud, до конца решить такую проблему с повышенными нагрузками нереально. Ну, N сайтов на другую машинку перенести. И дальше существовать как-то. А делать хостинговый cloud - долго, дорого и незачем.

Вот то что саппорты стали отвечать на тикеты не читая, это беда .м.
Edited 2008-07-28 06:48 pm (UTC)
Monday, July 28th, 2008 06:54 pm (UTC)
Насчет ответа о причинах тоже не все просто. Проблема в том, что не все, спрашивающие о причинах, достаточно грамотны; фактически, если принять решение давать внятный и честный ответ на вопрос "а что было?", нужно будет по каждой 15-минутной проблеме писать текст с полстраницы А4. Кто этим будет заниматься? Зачем?

Это реально делать лишь для повторяющихся проблем или каких-то серьезных аварий, затрагивающих много пользователей.

Отвечать лаконичным техническим описанием проблемы невозомжно, это вызывает резкий негатив у минимум половины интересующихся клиентов.
Edited 2008-07-28 06:54 pm (UTC)
Monday, July 28th, 2008 07:49 pm (UTC)
меня бы устроил ответ типа "были проблемы, связанные с тем-то, мы предприняли то-то, надеемся, что ситуация не повторится". А рассказывать клиенту, что хостер не владеет ситуацией..