• veresk
    veresk
    2021-01-05

    @Александр это ж маздай, чо ж ты хотел. Там во всех инструкциях пишут, что "ну если что то что-то могло пойти не так"

    0
  • Александр
    Александр
    2021-01-05

    @veresk Да, так я узнал, что там на этот случай даже скрипт для восстановления идёт в комплекте.

    Это вам не линукс, тут всё предусмотрено.

    0
  • veresk
    veresk
    2021-01-05

    @Александр "легко не бояться Линукса..."

    0
  • Iron Bug
    Iron Bug
    2021-01-05

    @Александр ну, маздай сам по себе глючное говно. но вообще, в железе тоже бывают баги. причём я пару раз напарывалась на баги на серверах и там была вообще мистика. видела одновременное конфликтное обращение к шине от разных ядер. видела глюки с системным таймером. видела косяки с БП, которые приводили к непредсказуемому поведению. как хардварщик я это понимаю. в железе косяки отловить сложнее, чем в софте. но каждый раз, когда напарываешься на такие косяки, - это дикий гемор и необъяснимые глюки системы.

    0
  • Iron Bug
    Iron Bug
    2021-01-05

    @Александр один раз помню случай. три одинаковый сервера с Xeon'ами, на борту 128 гигов оперативы, ничего особенного. софт одинаковый, Linux, я его сама накатывала. все три работали в неком подобие кластера для улучшения производительности и надёжности сервиса при пиковых нагрузках (это был телеком, онлайн тарификация). и два работали нормально, а третий периодически вырубался. внешне это выглядело как кернел паник и зависание. причём мы меняли память, меняли даже процы. но нифига не помогало, пока его целиком не заменили.

    0
  • Александр
    Александр
    2021-01-05

    @Iron Bug Тут виртуальная среда, так что ещё и гипервизор можно добавить.

    У нас тоже как-то был дивный случай, купили несколько серверов и один переставал грузиться, как будто прошивка встроенного контроллера дисков слетала. Причём не сразу, его успевали развернуть и погонять. ХэПэ три раза приезжал и менял мать. На третий раз они позвонили и сказали, что если мы что-то знаем, то они просят перестать, так как гарантия гарантией, а матери дорогие и идут на утилизацию :)

    В очередной раз заменили ещё и исправную на вид back plane, это помогло. Никто не понял как она могла убивать прошивку контроллера.

    А недорогие серверы, которые как-то хитро глючили, у нас всегда были. Мы их много покупали и иногда попадались экземпляры, которые проходили любые тесты, стояли под максимальной нагрузкой по две недели без ошибок - но на какой-нибудь нужной нам невинной фигне глючили и их приходилось убирать из прода.

    0