Возвращаюсь к своей проблеме :(
Приехал проц, заменил - не помогло. Поставил обычные Dedian, начал настраивать на нем KVM, на следующее утро обнаружил, что сервер снова перегружался. (с электричеством все в порядке, рядом стоит QNAP и еще один комп, с ними все в порядке).
Таким образом, делаю вывод:
- Это не программная проблема, т.к. проявляется на разных ОС (Proxmox, Debian)
- ОЗУ проверил с помощью Memtest и вручную вставлял по одной планке в разные разъемы
- Замена процессора, также не помогла.
Остается только мать и БП? Что можете дополнительно посоветовать?
Поставил винду. Спонтанные перезагрузки остались.
Вывод - проблема аппаратная.
Можно как-то мать протестировать на ошибки/сбои какие-нибудь или это только в сервис?
Если сервак брендовый, сдавайте в сервис. Я с таким сталкивался и даже не раз. Правда сервера были на гарантии. Меняли материнские платы. Было то же самое - спонтанные ребуты. Причем у меня проблема была в перегреве каких-то узлов. Когда открывал крышку сервера и ставил его на самый верх шкафа, где стоял кондиционер, ребуты были реже.
Вообще, при ребутах произвольных, я в первую очередь проверяю БП.
Все-таки проблема была в ядре линукс. Винда не перезагружалась и работала норм.
В конечном итоге у меня, как у @zerox появился еще один сервер, только без корпуса :-D
Очередные гугления на тему перезагрузок Proxmox привели к такому решению:sudo nano /etc/default/grub
в строку GRUB_CMDLINE_LINUX_DEFAULT
добавляем intel_idle.max_cstate=1
строка будет выглядеть так:GRUB_CMDLINE_LINUX_DEFAULT=”quiet splash intel_idle.max_cstate=1”
Сохраняем, выходим, обновляем конфиг grubsudo update-grub
Перезагружаемся. Этими действиями мы отключаем какие-то энергосберегающие настройки, видимо они сильно ограничивали проц.
После этого уже 3 суток аптайм без сбоев.