У меня такая же проблема, но при загрузке в Windows я использую программное обеспечение для управления AMD.
Просто переключите управление вентилятором с автоматического на ручное, а затем снова на авто.
I имеют XFX Radeon HD 6670
Ваши коробки не подключены к ИБП? Если вы это сделаете, обычно есть регистрация и поддержка для этого, и вы будете ясно видеть, когда мощность падает на ИБП и когда сервер идет вниз из-за безопасного завершения работы. Возможно, вам будет задан вопрос: https://unix.stackexchange.com/questions/13714/how-to-properly-prepare-a-server-for-power-outages7
Когда есть не любой ИБП трудно «написать журнал», когда нет питания. Это невозможно. Вы можете отключить электропитание, чтобы отключить другие причины.
Я рекомендую контролировать все важные параметры ваших ящиков, чтобы решить, что отключает вашу систему. Может быть сбоем компонента в качестве материнской платы или памяти (обычно некоторые bluescreens / mem michmatched), или CPU и вентиляторы (перегрев заканчивается при выключении), или ошибки жесткого диска HDD (плохие кластеры на системных ресурсах), каждый из них имеет некоторые типичные симптомы.
Посмотрите на / var / log / syslog /var/log/kern.log, если есть что-то интересное.
Отключение питания может быть записано в системном BIOS. Вы можете попытаться прочитать журнал системной BIOS, если таковой имеется, но он будет разрабатываться, поскольку каждый сервер отличается таким образом. Но это не обязательно, расскажите, что происходит, и почему «сервер отключается». Попробуйте выполнить команду dmidecode, чтобы получить информацию о BIOS, но я сомневаюсь, что будет журнал.
или .. если вы не хотите инвестировать в ИБП, вы можете, по крайней мере, следить за линией электропитания через (имеет baterry и может читать и регистрировать статус менеджера электропитания), попробуйте записать grep 'Adapter' из acpi -V, так как он должен написать что-то вроде Adapter 0: on/off-line
acpi -V |grep 'Adapter'