Я установил настольную версию Ubuntu 16.04 на машине и использовал ее для моего исследования через ssh.
Иногда машина перезапускает случайным образом, но я не могу найти почему перезапуск.
$ last reboot
reboot system boot 4.4.0-62-generic Wed Feb 8 01:34 still running
reboot system boot 4.4.0-62-generic Mon Feb 6 09:16 still running
reboot system boot 4.4.0-62-generic Sun Feb 5 16:43 still running
reboot system boot 4.4.0-62-generic Sun Feb 5 00:37 still running
Я проверил /var/log/syslog
...
Feb 7 23:31:37 niaserver7 systemd[1]: Started Session 77 of user swmo.
Feb 8 00:17:01 niaserver7 CRON[17883]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Feb 8 00:34:07 niaserver7 systemd[1]: Started CUPS Scheduler.
Feb 8 01:17:01 niaserver7 CRON[17893]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
Feb 8 01:35:01 niaserver7 rsyslogd: [origin software="rsyslogd" swVersion="8.16.0" x-pid="1315" x-info="http://www.rsyslog.com"] start
Feb 8 01:35:01 niaserver7 systemd-modules-load[538]: Inserted module 'lp'
Feb 8 01:35:01 niaserver7 systemd-modules-load[538]: Inserted module 'ppdev'
Feb 8 01:35:01 niaserver7 kernel: [ 0.000000] Initializing cgroup subsys cpuset
Feb 8 01:35:01 niaserver7 rsyslogd-2222: command 'KLogPermitNonKernelFacility' is currently not permitted - did you already set it via a RainerScript command (v6+ config)? [v8.16.0 try http://www.rsyslog.com/e/2222 ]
Feb 8 01:35:01 niaserver7 systemd-modules-load[538]: Inserted module 'parport_pc'
Feb 8 01:35:01 niaserver7 rsyslogd: rsyslogd's groupid changed to 108
Feb 8 01:35:01 niaserver7 rsyslogd: rsyslogd's userid changed to 104
Feb 8 01:35:01 niaserver7 loadkeys[541]: Loading /etc/console-setup/cached.kmap.gz
Feb 8 01:35:01 niaserver7 kernel: [ 0.000000] Initializing cgroup subsys cpu
Feb 8 01:35:01 niaserver7 systemd[1]: Started udev Kernel Device Manager.
Как я могу зафиксировать его?
Это походит на комбинацию проблем.
В случае отдельной системы, перезагружающей случайным образом, я хотел бы заменить источник питания в шасси с тем, которое обеспечило [еще 115], чем соответствующий сила тока для связанных компонентов (поскольку Вы хотите, чтобы это продолжало бежать в течение периодов пиковой мощности, тянут).
В случае, где вся перезагрузка стойки одновременно я посмотрел бы на несоответствующий UPS как на первопричину или возможно условие перегревания из-за отказа питания электрической сети в месте сервера.
неустойчивое короткое в проводе канала к мультикасанию могло также привести к результату перезагрузки нескольких, который Вы описываете.
Если Ваш разъединять имеет BMC (контроллер соединительной платы), можно проверить на падения напряжения со следующей установленной командой:
ipmitool sel list|grep -i power
можно установить ipmitool с
apt install ipmitool
здесь вывод в качестве примера:
4 | Pre-Init |0000000057| Power Unit #0x3f | Power off/down | Deasserted d | Pre-Init |0000000021| Power Unit #0x3f | Power off/down | Deasserted 13 | Pre-Init |0000000022| Power Unit #0x3f | Power off/down | Deasserted 16 | 09/12/2013 | 14:18:00 | Power Supply #0x30 | Presence detected | Asserted 17 | 09/12/2013 | 14:18:00 | Power Supply #0x31 | Presence detected | Asserted
Также удостоверяются, что Вы загрузили модуль ядра для ipmi:
modprobe ipmi_devintf
Для загрузки модуля можно также свериться с командой dmesg:
dmesg|grep ipmi
Я также столкнулся со случайной проблемой перезапуска с Ubuntu. Я попробовал ниже, и это, кажется, работает.