Один из моих серверов выходит из строя раз в несколько дней.
Он выполняет статическое веб-обслуживание с низким трафиком + динамическое веб-обслуживание с низким трафиком (PHP, локальный MYSQL с небольшими данными, APC, MEMCACHE) + некоторые фоновые задания, такие как обработка файлов XML.
Единственная подсказка, которую я имею, состоит в том, что за несколько часов до того, как сервер умирает, он начинает меняться (см. Скриншот http://awesomescreenshot.com/075xmd24 ). ]
Подробности сервера: Ubuntu 11.10 oneiric i386 scalarizr (0.7.185) python 2.7.2, chef 0.10.8, mysql 5.1.58, apache 2.2.20, php 5.3.6, memcached 1.4.7 Amazon EC2 west-1)
Как определить причину сбоя сервера? Когда он падает, он больше не доступен из внешнего мира.
Установите linux-crashdump
, по крайней мере, вы получите буферы регистрации ядра непосредственно перед сбоем и все данные, необходимые профессионалу, чтобы прочесать проблему, чтобы определить первопричину.