Потеря производительности через 30 минут

Это меня озадачило. У меня Ubuntu 14.04, 3 дня назад (2014-20-10) он начал замедляться.

Я воспроизвел его, открыв gedit, а затем закрыв gedit, когда проблема активна, она набирает примерно 2 секунды для закрытия пустого файла, в то время как без проблемы это всегда мгновенно - влияет на все остальное аналогичным образом.

top не сообщает о необычной активности при замораживании, htop же, iotop тоже.

Проблема возникает только после 30 минут безотказной работы, я могу гарантировать, что в течение 29 минут времени безотказной работы я не смог ее воспроизвести, в течение 31 минуты безотказной работы я мог бы воспроизвести это последовательно (используя вышеуказанный метод, ни одно приложение не запускало другие чем терминал и htop) и удалось повторить это 4 или 5 раз (путем выключения, загрузки и ожидания на полчаса - что было приятным).

Проблема сохраняется даже после перезагрузки, но может быть сброшена путем отключения и включения резервной копии, какая часть состояния Ubuntu сохраняется после перезагрузки, но не выключения?

Релевантные журналы за этот период syslog, auth.log и Xorg.0.log (путем изучения содержимого / var / log для изменения времени в указанном диапазоне)

syslog:

Oct 22 17:21:36 raiden NetworkManager[1102]: <warn> nl_recvmsgs() error: (-33) Dump inconsistency detected, interrupted
Oct 22 17:39:01 raiden CRON[3284]: (root) CMD (  [ -x /usr/lib/php5/maxlifetime ] && [ -x /usr/lib/php5/sessionclean ] && [ -d /var/lib/php5 ] && /usr/lib/php5/sessionclean /var/lib/php5 $(/usr/lib/php5/maxlifetime))
Oct 22 18:09:01 raiden CRON[3370]: (root) CMD (  [ -x /usr/lib/php5/maxlifetime ] && [ -x /usr/lib/php5/sessionclean ] && [ -d /var/lib/php5 ] && /usr/lib/php5/sessionclean /var/lib/php5 $(/usr/lib/php5/maxlifetime))

authlog:

Oct 22 17:39:01 raiden CRON[3283]: pam_unix(cron:session): session opened for user root by (uid=0)
Oct 22 17:39:01 raiden CRON[3283]: pam_unix(cron:session): session closed for user root
Oct 22 18:09:01 raiden CRON[3369]: pam_unix(cron:session): session opened for user root by (uid=0)
Oct 22 18:09:01 raiden CRON[3369]: pam_unix(cron:session): session closed for user root
Oct 22 18:17:01 raiden CRON[3495]: pam_unix(cron:session): session opened for user root by (uid=0)
Oct 22 18:17:01 raiden CRON[3495]: pam_unix(cron:session): session closed for user root

Xorg.0.log: (возможно, я просто пробуждаю компьютерную резервную копию)

[  3466.727] (II) intel(0): switch to mode 1366x768@60.0 on LVDS1 using pipe 0, position (0, 900), rotation normal, reflection none
[  3466.880] (II) intel(0): switch to mode 1600x900@60.0 on VGA1 using pipe 1, position (0, 0), rotation normal, reflection none

Ни один из них не указывает на что-то плохое и последующие шаги для воспроизведения проблемы указывают на отсутствие изменений в (d10)

Я предполагаю, что есть 3 возможных источника этой проблемы:

Установка программного обеспечения: я установил что-то хитрое

I сделал:

история | grep apt-get '- нет инсталляций за этот период. Посмотрел историю синтаксического менеджера пакетов - ничего за этот период. История программного центра - последнее обновление было за несколько недель до этого (была проблема с зависимостями, поэтому я не делал никаких обновлений в в то время как) я установил Skype для Ubuntu в течение этого периода времени, но нет никаких указаний на то, что это вызвано Skype (удалено в любом случае)

Установка программного обеспечения: я установил что-то хитрое

Проверено cronjobs в crontab, /etc/cron.d /etc/cron.daily и ежечасно ничего, что указывает на то, что там только что задание PHP cron происходит каждые 30 минут, но если бы это было cron, это сделало бы это в определенных точках вокруг часы не через 30 минут после запуска.

Анализ новых процессов, которые были начаты между состоянием без замедления и замедлением, указывает, что никаких новых процессов не запускается (сначала проверьте, что это вызвало поток kworker, но это, вероятно, просто совпадение). Я полагаю, это должно означать, что это либо существующий процесс, вызвавший его, либо что-то еще.

Malware

Из-за его неуловимости и загадочного 30-минутного отсутствия проблемы (30 минут кажется время, выбранное человеком). Я начал думать, что это может быть какая-то вредоносная программа, но маловероятно, что это может быть (не сделал какое-то обновление и несколько открытых портов). Итак, побежал rkhunter (поиск руткитов), но ничего не было найдено.

Другие вещи, которые я пробовал:

history | grep apt-get '- нет инсталляций за этот период Перезапуск compiz - без изменений Посмотрел историю истории синаптического пакета - ничего в этот период времени Играя на разных музыкальных инструментах, пока ждем времени безотказной работы до 30 минут, а затем просмотр результатов top и htop для любых подозрительных изменений - ничего странного

У кого-нибудь было что-то похожее на это с ними или может указать мне в правильном направлении, если вы это сделаете повторно нажимайте кнопку повторного голосования на свой ответ (я буду уверен, что это нечетное число)

1
задан 24 October 2014 в 00:52

1 ответ

Есть несколько способов настроить cron для запуска задания через 30 минут после запуска. Дженкинс делает это путем хэширования функции и, например, с помощью H/30 * * * *.

Некоторые идеи там:

Вы пытались использовать htop как root? Некоторые процессы могут быть невидимыми, я видел это особенно на Debian.

Вы пытались выйти из системы / войти в систему при возникновении проблемы? Может быть диспетчером окон или проблемой сеанса.

Если вход / вход не работает, вы можете попробовать перезапустить диспетчер сеансов. Я думаю, что это lightdm по умолчанию, поэтому sudo service lightdm restart должен это сделать.

1
ответ дан 24 May 2018 в 02:34
  • 1
    Спасибо за предложения, вход в систему и выход из нее, к сожалению, сохраняет проблему, когда это происходит (после 30 минут после включения питания). Даже перезагрузка по-прежнему вызывает замедление (не нужно ждать 30 минут после перезагрузки), я попробую htop как root, это хороший, я должен буду дать ему полчаса. Да, это лампочка, я тоже попробую. – alex.p 24 October 2014 в 01:27
  • 2
    Пробовал перезагружать lightdm, но он просто пошел на черный экран, поэтому пришлось перезагрузить компьютер. htop с root также не имеет ничего интересного, когда я ничего не делаю, процессор в значительной степени стоит 0.1 - 0.5% процессора, поэтому он отлично выглядит на ходу, компилятор кажется самым сложным процессом, но у меня есть попробовал отключить компиляцию. – alex.p 24 October 2014 в 02:49
  • 3
    Хорошо, возможно, что вы потеряли свет, потому что он возродился в другом tty. Попробуйте ctrl + alt + F7 через F12, вы должны найти его обратно. F1-F6 являются консолями и F7-F12 являются графическими. Повторите, что я думаю, что это того стоит. После этого вы можете попытаться убить lightdm с помощью service lightdm stop, войдите в систему как root в tty1 и попробуйте поместить ps aux в файл раньше, другой файл после и diff их, чтобы увидеть, есть ли какой-либо нежелательный процесс. Поэтому запустите ps aux > ps1.txt непосредственно перед замедлением, ps aux > ps2.txt и diff ps1.txt ps2.txt после замедления. Отправьте вывод в pastebin и ссылку здесь. – Johnride 24 October 2014 в 03:14
  • 4
    Хорошо, вы научили меня чему-то новому, не знали, что эти ярлыки соответствуют разным ttys, спасибо. Эта ссылка pastebin.com/iLAAehGB показывает разницу ps-aux между периодами времени 29m40s и 30m10s, поэтому должно быть гарантировано находиться в диапазоне проблемы. Я попытаюсь повторить проблему еще раз и сделать еще один diff, чтобы узнать, имеют ли отличия что-то общее с diff выше. – alex.p 24 October 2014 в 15:09
  • 5
    О, да, забыл упомянуть, что я попытался отключить свет dm, а затем вернусь к правильному графическому титу, как вы предполагали, но к сожалению, все еще наблюдалось замедление. – alex.p 24 October 2014 в 15:22

Другие вопросы по тегам:

Похожие вопросы: