TL; DR: Моя система полностью замерзала - нет мыши, клавиатуры и т. д. Экран был полностью заморожен. Я думал, что это связано с файловой системой, но это была проблема с драйвером Nvidia. Я попытался переключиться с Unity на xfce4, но случайные зависания все еще происходят.
Недавно я установил новую копию Ubuntu 16.04 на моем старом ноутбуке и хотел скопировать некоторые файлы на него с моего внешнего жесткого диска ( Seagate 4TB SRD0NF1). Поэтому я подключил свой жесткий диск, перешел в папку с наутилусом, а затем, прежде чем смог его скопировать, все застыло. Отсутствие возможности перемещения мыши - полностью заморожено. Поэтому я отключился, нажав кнопку питания и несколько раз повторил попытку, и он застыл еще несколько раз, но в последний раз мне удалось скопировать около 10% файлов (всего около 160 000 файлов) на мой рабочий стол прежде чем он снова замерзнет.
Итак, я подумал, что это была какая-то странная ошибка в том, как Linux обрабатывал внешний жесткий диск, но потом, после перезагрузки и отключения жесткого диска, я решил открыть чтобы увидеть, какие файлы удалось скопировать. И Ubuntu снова замерз.
Итак, теперь я думаю, что это имеет какое-то отношение к самим файлам, но я понятия не имею. Они вложены очень глубоко, и там, вероятно, есть очень длинные имена файлов, если это имеет значение (я помню, что Windows столкнулась с такими проблемами) (см. Править). Вот мой syslog прямо перед сбоем:
Jan 29 21:22:49 joe-l502x dbus[910]: [system] Activating via systemd: service name='org.freedesktop.hostname1' unit='dbus-org.freedesktop.hostname1.service'
Jan 29 21:22:49 joe-l502x systemd[1]: Starting Hostname Service...
Jan 29 21:22:49 joe-l502x dbus[910]: [system] Successfully activated service 'org.freedesktop.hostname1'
Jan 29 21:22:49 joe-l502x systemd[1]: Started Hostname Service.
Jan 29 21:22:49 joe-l502x org.gtk.vfs.Daemon[1687]: ** (process:2120): WARNING **: send_done_cb: No such interface 'org.gtk.vfs.Enumerator' on object at path /org/gtk/vfs/client/enumerator/2 (g-dbus-error-quark,
19)
Jan 29 21:22:51 joe-l502x kernel: [ 231.057723] NVRM: GPU at PCI:0000:01:00: GPU-e89c676b-485a-4551-fc4f-e23db62c065d
Jan 29 21:22:51 joe-l502x kernel: [ 231.057736] NVRM: Xid (PCI:0000:01:00): 32, Channel ID 00000003 intr 80804000
Jan 29 21:22:52 joe-l502x kernel: [ 231.059903] NVRM: Xid (PCI:0000:01:00): 62, !18bc(0ed4)
Jan 29 21:22:52 joe-l502x org.gtk.vfs.Daemon[1687]: ** (gvfsd:1758): WARNING **: dbus_mount_reply: Error from org.gtk.vfs.Mountable.mount(): Failed to retrieve share list from server: Connection refused
Jan 29 21:22:52 joe-l502x org.gtk.vfs.Daemon[1687]: ** (process:2374): WARNING **: Couldn't create directory monitor on smb://x-gnome-default-workgroup/. Error: The specified location is not mounted
Jan 29 21:22:55 joe-l502x org.gtk.vfs.Daemon[1687]: ** (gvfsd:1758): WARNING **: dbus_mount_reply: Error from org.gtk.vfs.Mountable.mount(): Failed to retrieve share list from server: Connection refused
Jan 29 21:22:55 joe-l502x org.gtk.vfs.Daemon[1687]: ** (process:2391): WARNING **: Couldn't create directory monitor on smb://x-gnome-default-workgroup/. Error: The specified location is not mounted
Jan 29 21:22:55 joe-l502x kernel: [ 235.057714] NVRM: Xid (PCI:0000:01:00): 32, Channel ID 00000003 intr 80804000
Я linux noob, поэтому я действительно не знаю, что происходит в этих журналах. Кто-нибудь знает, что здесь происходит? Итак, теперь я думаю, что это имеет какое-то отношение к самим файлам, но я понятия не имею. Они вложены очень глубоко, и там, вероятно, есть очень длинные имена файлов, если это имеет значение (я помню, как Windows столкнулась с такими проблемами) Любые другие журналы, на которые я должен смотреть? Спасибо!
Хорошо, похоже, что это связано с этими сообщениями GPU. Вот еще один сбой:
<< FREEZES HERE >>
Jan 29 21:52:22 joe-l502x kernel: [ 90.715448] NVRM: GPU at PCI:0000:01:00: GPU-e89c676b-485a-4551-fc4f-e23db62c065d
Jan 29 21:52:22 joe-l502x kernel: [ 90.715457] NVRM: Xid (PCI:0000:01:00): 13, Graphics SM Warp Exception on (GPC 0, TPC 0): Illegal Instruction Encoding
Jan 29 21:52:22 joe-l502x kernel: [ 90.715466] NVRM: Xid (PCI:0000:01:00): 13, Graphics SM Global Exception on (GPC 0, TPC 0): Physical Multiple Warp Errors
Jan 29 21:52:22 joe-l502x kernel: [ 90.715472] NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ESR 0x504648=0x9 0x504650=0x4 0x504644=0x1beff2 0x50464c=0xf
Jan 29 21:52:22 joe-l502x kernel: [ 90.715494] NVRM: Xid (PCI:0000:01:00): 13, Graphics SM Warp Exception on (GPC 0, TPC 1): Illegal Instruction Encoding
Jan 29 21:52:22 joe-l502x kernel: [ 90.715500] NVRM: Xid (PCI:0000:01:00): 13, Graphics SM Global Exception on (GPC 0, TPC 1): Physical Multiple Warp Errors
Jan 29 21:52:22 joe-l502x kernel: [ 90.715506] NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ESR 0x504e48=0x9 0x504e50=0x4 0x504e44=0x1beff2 0x504e4c=0xf
Jan 29 21:52:22 joe-l502x kernel: [ 90.715526] NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ChID 0001, Class 00009197, Offset 00000100, Data 0fffcc00
Jan 29 21:52:58 joe-l502x systemd[1]: Stopping User Manager for UID 108...
Jan 29 21:52:58 joe-l502x systemd[1163]: Reached target Shutdown.
Jan 29 21:52:58 joe-l502x systemd[1163]: Stopped target Default.
Jan 29 21:52:59 joe-l502x systemd[1163]: Starting Exit the Session...
Jan 29 21:52:59 joe-l502x systemd[1163]: Stopped target Basic System.
Jan 29 21:52:59 joe-l502x systemd[1163]: Stopped target Paths.
Jan 29 21:52:59 joe-l502x systemd[1163]: Stopped target Timers.
Jan 29 21:52:59 joe-l502x systemd[1163]: Stopped target Sockets.
Jan 29 21:52:59 joe-l502x systemd[1163]: Received SIGRTMIN+24 from PID 2399 (kill).
Jan 29 21:52:59 joe-l502x systemd[1]: Stopped User Manager for UID 108.
Jan 29 21:52:59 joe-l502x systemd[1]: Removed slice User Slice of lightdm.
И это не похоже на nautilius («Файлы»). Вот сообщение об ошибке, которое я получаю при открытии с помощью «проводника файлов» Thunar:
Jan 29 22:08:50 joe-l502x kernel: [ 843.694898] NVRM: GPU at PCI:0000:01:00: GPU-e89c676b-485a-4551-fc4f-e23db62c065d
Jan 29 22:08:50 joe-l502x kernel: [ 843.694903] NVRM: Xid (PCI:0000:01:00): 44, Ch 00000001, engmask 00000101, intr 10000000
Jan 29 22:08:50 joe-l502x kernel: [ 844.196602] NVRM: Xid (PCI:0000:01:00): 39, CCMDs 00000007 000090b5
Переход к папке и копирование через терминал прекрасно работают, поэтому это не похоже на что-то конкретное с файловой системой.
Моя видеокарта - это Nvidia GTX 540M, а мой драйвер - версия 384.111.
И на самом деле, я помню аналогичное замораживание происходит, когда я использую GUI для инструмента настройки единства пару недель назад. Значит, это может иметь какое-то отношение к Единству? Или Xorg?
Подтверждено, что это, скорее всего, не имеет ничего общего с файловой системой. Я просто замерзал в графическом интерфейсе Ubuntu System Settings > Software & Updates. Очень похожие журналы:
Jan 30 06:33:51 joe-l502x kernel: [30264.899235] NVRM: GPU at PCI:0000:01:00: GPU-e89c676b-485a-4551-fc4f-e23db62c065d
Jan 30 06:33:51 joe-l502x kernel: [30264.899241] NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: Shader Program Header 6 Error
Jan 30 06:33:51 joe-l502x kernel: [30264.899245] NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: Shader Program Header 9 Error
Jan 30 06:33:51 joe-l502x kernel: [30264.899248] NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: Shader Program Header 18 Error
Jan 30 06:33:51 joe-l502x kernel: [30264.899252] NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ESR 0x405840=0xa0040240
Jan 30 06:33:51 joe-l502x kernel: [30264.899267] NVRM: Xid (PCI:0000:01:00): 13, Graphics Exception: ChID 0001, Class 00009197, Offset 00000100, Data 0fffcc00
Определенно кажется, что это связано с взаимодействием между моим GPU и некоторой библиотекой / вещью Linux GUI.
Кто-то направил меня на /var/log/Xorg.0.log.old, и я думаю, что это в основном подтверждает 100%, что это драйвер nvidia:
[ 30246.723] (--) NVIDIA(GPU-0): DFP-0: disconnected
[ 30246.723] (--) NVIDIA(GPU-0): DFP-0: Internal TMDS
[ 30246.723] (--) NVIDIA(GPU-0): DFP-0: 165.0 MHz maximum pixel clock
[ 30246.723] (--) NVIDIA(GPU-0):
[ 30246.723] (--) NVIDIA(GPU-0): DFP-0: disconnected
[ 30246.723] (--) NVIDIA(GPU-0): DFP-0: Internal TMDS
[ 30246.723] (--) NVIDIA(GPU-0): DFP-0: 165.0 MHz maximum pixel clock
[ 30246.723] (--) NVIDIA(GPU-0):
[ 30267.150] (EE) NVIDIA(0): The NVIDIA X driver has encountered an error; attempting to
[ 30267.150] (EE) NVIDIA(0): recover...
<< but it never recovers :( >>