Наличие экземпляра AWS EC2, на котором работает Discourse в течение нескольких лет.
В течение нескольких недель / месяцев случается, что после некоторых обновлений Discourse (через веб-интерфейс Discourse) система останавливается. Тогда он больше не будет доступен через SSH и даже через веб-соединение EC2 SSH.
Обычно я перезапускал всю машину через веб-панель администратора AWS ECS, а затем смог подключиться снова, как через SSH, так и через HTTPS.
(К сожалению, я не стал исследовать причину проблемы.)
Сегодня система снова зависла после обновления Discourse.
Но на этот раз никакая перезагрузка или что-то еще не помогло. Система остается недоступной через SSH даже после нескольких часов ожидания.
Мониторинг EC2 также не показывает мне высокой нагрузки на сервер:
Как мне снова получить доступ через SSH к экземпляру EC2 Ubuntu ?
После еще одной перезагрузки и некоторого времени ожидания система снова возвращается из ниоткуда.
Мне кажется, что на диске достаточно свободного места (больше места на диске не было одно из моих предположений, почему система была недоступна).
Filesystem Size Used Avail Use% Mounted on
udev 2.0G 0 2.0G 0% /dev
tmpfs 394M 876K 393M 1% /run
/dev/xvda1 97G 31G 67G 31% /
tmpfs 2.0G 0 2.0G 0% /dev/shm
tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs 2.0G 0 2.0G 0% /sys/fs/cgroup
/dev/loop1 18M 18M 0 100% /snap/amazon-ssm-agent/1566
/dev/loop0 98M 98M 0 100% /snap/core/10185
/dev/loop2 29M 29M 0 100% /snap/amazon-ssm-agent/2012
/dev/loop3 98M 98M 0 100% /snap/core/10126
overlay 97G 31G 67G 31% /var/lib/docker/overlay2/5a799ab040002ad2ddec94ae85bcbe987543651a0d9478ddc12ab12715da7340/merged
tmpfs 394M 0 394M 0% /run/user/1000
Теперь я пытаюсь выяснить, есть ли какие-либо журналы, указывающие на причину сбоя.
По запросу Хейннема, здесь является полным результатом sudo cat /etc/netplan/*.yaml[1163343 provided:[1233 visible
Для Amazon AWS EC2 необходимо использовать такой файл .yaml. Тогда SSH будет работать.
# This file is generated from information provided by the datasource. Changes
# to it will not persist across an instance reboot. To disable cloud-init's
# network configuration capabilities, write a file
# /etc/cloud/cloud.cfg.d/99-disable-network-config.cfg with the following:
# network: {config: disabled}
network:
version: 2
renderer: networkd
ethernets:
eth0:
match:
macaddress: 06:a0:68:ea:54:4e
set-name: eth0
bridges:
br0:
dhcp4: true
macaddress: 06:a0:68:ea:54:4e
interfaces:
- eth0
Примечание. Возможно, вам потребуется создать /etc/cloud/cloud.cfg.d/99-disable-network-config.cfg
network: {config: disabled}
sudo netplan --debug generate
sudo netplan apply
reboot # mandatory
Проверьте эту ссылку для получения дополнительной информации. Информация.