18,04 zfs+lxd вызывают контейнерный хост перезагрузки под большой нагрузкой?

Потраченный на несколько дней, борясь с этим и я предполагаю 18.04, просто не готово к производству.

18,04 серверов w/lxd по zfs на необработанных блочных устройствах просто перезагрузки самому случайным образом. Никакая паника или вывод. У меня есть console=ttyS0 (по нуль-модему... и т.д.) ядро, работающее с обычной операцией, но абсолютно никакой взгляд, когда это перезагружает. Нет входит в систему ЛЮБОЙ из файлов журнала.

Трудно воспроизвести, но остановка для производства. Происходит, когда я пытаюсь выполнить некоторые свои R+D scripts+programs+etc на 25 ГБ (теперь работающий старыми 14.04 LXCs в течение многих лет), которые занимают часы для копирования в каждую новую lxd установку, которую я попробовал (попробовал универсальный "lxd init" также, а также "корень zfs", и и "живой сервер" и простой "сервер" устанавливают ISOs). Комбинация контейнера, который безумно под управлением DNS, развязанный для ответа на 100 000 с, роет от другого контейнера, в то время как третье делает тяжелую сеть I/O, кажется, вызывает таинственную перезагрузку - но не надежно. Занимает часы для репродуцирования, но делает 18.04 не готовый к моей продуктивной среде. FBSD vimage тюрьмы на zfs хорошо работал в течение 7 лет и старого lxc на 14.04 non-zfs в течение 4 лет подряд та же установка (и freenas никогда проблема). Угадайте, что Linux zfs версия еще не настолько стабилен для высокой загрузки. Испытанный корень zfs с и w/o удачи [1] и спустились по дыре крысы поиска под приводимым в действие PSU (750 Вт) и перегревом (69C макс. w/lm-датчики) опции и все тупики. Испытанный Явление X6 и процессоры FX AMD на 4 ГГц с RAM ECC на 32 ГБ (да ECC - и BIOS Setup тот путь). Это походит на подлинную ошибку в 18.04 lxd по мультиустройству zfs установка пула (да - я вижу 120second сообщение блокировки для "синхронизации" на консоли, но я понимаю, что это - просто предупреждение). Мои 2 цента: мой пищеварительный тракт говорит, что это - проблема перезаписи мадам между сетевым мостом (вручную создал br0. НИКАКОЙ локальный мост) и zfs фс. Я снял удачи, таким образом, это не cryptsetup. Отказ на данный момент и возвращается к моей собственной работе OS. Возможно, пересмотрите в 6 mos.Очень плохо. lxd по zfs походил на хорошую историю, и я буду любить развертываться. Я действительно изучал много.

[1] https://github.com/zfsonlinux/zfs/wiki/Ubuntu-18.04-Root-on-ZFS

Заключения после нескольких месяцев.

Я не мог мешать этим случайным перезагрузкам произойти для 18.04+consumer материнские платы (w/ECC + AMD), таким образом, я сдался и купил используемую лощину, R610 (~ 175$ inc 48G поршень 2xPSU) и проблема ушел. Но я думал, что совместно использую несколько ratholes для Вас для предотвращения, должен Вы иметь те же проблемы.
1. лощине нравится набег. Таким образом, я должен был заменить управляемый w/жесткого диска один высвеченный для "ненабега zfs" (см. eBay ~ 50$). не бойтесь прерывания некоторых пластмассовых вкладок внутри. 2. НЕ ИСПОЛЬЗУЙТЕ dell/broadcom встроенные зарубки. Они не имеют дело с многоадресной передачей ipv6 в режиме моста (чтение: потерянные соседние запросы) хорошо. 4-дневный rathole. 3. постарайтесь не смешивать с лощиной DRAC или универсальные экраны конфигурации. Просто попытайтесь не изменить что-либо, что вызовет реконфигурирование или вызовет уменьшенную производительность. Потерянный одна лощина этому.

Профессионалы: избыточный PSUs, хорошее охлаждение, разумное энергопотребление (диски 2,5 дюймов ~100W w/6) Недостатки: более медленный CPU: 2x4-базовый Intel на 2.4 ГГц по сравнению с 1x8-базовым AMD на 4.0 ГГц

В целом: Я действительно не получал много путем движения в 18,04. Мои 14.04 установок lxc закончились в течение многих лет не, останавливают w/та же самая комбинация AMD/mobo на 4 ГГц и не имел никаких проблем IPv6. Я могу только надеяться, что изучил что-то полезное в течение месяца +, я потратил обновление до 18,04.

0
задан 22 October 2018 в 11:45

1 ответ

Существует известная ошибка ZFS, которая была просто исправлена и в следующие дни получит обновленные пакеты в Ubuntu, https://bugs.launchpad.net/ubuntu / + источник/Linux / + ошибка/1781364, Но для этой ошибки Вы получили бы определенные сообщения ядра на консоли.

Чрезвычайно редко не получить любые соответствующие сообщения ядра на последовательной консоли от катастрофического отказа ядра. Если это не связанная аппаратная проблема, например, к перегреву.

LXD работает в пространстве пользователя. Необходимо было бы исследовать подсистемы ядра Linux.

0
ответ дан 28 October 2019 в 08:45

Другие вопросы по тегам:

Похожие вопросы: